【有恆为AI成功之本】人工智慧在医学上的发展步调出了问题吗?


72人参与 |分类: X真生活|时间: 2020-06-13
【有恆为AI成功之本】人工智慧在医学上的发展步调出了问题吗?

7 月 4 日,中国雷锋网发表了一篇文章「致 IBM Watson:六年过去,昔日的人工智能老大哥你还好吗?」其中特别强调 MIT 科技评论提到的「IBM Watson 在医疗人工智慧的进展缓慢,难堪大用。」而最近 Google 台湾也特别找来硅谷总部的彭浩怡医学博士, 对外讲解 它在医学上怎幺应用深度学习,来达成糖尿病视网膜病变辨识与淋巴结中的乳腺癌的转移瘤的视觉辨识。

在 2012 年 IBM Watson 在 Jeopardy 益智游戏战胜两名美国的常胜冠军后,就转往了医疗方面。而 2015 年,更买下了 AlchemyAPI,来强化其深度学习能力,目前它已经在六种肿瘤上做训练,今年还打算再增加八种。但是,MD 安德森癌症中心,今年也决定跟 IBM Watson 分道扬镳。

难道 IBM Watson 真的不行了吗?这其实是因为深度学习需要大量符合需求的有效资料,才能把深度学习的类神经网路各阶层的参数,在模型中学习到正确且完整。而如何得到够多而符合需求的资料,则是在医疗资料获取过程中,相对艰难的部分,尤其很多资料获取并不是那幺容易得到足够的数量。

针对影像识别的人工智慧应用,现在的做法是透过卷积深度学习来训练,如同 Google 彭博士在这次演讲中说到,Tensorflow 只需要 5000 张同一种类照片与 5000 张非此种类照片就可以,就可以做到识别。

【有恆为AI成功之本】人工智慧在医学上的发展步调出了问题吗?

图:彭博士提的深度学习卷积网路的例图 来源:commons.wikimedia.org 作者:Aphex34

彭博士所做的糖尿病视网膜病变的影像,因为直接摄影容易,影像数量够多,也因此得到不错的模型。但是高解析度的淋巴结中的乳腺癌的转移瘤处理过的切片显微镜下的照片,就得多花时间处理。整个过程中,都需要跟专科医生们合作,以人工辨识确认效果好坏,往往来回多次,很耗时间。而且,还往往可能有不同格式需转成同样格式的困扰。也因此,Google 希望透过医疗开放数据标準,以让医界人士达成更容易使用这些数据。不过,这不是短时间可以达成的。

这其实也就能解释为什幺 Watson 的效果不如预期了。资料蒐集的难度,包含资料格式的不一致,资料的清洗与处理以去除假资料,隐私权造成资料蒐集的障壁,让步调缓慢,使整个被训练到够好的癌症诊断的深度学习模型不如预期的多,相对成长速度太慢,这很可能就是 MD 安德森癌症中心不再合作的主因。

深度学习最大的缺点就是需要很大量的正确的资料,才能把监督式学习的模型较完整地完成,以现在的进度发展的确不够快。但假以时日,透过越来越多种类的病症资料蒐集足够且品质良好,就可以让深度学习发挥更大的效能,以帮助人类医生做更正确的诊疗。