AI医疗从“知能”到“智能”:大样本和高质量数据不可或缺

2019-08-26 芒果云 手机版
浏览

标准之后,要深入解决AI医疗影像技术的落地难题,还需要更多的去挖掘高质量的基础数据。纵然,中国借助于如此庞大的人口优势,多年来已经获得了海量的医学影像数据,但实际上这些基础数据中真正能够为AI所高效利用的部分并不多,大样本和高质量的数据获取依然是本土AI医疗影像技术的缺憾,这会造成诊断精确度低、投入高回报差甚至信任缺失等严重问题。也正是因为这些精准高质量数据难以获得,吸引了一大波AI创业公司蜂拥而入医疗影像市场淘金。事实上,普通的医疗影像数据可以说遍地都是,但医学上很多疾病数据实际上是很少的。某业内资深人士表示,“一家医疗单位可能仅有一两百病例符合标准,甚至可以说没有一家医院敢说自己拥有几千例这样的符合标准的图像数据。可能一家医院有数万病例,但基于不同的疾病、检查方式、研究目的区分之后,数据一下子就会变得很少。医疗数据不像购物那么简单,医疗数据很多是不确定的,很难打通,这种情况下,具备完整信息的病人资料就尤其宝贵。拿肺癌或其他肿瘤来说,在大医院,满足要求的可能只有10%-20%,这已经算不错的;在二甲等地方医院,很多病人做了检查之后,就去上级医院看病去了,有完整资料的病人可能只有1%-2%。”

AI医疗从“知能”到“智能”:大样本和高质量数据不可或缺


正是因为缺乏有效数据的训练,使得如今的医疗机构利用AI来做医疗影像筛查颇具成本压力。向军表示:“现在,能看的病不多是AI面临的一个很大的问题。比如一个放射科医生能看100种病,可能AI现在在其中7种、8种病上已经比医生看得更出色,但是还有剩下的92、93种病它其实是无能为力的。所以,真正要达到解决问题,彻底降低医生的负担,减少对医生的数量需求,应该说现在还远远没有到这个时候。”

AI医疗从“知能”到“智能”:大样本和高质量数据不可或缺

这也就会出现医疗机构还得专门雇一个专业医生,并摊付额外的成本的现状。此时,究竟AI对于医疗机构到底是负担还是帮衬,值得商榷,向军进一步补充到:“所以现在很多AI医疗影像设备放在医院其实是吃亏的,如何将其变成一个刚需是需要考虑的问题。如果全中国的‘AI+医疗公司’能够形成联盟,大家可以相互分工,各有所长,而不是都做同一件事情,最后形成某种意义上技术共享,达成一个真正意义上的医院不需要再雇佣DR医生的水平,这就变成刚需了。”

AI医疗从“知能”到“智能”:大样本和高质量数据不可或缺


不过,左盼莉认为这种有效数据的缺乏可以通过做大量数据标注的工作来解决。很多医疗图像数据并不是简单的零或者一,而是需要做经验的判断,通过有效标注,很多看似无用的数据几乎也都能够变成有效数据,但是,数据标注还是现阶段一个比较大的问题,她表示:“因为AI做算法的第一要求就是数据标注的得是完全正确的,所以现在各种方式,包括算法如何去解决标错的问题,以及标注本身,业内都有在进行讨论和规划。在标注问题上,我们也开了各种各样的讨论会,医生之间的观点比较一致,但医生在数据标注完之后可能还会有三盲五盲的问题,后期我们也还需要再把相对一致性的东西挑出来,以及继续深入去讨论和解决。”为辅助医疗机构解决数据标注这一大问题,汇医慧影打造了全周期的AI平台,左盼莉表示:“我们的全周期AI平台目前基本上实现了在临床过程中医生可以去使用人工智能技术去做辅助诊断,在诊断过程当中平台可以生成结果化的报告设计,让数据比之前随便写的报告更加规范化,这些数据到数据银行,数据银行会提供一些标注工具,让它的数据更加规范清晰,然后再转回到我们的算法平台。目前,这个算法平台有一部分现在已经开放给医生使用,而且算法平台会根据图像不断产生各种各样算法模型出来,再经过临床验证以后,它可以再次恢复到临床使用场景,所以它是一个数据和临床应用的全周期。”做这样全周期的数据管理,左盼莉表示前期需要花相当大的工夫:“刚开始,我们基本上是在电脑上拿文件夹管理所有数据,但是如何做到标注一审、二审,以及做到精标准的数据库?所以,为了管理数据,我们开发了一整套数据管理平台,为我们自己所用,并开放给医院使用,在上面针对影像开发了一些比较方便的自动化标注工具。然后,整个数据装台我们在信息化上可以说做的比很多初创企业会更多一点,基本上采用分布式的NoSQL网关,进而使得整个系统在安全上和高病发处理上能够真正在医院场景上用起来。”不过,通过自动化标注工具标注之后的数据,是否能够达到比人为标注更高比例的精准度,仍是目前行业攻坚的重要难题。总之,统一的标准与有效的数据,是当前摆在AI医疗影像技术市场化面前的两座大山。要彻底解决标准化问题,编者认为国家有关部门的推动仅仅只能起到带头作用,真正要落实到商业化甚至民用化,仍然需要国内各大主要医疗机构之间,医疗机构和专业AI算法提供商之间进行更深入且透彻的交流与合作,在解决各方的见解和专业性冲突之余,弥合各自的商业化矛盾,进而推进中国AI医疗影像技术向标准化迈出关键一步;当然,标准化之后,行业也将正式走上“数据竞争”之路,这也将十分考验AI公司与专业医疗机构之间的合作密切程度,以及各自在市场化方面的取舍。为此,双方除了需要在各自领域打造技术和资源优势外,更重要的是在商业化目标上达成一致,才能在竞争日趋激烈的AI医疗影像市场渐行渐远。