近日,由阿里云与上海瑞金医院、阿里健康联合举办的新一轮天池大赛——“瑞金医院MMC人工智能辅助构建知识图谱大赛”决赛结果颁布,来自哈尔滨工业大学、北京大学、江南大学年轻的学者团队在近2000名开发者中脱颖而出,分列前三名。
在人工智能此类前沿技术领域,拥有25万开发者的天池平台集众人之智慧产出了怎样的结果?以技术为实力比拼的比赛成果又如何与企业、医院结合应用到实际?在本次发布的大赛成果转化产品——国内首个“基于机器智能的糖尿病领域知识图谱”中,我们找到了答案。
内分泌医生缺口大,机器可替代重复性工作
“我的爸爸就是一名糖尿病患者,最初参赛是因为他,我希望能够利用我所掌握的技术,帮助到更多像他一样的糖尿病患者。技术的存在本身不该只为炫技,应该为全人类做贡献。”在谈到参赛初衷时,一位参赛的开发者表示。
根据IDF发布的第八版全球糖尿病概览中显示,2017年中国1.144亿糖尿病患者人数位居全球第一,即便按照1个医生管理1000人的需求推算,也需要10万医生。而如今,我国内分泌医生远远达不到10万,导致很多糖尿病患者不能享受到较好的慢病管理服务,而不同层级的医疗机构,对糖尿病慢病诊治水平参差不齐,也影响了糖尿病患者的治疗体验。
为了能够以最高的效率达到更好的糖尿病管理效果,中国工程院院士、上海交通大学医学院附属瑞金医院副院长、国家代谢性疾病临床医学研究中心主任宁光发起的国家标准化代谢性疾病管理中心(MMC)采用一体化的诊疗流程,将糖尿病管控做到标准化。
MMC采用1+x模式,即一家MMC的中心医院与它周围的多个社区医院相联系,形成“从国家级MMC中心到MMC中心医院再到多个社区卫生中心”的病人双向转诊就医模式。因此,医生数量尤其是基层医生数量不足、专业水平参差不齐等问题,就成为影响糖尿病患者的治疗康复一大掣肘。
宁光院士表示:“基层医生尤其是全科医生,需要处理很多种疾病,往往无法达到“术业有专攻”。如何让基层医生也能够像专科医生那样处理这些疾病的状况,这是MMC需要解决的非常重要的问题。”
此外,医生大量的从事重复性的工作,长期的疲劳容易造成漏诊、误诊,“如何让已经形成重复性劳动的事情,更多地让机器完成,而让医生更多考虑疾病中不规律的情况,是疾病治疗很重要的部分。”
首个糖尿病知识图谱出炉,助力瑞宁助糖优化用药方案
2018年9月,阿里云天池大赛就发起了用人工智能辅助构建糖尿病知识图谱的挑战。在过去半年时间里,吸引了中国、美国、日本、丹麦、新加坡等8个国家和地区共1629支队伍、1817名开发者参与。
其中,吸引的团队除了北京大学、浙江大学、哈尔滨工业大学、新加坡国立大学等国内外知名高校,还不乏国内众多企业的身影,在产业内也受到极大的关注。
大赛主办方瑞金提供与糖尿病相关的学术论文以及糖尿病临床指南。第一赛季课题为“基于糖尿病临床指南和研究论文的标注构建”,要求选手在学术论文和临床指南的基础上,做实体标注;第二赛季课题为“基于糖尿病基于糖尿病临床指南和研究论文的实体间关系构建”。选手将从中抽取实体之间的关系。通过初赛、复赛与决赛答辩,综合线上提交结果评分和线下答辩角逐冠军。
赛题组通过标注工作,形成国内糖尿病领域首个文本标注数据集合,标注中文实体近19万,最终,开发者基于糖尿病相关教科书、研究论文,通过高效的算法,进行文献挖掘并构建知识图谱,与瑞宁助糖深度融合,加速产品迭代。
时间拉回到2016年,宁光团队与阿里合作,首次发布“瑞宁助糖”,这是一款糖尿病医生AI助手,它由经验模型和知识模型的两部分机器学习构成的软件系统。其通过人工智能深度学习的方式,以1000多份真实的糖尿病病例,加上300位的糖尿病医生的经验形成经验模型,同时,融合各种糖尿病指南和国内外文献检索数据库形成知识库,以及综合糖尿病可能导致的血脂异常、高血压、肥胖等100多种并发症的发病原理和标准化临床数据,进而对为医生给出诊断建议。
在经历过数次的迭代之后,此次应用天池大赛知识图谱构建成果的“瑞宁助糖”,三年后又迎来了一次重要的转型升级。
阿里云算法专家顾斐在展示成果时表示,知识图谱的作用在于以下三点:一是其能够电子病历、科研论文这类非结构化数据做成结构化,“这是作为下一步人工智能研究非常必要的步骤”;二是知识图谱能整合各类文献资料,将实体关系抽离出来;三是构建知识图谱的过程为后续人工智能辅助诊断和智能用药推荐提供了坚实的基础。