对遗传学家来讲,人类大脑仍然是一个谜团。但是大数据战略可以协助其破解此谜团。
众多神经科学家和医生通过对3万人脑图像和DNA进行对比,得出几个基因可能会影响大脑特定区域的大小,这些区域涉及智力、记忆。同时也影响大脑本身的大小。
虽然,这些发现对医学的重要性仍不明确,但是ENIGMA联盟称,一种新型分布式计算方法可以通过大量的MRI扫描图像和DNA测试结果对其进行排序。组织此次研究的神经学家保罗·汤普森说:“Enigma联盟目前的工作是将每个扫描图像的像素相结合,然后与每一个基因组进行比对。这是此工作的方法图。”
保罗·汤普森是南加州大学基因影像学中心负责人,他相信Enigma联盟是研究人类大脑的最大的研究机构。近日,《自然》杂志上刊登了一项最新研究,列出了287位作者,193个机构。此研究对30717人的大脑MRI图像以及由柬埔寨、南非、美国等国的研究人员收集的DNA信息进行分析。
MRI扫描十分昂贵,对扫描图像进行分析时需要大量的计算。尤其是当与DNA信息结合时,这些数据将变得十分庞大,很难在互联网上传递。一些隐私规范也不允许这些数据跨国传递。Enigma联盟表示为了解决这一问题,让所有的研究中心提供他们处理图片的常规算法,之后,再对计算结果进行整合。
在神经科学界,对基因与疾病之间是否存在联系的研究还未得出明确结果。针对某些常见情况,例如抑郁症,完全没有令人信服的线索指出此疾病与DNA有关。然而,研究人员并没有放弃,他们设法扩大了研究的规模。在Enigma联盟研究项目中,研究人员对现有MRI扫描图像进行分析。保罗·汤普森说:“目前,我们可以得到几十年收集的阿尔茨海默氏症、精神分裂症、孤独症患者的大脑扫描图像。如果单独研究这些图像的数据,那将是天文数字”。
大数据分析方法目前十分普遍。去年,美国国立卫生研究院向Enigma联盟和其他几个研究中心拨款3200万美元,并计划在未来7年内向生物数据新方法研究拨款5亿多美元。上个月接受采访时,美国国立卫生研究院(NIH)的“大数据知识”的项目顾问马克·盖耶表示:“目前,研究机构重视数据分析,忽视数据采集,这就是研究面临的瓶颈”。
Enigma联盟对年龄在9-96岁之间的人的大脑进行MRI扫描,花费3000万美元(每个大脑扫描费用约1000美元)。通过将扫描图像与这些人的DNA进行比对,Enigma联盟研究人员表示发现了8个影响大脑整体大小或各分区大小的基因。
汤普森说:“最强的影响出现在壳核区域,这一区域能够影响学习和运动,帕金森患者和亨丁顿患者壳核区域就很小。”研究表明如果一个人出现了其中两个基因的突变,此区域的面积将减少2.8%。
尽管做出了很多努力,并且汤普森也表示找到了相关线索,但是大脑结构大小无法成功与精神疾病相联系。汤普森说:“与精神疾病的关系可能并不像基金决定患者较小壳核区域并且患病一样简单,但是基因很可能影响大脑有多少脑细胞以及脑细胞是否处于正确位置。了解细胞如何组建至关重要”。
Enigma项目体现了大数据基于数学的生物学这一缺点,因为此项目仅重视能够输入计算机的数据。杜克大学脑科学学院和公共政策学院的副教授埃文·查尼表示对此研究十分失望,因为忽视了生活和环境的影响(例如运动和压力),这些因素也会影响大脑解剖结构。他说:“在笔者的分析中,此研究起不到任何作用”。
汤普森表示他坚信只要收集更多数据,采用新兴数学技术,最终可以在脑科学界取得实质性突破,如同在其他领域取得的突破,例如:语音处理或二战时期纳粹密码的破译。之后就将此联盟命名为“ENIGMA”联盟。直到最近,汤普森说:“基因变异可能与医学图像有所关联这一说法并不被众人所接受。人们说永远无法找到人类基因对大脑扫描图像的影响”。(MIT科技评论)