缺乏身体活动,已成为全球性的公共卫生问题。世界卫生组织的数据显示,缺乏身体活动是全球十大死亡风险因素之一,是多种常见疾病(例如肥胖症、糖尿病和心血管疾病)的主要风险因素。全球四分之一的成年人身体活动不足。近期一些研究还显示,睡眠时间长短与心脏病、代谢疾病和精神障碍也有关系。
英国牛津大学的研究团队集结机器学习、遗传学、统计学和流行病学等多个领域的科学家,开展了一项十分详尽的全基因组关联分析(GWAS),评估了身体活动和睡眠时长的遗传原因,找出14个与身体活动、久坐和睡眠时间有关的基因位点。这项研究结果近日发表在了《自然》子刊《Nature Communications》上。
“即便是像运动、休息和睡眠这些最基本的人类生理功能,要理解背后复杂的遗传基础,只能通过海量数据的分析研究,例如英国生物样本库(UK biobank)这类数据。” 该项目的主要负责人、牛津大学大数据研究所的Aiden Doherty博士介绍。
英国生物样本库的91105名参与者在连续一周的时间里戴上监测身体活动的手环,由研究人员对设备记录的活动数据展开分析。
机器学习在分析大量活动监测数据时展现了强大的实力。“我们精心开发了机器学习模型,来教会机器分析诸如身体活动的复杂功能。” 该研究的主要分析员之一Karl Smith-Byrne博士说。这些模型让机器可以自动识别出哪些数据是活动时间、哪些数据是久坐时间等。
为了帮助机器判断腕带记录数据中的活动类型,研究人员让200名志愿受试者佩戴上特制摄像头,在两天时间里每隔20秒拍照记录他们进行的活动。图像和腕带记录的数据相结合,为阐释数据提供指导。
然后,研究人员把这些参与者的身体活动数据与他们在英国生物样本库中的遗传信息相结合,找到14个与所测身体活动量和睡眠特征相关的基因位点,其中有7个基因位点是首次发现。分析显示,身体活动和睡眠时长受到一些共同的遗传变异影响。整体活动和久坐行为上,女性比男性受到的遗传影响大;但睡眠、行走和中等强度的活动时间等,男女所受遗传影响没有差异。
对人类基因数据的进一步分析还首次证明了增加身体活动有降低血压的好处。过去一些研究虽然提示身体活动和疾病之间有相关性,但是基于问卷调查、行为干预等传统观察方式所限,很难确定其相关性是真正的因果关系还是其他因素造成的偏误。而该项研究采用孟德尔随机化(MR)分析,表明身体活动水平高很可能是高血压机率降低的原因。
这项研究可以帮助我们更好地理解睡眠、身体活动及其对健康造成的影响。“我们怎么动,为什么动,并不是全都和基因有关。但是,理解基因所起的作用,可以帮助我们理解运动量不够的原因和后果。” Aiden Doherty博士说。