来源:CHIMGEN团队

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

中国影像遗传学(Chinese Imaging Genetics, CHIMGEN)团队包含全国21个城市的30个研究中心。经过近4年的实验设计、招募被试、数据采集及质控阶段,建立了全球最大样本的中国汉族人群影像遗传学队列。相关成果于2019年12月发表在国际一流杂志《Molecular Psychiatry》(2018年影响因子11.973,5年影响因子12.18),题目为“CHIMGEN: A Chinese Imaging Genetics Cohort to Enhance Cross-Ethnic and Cross-Geographic Brain Research”。

中国影像遗传学研究旨在研究与神经影像和行为表型相关的遗传和环境因素及其相互作用。这项研究收集了7000余名年龄在18-30岁之间的中国汉族健康人群的基因、神经影像、环境和行为学数据。作为非高加索人群大样本神经影像遗传学队列的先驱,该队列可以与高加索人群进行比较研究,从而提供有关遗传-神经影像关联种族差异的新见解。除微环境变量外,该研究还根据每个受试者从出生到现在的位置,利用卫星遥感和国家统计局数据库收集了数百种定量宏观环境变量,这将有助于发现与神经影像表型有关的新环境因素。通过使用整个生命周期的环境变量,本研究还可以提供有关影响人脑的宏观环境暴露因素及其时间节点和作用机理的见解。

1. CHIMGEN研究

CHIMGEN研究(chimgen.tmu.edu.cn)已通过伦理委员会的批准,并获得了每个受试者的知情同意书。这项研究的目标是收集来自21个中国大陆城市的30个研究中心的10000名18-30岁健康汉族受试者的基因,神经影像,环境和行为学数据。迄今为止,我们已经招募了7000余名受试者,建立了全球最大样本的中国汉族人群影像遗传学队列。由于CHIMGEN研究正在进行中,因此以下CHIMGEN队列的描述是基于经过全面质量评估的5819名受试者的数据。

2. 招募中心分布

这5819名受试者的分布如图1A所示。29个中心中有18个中心招募了超过100名受试者。招募人数最多的中心有1307名受试者,最少的中心招募了54名受试者。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图1. 招募中心分布和神经影像、行为和环境数据特征


3. MR扫描仪的质量控制

对于每个MR(magnetic resonance, MR)扫描仪,我们使用两个水模来评估扫描仪的成像质量。具体而言,美国放射学会认证的MRI(magnetic resonance imaging, MRI)水模被用来评估MR扫描仪的功能,包括几何形变,层面定位和层厚准确度,高对比度空间分辨率,信号强度均匀性,鬼影伪影和低对比度物体可检测性。我们使用定制的水模评估功能磁共振成像(functional magnetic resonance imaging, fMRI)采集期间的时间稳定性。此外,在所有中心对两名健康志愿者进行了扫描,以评估不同MR扫描仪采集的MRI数据的一致性。图2显示了扫描仪对常用MRI测量值(灰质体积(GMV, grey matter volume),局部一致性(ReHo, regional homogeneity)和各向异性分数(FA, fractional anisotropy)的影响。这些测量结果表明,相同型号、相同扫描参数的MR扫描仪采集的MRI数据具有高度一致性;但是,不同型号的MR扫描仪采集的MRI数据存在明显差异。对于后者,对来自不同型号扫描仪的MRI数据得出的影像数据进行Meta分析可能是减少MR扫描仪型号引起的偏差的实用方法。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图2. 不同MR扫描仪采集的两名健康志愿者的常见MRI指标的体素水平空间相关矩阵


4. 神经影像数据的第一阶段质量评估

对神经影像数据的第一阶段质量评估包括了所有5819名受试者:23名受试者因金属伪影而被排除,1名因脑萎缩而被排除,1名因脑室扩张而被排除,其余5794名受试者被包括在以下质量控制和统计中。

5. 基因分型和质量控制

我们使用专为亚洲人群设计的高通量基因分型芯片(Illumina ASA)进行全基因组基因分型,其具有700000个单核苷酸多态性位点。尽管所有5794名受试者都有血液样本,但到目前为止,只有4885名受试者已进行了基因分型。在排除2个性别不匹配,9个重复被试或具有亲属关系,29个具有过高杂合率和1个具有种族离群的样本之后(图3),有4844名受试者(99.16%)通过了遗传数据的质量控制。值得注意的是,以下质量评估(n = 5753)也包括909名没有基因分型结果的受试者。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图3. 人群分层的主成分分析


6. 神经影像数据和质量控制

神经影像数据是通过9种型号的3.0 T磁共振扫描仪获得的(图4)。在所有中心均采集了结构磁共振(structural MRI, sMRI),扩散张量成像(diffusion tensor imaging, DTI)和静息状态功能性磁共振数据(resting-state functional MRI, rs-fMRI),并在16个中心获得扩散峰度成像(diffusion kurtosis imaging, DKI)和动脉自旋标记(arterial spin labeling, ASL)数据。图1A的子图显示了通过每种型号的MRI扫描仪获取MRI数据的受试者的数量。其中,通过MR 750扫描仪获取了5753名受试者中的4045名(70.31%)的MRI数据。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图4. 每种扫描仪型号的扫描仪和参与者数量


我们通过计算得到了每个机型采集得到的影像指标,例如:基于sMRI数据的GMV体素水平平均图,基于rs-fMRI数据的ReHo体素水平平均图以及基于DTI数据的FA和平均扩散率(mean diffusivity, MD)体素水平平均图(图5)。所有型号的扫描仪在GMV,FA和MD指标显示出相似且对称的空间分布,8/9的扫描仪在ReHo指标显示出相似且对称的空间分布,但GE Signa HDx扫描仪在ReHo却显示出不对称的空间分布,尤其是在后部脑区(图5C)。因此,本研究不包括由GE Signa HDx获得的97名受试者的rs-fMRI数据。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图5. 每种MR机型的影像指标图


图6显示了神经影像数据(n = 5753)的质量控制结果。在5753名受试者中,有5743名(99.83%)受试者具有合格的sMRI数据,5507名(95.72%)受试者具有合格的rs-fMRI数据,5750名(99.95%)具有合格的DTI数据。在具有DKI数据的3619名受试者中,有3610名(99.75%)受试者通过了质量控制。在具有ASL数据的4108名受试者中,所有受试者都通过了质量控制。基于这些MRI数据,可以计算得到数以千计的神经影像变量。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图6. MRI数据的质控流程图


7. 行为和基于问卷的环境数据的质量控制

图7显示了5753名受试者的行为和基于问卷的环境数据的初步质量控制结果。在5753名受试者中,有8名受试者因为几乎所有行为和基于问卷的环境数据的丢失而被排除在外。在其余的5745名受试者中,具有合格贝克抑郁量表第二版(Beck depression inventory-II,BDI-II)数据的有5723人(99.48%),具有合格状态和特质焦虑量表(state and trait anxiety inventory, STAI)数据的有5722人(99.46%),具有合格三维人格问卷(tridimensional personality questionnaire, TPQ)数据的有5728人(99.57%),具有合格加利福尼亚词语学习测验第二版(California verbal learning test-II ,CVLT-II)的5688人(98.87%),具有合格符号数字模式测验(symbol digit modalities test, SDMT)的5619人(97.67%),具有合格RO复杂图形测试(Rey-Osterrieth complex figure test, ROCFT)数据的有5640人(98.04%),具有合格N-back任务数据的有5578人(96.96%),具有合格Go / No-Go任务数据的有5536人(96.23%),具有合格传球游戏数据的有5616人(97.62%),具有合格最后通牒任务(ultimatum game, UG)数据有5639人(98.02%),具有合格城市化分数数据的有5733人(99.65%),具有合格儿童创伤问卷(childhood trauma questionnaire, CTQ)数据的有5728人(99.57%)。一些代表性的行为变量的数据分布如图1C所示,部分基于问卷的环境变量的数据分布如图1D所示。尽管某些变量不服从正态分布,但相对较大的数值范围表明受试者之间具有良好的区分度。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图7. 行为学测评的质控流程图


8. 来自遥感和国家统计数据库的环境变量

在这项研究中,我们记录了每个受试者从出生到现在每年的确切居住位置。在5745名通过了神经影像,行为和遗传数据初始质量控制的受试者中,有5723名受试者(99.62%)提供了当前和出生地(图8A);但是,只有3979名受试者(69.26%)提供了终生迁移信息(图8B)。基于遥感和国家统计数据库,我们可以得到每个受试者数百个宏观环境测量结果。一些具有代表性的出生时宏观环境变量(图8C)及其时间变化如图8D所示。

重磅:全球最大样本中国汉族人群影像遗传学队列研究发表

图8. 来自遥感和国家统计数据的环境变量


9. CHIMGEN研究的未来计划

未来CHIMGEN团队将完成以下任务:

a)进一步招募至少3000名受试者,以达到10,000名合格受试者的目标;b)同时获得大约700名受试者的基因组,表观基因组和转录组数据;

c)收集2000-3000名严重精神障碍患者;

d)通过后续随访受试者,将CHIMGEN队列发展为纵向队列。

CHIMGEN团队希望在遵守中华人民共和国政府的法律法规的前提下与其他科学界共享所有CHIMGEN数据(包括遗传,环境,神经影像和行为数据)。CHIMGEN研究的所有原始数据都可以通过与CHIMGEN团队合作获得,也可通过正式的申请程序免费获得CHIMGEN数据的汇总统计信息。

该研究得到了国家杰出青年科学基金、国家重点研发计划等项目资助。

感谢每一名中国影像遗传学事业的参与者!

【文章】Xu, Q., Guo, L., Cheng, J. et al. CHIMGEN: a Chinese imaging genetics cohort to enhance cross-ethnic and cross-geographic brain research. Mol Psychiatry (2019) doi:10.1038/s41380-019-0627-6

论文链接:

https://www.nature.com/articles/s41380-019-0627-6#article-info

【附录】

作者名单:许强,郭力宁,程敬亮,王梅云,耿左军,朱文珍,张冰,廖伟华,邱士军,张辉,徐晓俊,余永强,高波,韩彤,姚振威,崔光彬,刘风,秦文,张泉,李俊,梁猛,陈峰,鲜军舫,李建策,张静,左西年,王大伟,沈文,苗延巍,袁飞,吕粟,张效初,徐凯,张龙江,叶兆祥,于春水

相关文章