Nat Genet:超20万全血外显子组数据分析,揭示17个克隆性造血的新驱动基因
时间:2024-06-08 06:02:25 热度:37.1℃ 作者:网络
随着年龄的增长,人体细胞会不断累积体细胞突变,这些突变会导致不同组织中克隆的扩增特别是在血液中,形成克隆性造血(CH)。已有研究表明,由于特定突变而增强适应性的克隆能够诱发癌症并推动其发展,但扩增的克隆也可以通过直接或间接机制影响其他疾病,如慢性肝病和血液相关疾病等。
CH与血液系统恶性肿瘤、心血管疾病和全因死亡率相关;其无明显的临床症状,但随着年龄的增长,这种疾病变得无处不在。初步估计,当对一组已知基因进行突变筛查时,超10% 70岁以上人群中存在CH。目前,大多数CH的背后驱动因素仍未知,因此亟需全面绘制CH的驱动基因图谱,以更好地理解克隆选择和血液衰老表型。
近日,英国Wellcome Sanger研究所、剑桥大学干细胞研究所等机构的科研人员在Nature Genetics上发表了题为“Analysis of somatic mutations in whole blood from 200,618 individuals identifies pervasive positive selection and novel drivers of clonal hematopoiesis”的文章。研究团队从英国生物样本库(UKB)200,618名个体的全血外显子组中推断出基因水平的正向选择,鉴定了在群体水平上受到正向选择的17个新基因,并在单细胞衍生造血细胞群中验证了这一选择模式。
研究结果显示,这些基因的突变克隆在频率和大小上均随着年龄的增长而增长,与经典的CH驱动因素相似。此外,上述17个基因还与感染、死亡和血液恶性肿瘤的风险增加相关,凸显了其在衰老过程中的重要性。综上,这些新基因驱动因素的确定可帮助人们更好地了解CH的发生及其影响,为衰老相关疾病和表型的发生机制提供了新线索。
文章发表在Nature Genetics
主要研究内容
全基因组序列揭示的体细胞突变模式
研究团队使用Mutect2分析了200,618名UKB个体(40岁-73岁)的全血外显子组测序数据,以确定血液中的体细胞突变,并对其进行严格过滤去除测序伪影和胚系变异(图1)。结果显示,共识别了52,701个可能的编码体细胞突变;体细胞突变个体的比例、变异等位基因频率(VAF)和个体体细胞突变数量随着年龄的增长而增加。进一步,研究团队利用dNdScv方法计算了所有突变以及每个基因的非同义体细胞突变与同义体细胞突变比率(dN/dS),区分了纯化选择、中性选择和正向选择下的基因和特定突变。
在所有类型的非同义编码突变中,dN/dS比率为1.13,这表明在该研究数据集检测到的每8个(CI 7-10)非同义突变中就有一个处于选择状态。此外,年轻和年长个体中发现了正值dN/dS,这表明体细胞突变的选择率在这一年龄范围内无显著差异。上述结果也验证了最近的发现,即来自少数健康个体的超3,000个单细胞衍生全基因组的体细胞突变普遍存在正向选择。
图1:UKB中全血外显子组中的普遍选择。
新的正向选择基因
先前研究表明,目前常用于鉴定CH的基因共有74个,其中14个在UKB中处于正向选择状态,称之为“经典适应性推断驱动基因”。但研究团队发现额外有几个dN/dS比值较大的基因,不在74个CH基因的经典集合中。为此,研究团队使用Shearwater35独立调用了额外和经典CH基因中的体细胞突变,并使用dN/dS重新测试选择。
结果显示,共识别出17个新的正向选择基因,即BAX、CCL22、CCDC115、CHEK2、IGLL5、SH2B3、SIK3、SPRED2、SRCAP、SRFS1、MAGEC3、MTA2、MYD88、YLPM1、ZBTB33、ZNF234 和 ZNF318,包括新基因、CH候补选驱动基因以及先前报道的一些与恶性肿瘤相关的基因。研究团队将上述17个基因称为CH的“新适应性推断驱动基因”,以区别于经典的CH基因。基于上述新适应性推断CH基因的突变,可使UKB队列中CH(仅限于大克隆,VAF>0.1)的患病率增加18%。
就单个基因而言,新适应性推断驱动基因是UKB个体中最常见的、与CH状态相关的基因,许多基因显示出不同的突变景观。其中,BAX、CHEK2、SH2B3和MYD88基因突变最近也被确定为其他肿瘤患者血液中CH的候选标记物,CHEK2基因突变与化疗暴露有关,慢性淋巴细胞白血病(CLL)患者接受BCL2抑制剂治疗后出现BAX 基因突变。
图2:新的CH基因特异性突变景观和适应性效应。
新的驱动基因与临床表型的关联
利用UKB提供的持续更新的电子健康记录,研究团队评估了与新适应性推断CH基因相关的克隆扩增对后续健康事件的影响,通过cox比例风险回归分析CH(包括新型和经典,VAF>0.1)驱动基因与血液系统恶性肿瘤关系(图3)。结果显示,新适应性推断驱动基因对血液系统恶性肿瘤具有显著危害,并与已知的CH驱动基因相似。具体而言,具有MYD88和IGLL5基因突变的个体更容易患慢性淋巴细胞白血病和急性淋巴细胞白血病。
此外,外周血计数的变化也反映了许多新适应性推断CH基因突变的存在,其中ZBTB33突变与骨髓细胞计数增加相关,MYD88/IGLL5突变与淋巴细胞计数异常相关,表明这些基因突变对血液系统的功能有显著影响。
上述结果显示,与经典适应性推断驱动基因相似,新适应性推断驱动基因突变个体的感染风险增加、死亡风险也显著增加,其突变频率和克隆大小随着年龄的增长而增加。特别地,不良健康后果的发生率取决于克隆大小。
图3:新CH驱动基因与临床结果的关联。
结语
综上所述,人类衰老的标志是在分裂的组织中出现克隆性扩增,特别是CH,其与癌症风险和衰老相关表型有关;但目前大多数克隆缺乏已知的驱动因子。研究团队使用UKBB中20万人的全血外显子组数据,以绘制衰老血液系统中的正向选择模式,并发了17个处于正选择状态的CH驱动基因,其与感染、死亡和恶性血液病风险增加相关,并在衰老过程中发挥重要作用。新基因的发现扩展了人们对CH的理解,有助于探索延缓或逆转血液中异常突变细胞过度生长的策略,还为未来的治疗提供了新方向。
文章共同第一作者Michael Spencer Chapman博士表示:“虽然现有的基因测试对早期疾病检测很有价值,但我们的研究结果表明,还有机会进一步改进这些检测。通过纳入与CH相关的17个新基因,我们可以改进基因检测方法,以更好地识别相关血癌和心血管疾病的风险。”
参考文献:
1.Bernstein, N., Spencer Chapman, M., Nyamondo, K. et al. Analysis of somatic mutations in whole blood from 200,618 individuals identifies pervasive positive selection and novel drivers of clonal hematopoiesis. Nat Genet (2024). https://doi.org/10.1038/s41588-024-01755-1
https://www.nature.com/articles/s41588-024-01755-1
2.Seventeen More Genes Identified That Drive Age-Related Mutations in Blood Cells
https://www.insideprecisionmedicine.com/news-and-features/seventeen-more-genes-identified-that-drive-age-related-mutations-in-blood-cells