导读:
随着NGS技术在肺癌诊疗临床实践中的广泛应用,越来越多的不常见ALK,ROS和RET融合类型被基于DNA模板的NGS检测报告出来,随之而来也产生了一个问题,即这些罕见的融合是否具有临床意义,是否能够指导有效的靶向治疗,造成这些融合的潜在机制又是什么。针对这一问题,恒特基因助力中医院病理科的专家进行了深入探索,连续在JournalofThoracicOncology上发表两篇文章[,](图),从分子层面上对这一现象的机理进行了阐述,并提出了相应的检测策略。近期,国际著名的NGS技术专家,恒特基因首席科学顾问郑宗立教医院的宋正波教授在JournalofThoracicOncology上发表评述性文章[3],论述了当前肺癌诊疗中基因融合检测存在的不足,并提出了建设性的改进方案。图.发表在JTO上阐述NSCLC中非典型融合分子层面特征的研究。评述内容:
非小细胞肺癌(NSCLC)中发生融合的酪氨酸激酶癌基因主要有:ALK,ROS,RET和NTRK//3等,携带这些融合变异的患者可从靶向治疗中获益。进行针对性的靶向治疗的关键在于能够准确地鉴别诊断出相关融合基因。鉴别诊断融合基因的传统方法包括了荧光原位杂交(FISH)和免疫组化(IHC)。此外,美国FDA已批准了基于二代测序技术(NGS)开发的分析检测产品,如:FoundationOneCDx和MSKSolidFusion,用于检测组织标本来鉴别诊断基因融合。近期,FDA还批准了基于NGS的液体活检产品,如:GuardantCDx和FoundationOneLiquidCDx,可通过从血液标本中提取到的cfDNA来检测融合变异。与此同时,用于融合检测的新的NGS分析方法也即将出现,如:ArcherDx的检测产品,使用可从血液和组织中同时富集DNA和RNA的单端锚定多重PCR技术(AMP)开发的ArcherDx检测产品已获得了FDA的“突破性医疗器械”资质认定。以DNA为模板检测基因融合变异的NGS方法已被广发应用,越来越多的不常见的ALK,ROS和RET的融合类型被基于DNA模板的NGS检测报告出来,随之而来也产生了一个问题,即这些非常见的融合是否有临床意义,造成这些融合的潜在机制又是什么,并要求在开始靶向治疗前使用可靠的分子检测方法进行进一步验证。针对这一问题,中医院病理科的专家综合运用靶向DNA-NGS、靶向RNA-NGS、全转录组测序(WTS)和免疫组化(IHC)多种方法对例非小细胞肺癌样本的ALK、ROS和RET进行了全面的分析,来探讨在基因组DNA水平上检测到的罕见基因融合的临床意义。该研究分为两个队列,队列A中包含了7例样本,其中有40例经ARMS-PCR和基于杂交捕获技术的DNA-NGS检测为泛阴性结的样本,后续经靶向RNA-NGS检测,鉴定出了0%(4例)的样本携带了可靶向治疗的融合变异。纪念斯隆凯特琳癌症研究中心(MSKCC)之前发表的一项真实世界大队列研究也表明DNA-NGS检测会造成融合变异事件的漏检,经MSK-IMPACT基因的DNA大Panel检测为驱动基因变异阴性的3例患者,经基于AMP技术开发的RNA-NGS检测Panel(MSKSolidFusion)又额外检测到了36例常见可治疗的融合/重排变异,这部分泛阴性的患者中基于DNA检测的漏检率达4.%。有趣的是,上述两项研究都发现ROS是DNA-NGS检测中最常漏检的融合基因,约占所有DNA-NGS阴性和RNA-NGS阳性病例的7%(NCC:4/4;MSKCC:0/33)。DNA-NGS检测造成相关的ROS融合检测高假阴性结果的主要原因如下:()ROS的融合断点发生在非常宽泛的区域内,特别是ROS基因的内含子3-35区域(ROS内含子3到35区域长达个碱基序列;ALK内含子9区域为个碱基序列)。()要捕获的区域的GC碱基含量较高(ROS基因的内含子3-35区域的GC含量高达37.9%;ALK内含子9区域的GC含量高达5.7%),导致探针杂交效率不佳,从而导致覆盖该区域的数据量较低,捕获探针的设计失效率较高。(3)融合断点区域序列的多样性水平较低(与高AT重复序列次数有关),无法与参考基因组上的确定序列进行比对匹配,导致无法报告融合断点位置。ROS融合检测的挑战可能导致NSCLC中ROS基因融合无法被报告,造成漏检,进而导致观察到ROS的基因融合伙伴种类少于ALK和RET。随着NGS在临床上的快速推广应用,包括ALK、ROS和RET在内的越来越多的罕见的基因融合被检测报告出来。如何判断这些罕见融合,特别是在DNA水平上被检测到的罕见融合变异是否具有临床意义,变为一个十分紧迫的问题,虽然在同一肿瘤中鲜有伴随共同/复发的驱动基因融合。中医院病理科的专家报告了6例罕见的ALK融合病例(两例报告为相互型融合,即同时含有5’-ALK和3’-ALK融合结构,且融合伙伴不常见),并成功地进行了基于RNA-NGS检测。其中5例(3%)的RNA-NGS和免疫组化(IHC)分析结果均阴性;7例(44%)的病例经RNA-NGS分析确定为经典型的EML4-ALK融合;其余4例在DNA和RNA-NGS检测中表现出的融合伙伴相一致(KIF5B/KLC/TPM3)。检测到的RET罕见融合中,所有6例可获得RNA-NGS结果的病例均表现为经典型的RET融合伙伴(KIF5B/CCDC6),而DNA-NGS均表征为不同的融合伙伴。对于DNA-NGS检测到的4例罕见ROS融合,有例经RNA-NGS分析呈阴性,IHC也证实了RNA-NGS的结果。研究者进一步使用全转录组测序(WTS)对DNA层面上检测具有5’ALK相互型融合的样本进行分析,分析结果与RNA-NGS的结果完全一致,即转录组上均为经典型的EML4-ALK融合(3’ALK融合),并没有5’ALK相互型融合转录子存在。在生物学上,ALK和RET基因并不会在正常的肺部组织中表达(Transcriptpermillion:ALK为0.08,RET为0.47),而ROS则可正常表达的(Transcriptpermillion为.09)。当ALK基因与5’端的启动子区域激活的序列发生融合后(如5’EML4),ALK激酶区域才能够表达,免疫组化(IHC)作为可有效检测ALK融合蛋白的方法已被FDA批准用于临床。鉴于ROS在正常肺组织中的高表达,无法使用高性能的IHC来检测ROS融合。全转录组测序(WTS)虽然是功能强大的探索性工具,但其特异性较低,需要进行功能性验证(有研究显示:在已鉴定的个融合变异中,有37%无法在基因组数据中得到验证),且需要高性能的生物信息学解决方案,从而限制了WTS在临床上的应用。此外,WTS检测还需要高质量的标本,但在临床实践中普遍无法获得,例如,上述研究报告显示,靶向RNA-NGS的分析成功率为94%(85/90),而WTS的分析成功率仅有37%(7/9)。图.NSCLC中ALK融合伙伴的染色体分布。饼图代表了评述中的两项研究报告的3’ALK激酶区域融合的不同基因融合伙伴在不同染色体上的分布比例(上)。以及同时具有基型和相互性融合的肿瘤中5’端含有ALK部分序列的相互型融合的伙伴类型和分布(下)。右边的染色体示意图表示上述两项研究中的号染色体上融合伙伴的位置。非常有趣的是,上述研究报的结果中DNA-NGS检测到的罕见ALK融合(非EML4伙伴),经RNA-NGS验证发现有44%实际表达为经典的EML4-ALK转录子。研究者认为,与RNA-NGS检测相比DNA-NGS检测到的融合伙伴差异可能是由染色体碎裂(Chromothripsis)及复杂基因重排经RNA剪接后所导致的。人们已经注意到DNA-NGS检测到的罕见ALK和RET融合的拼接伙伴在染色体上的位置与ALK和RET所在位置很接近,而ROS融合伙伴则不遵循这样的模式。融合体优先聚集在染色体内而不是在染色体间(图上,图3上)。肿瘤中同时检测到基型融合(驱动融合体的3’为激酶区域)和相互型融合(融合体的5’保留了ALK/ROS/RET的部分序列),其中相互型融合可能是“乘客融合”,但仍主要存在于染色体内(图下,3下),这反映了相互型融合可能是通过非同源末端连接(NHEJ)方式将在很近距离内断裂的双链直接拼接产生的(图4)。图3.NSCLC中RET融合伙伴的染色体分布。饼图代表了评述中的两项研究报告的3’RET激酶区域融合的不同基因融合伙伴在不同染色体上的分布比例(上)。以及同时具有基型和相互性融合的肿瘤中5’端含有ALK部分序列的相互型融合的伙伴类型和分布(下)。右边的染色体示意图表示上述两项研究中的0号染色体上融合伙伴的位置。图4.染色体碎裂(Chromothripsis)后,通过非同源末端连接(NHEJ)方式将断裂的双链直接拼接,从而在染色体内的基因组层面上产生非常复杂的重排/融合序列。染色体碎裂后的随机重组引发的多重基因区域的缺失和重排,进而在DAN层面上产生非常复杂的重排事件[4]。中医院病理科的专家提供的重要数据显示,DNA-NGS检测到的罕见ALK融合(非EML4伙伴),经RNA-NGS和IHC的验证,有3%(5/6)为融合阴性。这些验证为阴性的患者经克唑替尼治疗后的中位无进展生存期(mPFS)显著短于经RNA-NGS或IHC证实为ALK融合阳性的患者(.0mvs.0m;p=0.00)。同一研究小组先前也报道了DNA测序与RNA测序鉴定的基因间断点融合的差异。早期的另一项研究也报道了,在接受一线克唑替尼治疗的ALK融合阳性NSCLC患者中,与单纯的3’ALK基型融合患者相比,携带非相互/相互型ALK融合的患者的无进展生存率更差,且具有更高比例的基线脑转移。正如上述研究作者阐述的那样,缺乏RNA确认的DNA-NGS融合检测结果存在一定局限性。中医院病理科的专家提供的数据和先前发表的研究一致呼吁在非小细胞肺癌的基因融合检测中,除了基于DNA的分析外,还应采用正交分子诊断方法进行确证(基于RNA和蛋白质层面上的检测)。产生基因融合变异的因素复杂多样且比较普遍:MD安德森癌症中心于09年发表的“上皮性肿瘤中的癌基因融合易位的分子机制与病理生物学”的综述中[5],汇总了导致融合重排和易位发生的主要原因,即由于染色体层的重排或转录过程中的错误剪接所造成的。在DNA层面上的重排主要包括了6种形式:染色体内的易位和染色体间的易位、大片段的插入、大片段缺失、串联重复、倒置、或是染色体碎裂导致的复杂重排(图5)。图5.DNA层面上导致基因发生重排/融合的6大主要因素。在RNA层面上,转录过程中的“通读事件”也可能产生融合蛋白,当RNA聚合酶不能正确终止一个基因末端的转录,并且由于异常剪接而继续转录到下一个基因末端时,产生了嵌合转录子称之为“通读事件”,并不涉及基因组物质的重排(DNA重排)即可产生融合转录子(图6)。图6.转录过程中产生的“通读”事件产生的重排/融合并不涉及到基因基因组层面,无法通过DNA的分析体现。除此之外,RNA的可变剪接和RNA跳切(RNASkipping,mRNA前体由于不能正确剪接,导致其中的某个或某些外显子被错误地删除或替换)也可产生的融合重排(图7)。图7.mRNA的成熟加工过程中的可变剪接主要产生基因内部的重排/融合,如:NSCLC中的MET4号外显子跳读。在众多导致基因重排/融合发生的因素中,染色体碎裂(Chromothripsis)和染色体编织(Chromoplexy)为在DNA层面上产生复杂重排的最主要原因。使得在DNA层面上常常检测到:基因---基因间区域融合、基因间区域---基因间区域融,或者在同一份样本中检测到:相互型融合与非相互型融合同时共存、目标基因与多个伙伴在多个拼接点发生融合等非常复杂的融合/重排事件(图8,9)[6]。图8.染色体碎裂(Chromothripsis):DNA双链断裂,进而导致染色体裂成许多片段,然后在DNA自我修复机制下,这些碎裂片段被随机重新连接在一起,导致一条甚至多条染色体重排,形成嵌合型染色体。染色体碎裂可导致基因组的大规模重排,可加速基因组DNA重排而不是随着时间的推移逐渐获得重排和突变。染色体编织(Chromoplexy):不同染色体上的双链DNA断裂,导致无序的链重排,即涉及多条染色体之间的链易位,并在断点处常常发生片段缺失。图9.染色体碎裂和染色体编织在基因组上产生的复杂融合变异事件的示意图。相关研究还表明,肿瘤中的融合变异有相当的比例是有染色体碎裂和染色体编织造成的。00年月发表在Nature上的“泛癌症全基因组分析合作项目”(Pan-CancerAnalysisofWholeGenomesConsortium,PCAWG)研究显示[7],平均每个癌症基因组均携带约4或5个驱动突变,从而给这些癌细胞带来生存上的选择性优势,在该研究的肿瘤中,仅5%没有发现驱动突变。该研究还发现许多癌症表现出基因组灾难---复杂的染色体重排:7.8%的肿瘤存在有Chromoplexy(染色体编织)事件和Reciprocaltranslocations(相互易位);.3%的肿瘤存在有Chromothripsis(染色体碎裂)。09年6月发表在Cell上的“追踪肺腺癌突变历史中的癌基因重排”的研究显示[8],通过对38例肺腺癌样本的全基因组测序数据进行分析,发现与吸烟相关度低的肺腺癌患者(Smoking-signature-lowLADCs)中74%的已知融合癌基因是由Chromothripsis(染色体碎裂)、Chromoplexy(染色体编织)等复杂的基因组重排产生的(包括EML4-ALK、CD74-ROS和KIF5B-RET等等)。融合癌基因在肿瘤发生早期就已产生,且有长时间的诊断延迟。分析了39例肿瘤驱动融合基因的来源,其中0例(6%)由简单重组产生,包括大片段删除、Reciprocalinversions(相互倒置)、Reciprocaltranslocations(相互易位)等;9例(74%)由复杂的基因重组产生(平均的重排断点数达0个),其中5例为有多个断裂点分布在两条以上的染色体上的Chromoplexy、3例为典型的Chromothripsis(单条染色体内)、9例为涉及-条染色体表现为Chromoplexy和Chromothripsis共同作用的特征(有成簇的断点,且拷贝数基本平衡)、5例为多条染色体间Chromothripsis等(图0)。由此可见,LADCs中融合癌基因的形成由多种类型的复杂重组产生,这可能是正常呼吸道上皮细胞恶性癌变的起始事件,尤其对于非吸烟者。图0.复杂基因组重排产生融合癌基因:(A)肺腺癌融合癌基因的基因组重排模式。(B)产生EML4-ALK融合癌基因的Chromothripsis的实例。在LU-F6号病例中,在染色体破碎后的重组过程中丢失了许多DNA片段,最终的足迹显示出典型的拷贝数不平衡;相反,LU-FF07病例中显示了拷贝数平衡模式。重新排列被描述为垂直线和连接弧,其颜色表示不同类型的重新排列。CN表示拷贝数。(C-E)产生肺腺癌的驱动子融合癌基因的染色体编织和染色体碎裂的实例:(C)经典的染色体碎裂,(D)平衡的染色体碎裂,(E)肺腺癌中驱动融合癌基因,大写字母表示DNA片段和它们的方向对应于它们在衍生染色体中的重排构型。红色虚线表示DNA双链断裂,浅蓝色弧线表示连接断点。那么,这些在DNA层面上发生的复杂融合事件是否能够在RNA层面上形成融合产物?最终产物的形式又是什么样的?在DNA水平上检测到的目标基因与基因间区域发生了融合的信息是否能够准确预测出真实的RNA产物呢?在临床上DNA水平检测到的复杂融合事件是否真实参与了融合变异的翻译和转录过程并最终能表达出有功能的融合蛋白?相关现象越来越受到临床专家和病理专家的