TCGA癌症临床数据资源全面参阅---癌症研究领域的全谱!

2021-12-13 06:59 来源:新余妇科医院

2006年,前列腺肺癌DNA示意著者(The Cancer Genome Atlas, TCGA)原先以多形特殊性胶质母细胞核肿(GBM)、食道点状细胞核肺癌(LUSC)和乳腺浓缩特殊性囊乳腺肺癌(OV)开始为期3年的试点单项,2009年~2015年年底进行。到单项截止,TCGA网络原始数据统计数据分析工作者已描述了33种前列腺肺癌特性10,000余举例患儿的分子可构造,并概念了很多分子可变异。TCGA包含的针灸不可或缺构造代同上泛化的原始数据利用。为确保恰巧确可用这些具DNA构造的海量针灸原始数据,最近TCGA进行一批重大成果,发同上在CellPress大中华区的期刊。

本文对4月初5日发同上Cell上的一文透过程序代码。文章陈述了以OS(总适应环境期)、PFI(无重大突破有数隔)、DFI(无伤寒有数隔)和DSS(疾伤寒相关只剩)为四个主要针灸结果绕道的TCGA泛前列腺肺癌针灸原始数据资源(TCGA-CDR)基本原始元数据,并计算借助于来了每种前列腺肺癌特性的绕道可用同意。TCGA针灸原始数据可从DNA原始数据共享空有数(GDC)门户网站上传,所有的分子可原始数据在上传。针灸原始数据和分子可原始数据可用同样的条码结构,便于患儿的针灸参考资料和采样分子可原始数据整合。

TCGA泛肺癌原始元数据表头构造

示意图1A为针灸原始数据整合和统计数据基本概念及4个主要针灸绕道相异和审核的流程示意图,对33份初始已登记和97份后续原始数据文件,共33种前列腺肺癌特性111,60举例前列腺肺癌患儿的参考资料透过了处理方式。同上1为每个TCGA表头的基本构造。按原发采样根据分子可构造选入每个表头,毛发黑色素肿(SKCM)的原发和移转到灶两种特性都有,其它极寡数的原发与移转到特性也有原始数据统计数据分析。

示意图1. 针灸原始数据整合和统计数据基本概念及4个主要针灸绕道相异和审核流程示意图

同上1. TCGA 泛肺癌表头构造

针灸结果绕道OS、PFI、DFI和DSS

总适应环境期(OS)很不可或缺,优点是概念OS惨剧时模糊特殊性最偏高。但可用OS作绕道或许压制针灸原始数据统计数据分析,因为非肺癌死因也就是说能反映借助于生态学、侵扰特殊性或对化疗缓解。可用OS或须加长的随访星期;很多针灸试验中会,不一定引入来得随访星期较短的DFI或PFI。针对原有TCGA针灸原始数据,要注意到到MLT-针灸随访有数隔在侵扰特殊性前列腺肺癌特性结果的不可或缺特殊性,因为或许几年内就捕捉到到针灸惨剧,在遇害以前已借助于现伤寒情住院或重大突破。对侵扰特殊性较弱的前列腺肺癌特性,患儿在数十乃至几十年后住院,随访期有数或许勉强捕捉到能够惨剧以赞成可靠结果供恰巧确。该统计数据分析的目的是核查TCGA泛肺癌针灸检测的来得挑战者和极低,个人兴趣现阶段的统计数据分析和不必要随访有数隔星期极低等有缺陷。

统计数据分析全部TCGA针灸原始数据后,结论如下:在原始数据可获得时,OS、PFI及DFI来得有用,但大多只能勉强推估DSS。示意图1B为33种相当相同前列腺肺癌特性的OS K-M弧线。尽管适应环境统计数据分析不是TCGA主要最终目标,大多前列腺肺癌特性适应环境弧线与依然审核相同适应环境绕道的独立原始数据统计数据分析基本一致,GBM、OV(2008, 2011)和偏高高级别胶质肿(LGG)(2015)的TCGA结果就是最借助于色举便是。PFI、DFI和DSS的K-M弧线见示意图1C–1E。

示意图1 B-E针灸原始数据统计数据分析

基于每种前列腺肺癌特性4个绕道的捕捉到星期计算平均随访星期及惨剧或核查的中会位星期(同上2)。所有的中会位随访星期为22.1个月初,但相当相同特性前列腺肺癌该星期区别极大;GBM和急特殊性髓系白血伤寒(LAML)最短共约12个月初,而肾嫌色细胞核肺癌(KICH)三长共约48个月初。

同上2 总体中会位随访星期及4个绕道的惨剧与捕捉到中会位星期

引荐可用的针灸结果绕道

针灸结果绕道相当需要取决于原始数据统计数据分析最终目标、惨剧数量、表头大小和结果原始数据质量。将这些方法和开发的其它方法作为对单个疾伤寒原始元数据的测试和必需核查,计算借助于来在每种疾伤寒特性中会可用每个结果绕道的同意及理由(同上3)。每种前列腺肺癌特性的适应环境绕道不必最寡通过一个主要测试和必需核查才被接受。33种肺癌中会的13种可用全部4个绕道:膀胱尿路上皮肺癌(BLCA)、内膜点状细胞核肺癌(CESC)、结肠肺癌(COAD)、食管肺癌(ESCA)、头颈部点状细胞核肺癌(HNSC)、肾状细胞核肺癌(KIRP)、食道乳腺肺癌(LUAD)、LUSC、OV、胰乳腺肺癌(PAAD)、肉肿(SARC)、食道乳腺肺癌(STAD)和子宫内膜肺癌(UCEC)。相反,没一个绕道的有嗜铬细胞核肿和副皮质肿(PCPG)。淋巴弥漫大B细胞核淋巴肿(DLBC)、LAML和腰腺肿(THYM)极寡一个绕道;剩余前列腺肺癌特性2或3个绕道,但其中会一些持保留看法。最可靠的是PFI,可无保留地引荐给除LAML(无原始数据)、DLBC和KICH(谨慎可用)和PCPG(不引荐)均的4种。

同上3 绕道OS,PFI,DFI及DSS的审核与引荐可用

验证TCGA-CDR及案举例应用

在乳乳腺肺癌原始数据统计数据分析中会,荷尔蒙ER单数患儿针灸适应环境期预后比ER+患儿负。分别用OS、PFI、DFI和DSS较为这两类患儿的适应环境期(示意图3A–3D;弧线截止于10年随访星期,但可用整个原始元数据透过统计数据分析)。单心理因素统计数据分析标示借助于,可用PFI(p= 0.005)和DFI(p = 0.001)作为针灸绕道,TCGA中会ER+乳乳腺肺癌患儿比ER-患儿有更高的适应环境期,但可用OS时两类患儿有数不共存区别(p = 0.097) 。此均,两类患儿的DSS(p = 0.009)有显着区别,同上明DSS的潜在价值。以上发掘借助于证实了PFI和DFI是特定特性乳乳腺肺癌分子可原始数据统计数据分析的合适绕道。

示意图3 验证和应用实举例

此均还验证了侵扰特殊性GBM适应环境结果绕道。TCGA中会GBM中会位OS为12.6个月初,介于此以前报道的基本疗的12.1个月初和基本疗联合替莫唑胺的14.6个月初之有数。中会位PFI是6.1个月初,介于此以前报道的基本疗5个月初和基本疗联合替莫唑胺的6.9个月初之有数。显然,TCGA原始元数据OS和PFI惨剧星期与古书一致。旋即说是OS和PFI作为GBM分子可原始数据统计数据分析的针灸绕道效度。

用Cox比举例几率回归仿真确定高期(III、IV期)来得偏高期(I、II期)前列腺肺癌患儿的几率比(HR),验证4个绕道的TCGA-CDR原始数据。由于DFI概念与其它结果的概念不一致,对引荐可用OS、PFI和DSS的14种特性前列腺肺癌较为logHR(同上3)。随后极寡对满足Cox比举例几率举例的疾伤寒透过统计数据(示意图3E–3G)。结果同上明,14种特性前列腺肺癌中会,除有数皮肿(MESO)、PAAD和葡萄膜黑色素肿(UVM)均,高期对比偏高期HR在3个引荐绕道OS、PFI及DSS上明显偏高。引入分组采样的Wilcoxon秩和化验,当可用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有显着区别,标示借助于疾伤寒重大突破和适应环境绕道在HR上共存管理系统相反;OS与DSS之有数没显着区别(p = 0.106)。对2个logHR值的规范误透过逆加权平均确定Pearson绝对值, 由logHR推估的3种结果有极显着恰巧相关:PFI和OS绝对值0.96(95%置信区有数[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区有数:0.76–0.99),OS和DSS为0.90(95%置信区有数:0.61–0.98)。这些相关特殊性潜在赞成针灸早期用PFI,后期用OS和DSS做绕道。

除了整合分子可原始数据,还尝试统计数据分析首次化疗后无伤寒患儿与非无伤寒患儿有否借助于现相当相同的最初惨剧。TCGA-CDR中会29类前列腺肺癌讯息用于解决该情况,不属于患儿从诊断到进行首治并超借助于无伤寒静止状态最寡只剩3个月初。以LUSC为举例,有289举例无伤寒患儿和41举例长期非无伤寒患儿,NTE率分别为21.8%和68.2%。用Cox比举例几率回归仿真,发掘借助于在非无伤寒患儿中会NTE几率显着高于无伤寒患儿(HR = 6.68,95% CI = 4.25–10.51,FDR优化q值<0.05)。在另均21种前列腺肺癌特性中会也有相同结果(同上4)。余下7种中会没捕捉到到这些区别。我们也在审核有否每个仿真都满足比举例几率举例,其中会有两个不符合,不必原始数据统计数据分析星期依赖及大多据特性仿真来寻找理由。

同上4 非无伤寒与无伤寒患儿NTE发展对比

TCGA从全球数百个站内利用传染伤寒,为解决针灸原始数据相当相同站内有数的可比特殊性,须选择原始数据完整特殊性、和患儿构造等。对每种疾伤寒而言,我们对比了以前两名提供传染伤寒数最多的组织来源站内(TSS)与所有其它TSS的同种疾伤寒及4个结果绕道(同上5)。

同上5 对来自以前两位TSS的每个前列腺肺癌特性原始数据统计数据分析结果透过较为

对于GBM等具侵扰特殊性的,以前两位TSS(#1和#2)的发伤寒群体与其它TSS来得相同的有OS、PFI和DSS,因惨剧太寡难以统计数据分析不引荐DFI做绕道。BRCA等较偏高侵扰特殊性,强力引荐可用PFI和DFI,但同意谨慎用OS或DSS审核。TSS #1的针灸原始数据归因于不太好的OS和DSS,但没捕捉到到PFI区别;另均,同上面上TSS#1有更高的DFI结果,极寡借助于现3举例 DFI惨剧。这种同上里不一的现象同上明该站内的结果原始数据须年底性审核。另一方面,TSS #2的4个绕道结果与其它地方一致。

这个简单的结果较为同上明,当从特定结果统计数据分析整体TCGA的针灸原始数据时,不必选择TSS的基本讯息。由于年长、分期/PG及化疗等心理因素影响相当相同TSS患伤寒群体的绕道结果,TSS可以作为这些和不完全针灸释义等其它未测量区别的替代。

潜在的群集心理因素、挑战结果的

几率及仿真举例

对针灸适应环境绕道统计数据分析来说,同意可用所处理方式的全部针灸原始数据。但来得分子可/DNA原始数据的整合统计数据分析,要注意到两个方面。首先,引荐看法基于基线适应环境仿真,以分子可变异作数据分析q划分采样集,有或许破坏结果统计数据的显着特殊性区别。因此,从相关联性的TCGA分子可原始数据或变异TCGA-CDR结果原始数据中会得借助于的结论须在独立的原始元数据中会年底性证实。

第二,我们同意极寡可用原发的分子可原始数据,因为患儿初诊时,不可或缺星期讯息等给定的针灸原始数据已利用来得完整。毛发黑色素肿(SKCM)在TCGA特性中会非常特殊,470举例中会极寡103举例原发,其余296举例为原发局部食道部移转到,68举例远端移转到。这与很寡利用到移转到肿的其它TCGA前列腺肺癌特性形成鲜明对比。SKCM移转到肿很寡不具备给定的原发,而其它TCGA前列腺肺癌特性尽管很寡有移转到肿,但都不具备给定的原发采样。因此,对于SKCM结果的相关特殊性,同意只可用有限数量的原发传染伤寒,尽管SCKM食道部移转到的III期传染伤寒可作为独立组群透过原始数据统计数据分析。

在可用最初整合的TCGA-CDR原始元数据时,还不必注意到:潜在混淆心理因素、挑战结果的几率及仿真举例。

群集心理因素

群集心理因素共存但被选择在仿真之均时,相反或许高估或偏高估真恰巧。如在乳乳腺肺癌的种族区别原始数据统计数据分析中会,白人与非裔患儿之有数共存不可或缺的基因同上达区别,然而根据分子可变异透过优化后,这种区别显着减小甚至变为。治果也是潜在的群集心理因素,当讯息可得到时应适当选择优化。化疗未知时,年长、诊治医院及诊断基本情况等基本疗作为替代讯息能减小外误负。对这方面的决策仿真,借此可用标志物预后原始数据统计数据分析同意报告(REMARK)。

挑战结果的几率

测定DSS、DFI和PFI绕道时,要对没年中不可或缺惨剧且无伤寒的遇害患儿透过审查。在这种只能,如果举例患儿没其它死因,那她/他最终仍或许死于前列腺肺癌指征。然而,在推估化疗等数据分析q对继发特殊性前列腺肺癌或心血管疾伤寒等非基准前列腺肺癌遇害几率的数据分析能力时,该举例相当可取。

仿真举例

应用Cox比举例几率(PH)仿真不必核查PH举例。除寡数案举例均,大大多仿真都满足Cox PH举例,但须年底性聚焦这些病患以找借助于违背举例的理由,从而对HR做借助于更准确的推估。尽管早已为清除原始数据和做到牺牲了巨大努力,但仍共存不可或缺的可用上限,访问TCGA针灸原始数据都不必了解这些上限。

首先,TCGA主要是为分子可原始数据统计数据分析设计,最初传染伤寒相当需要来自多个机构不具备合适库存组织的未化疗原发传染伤寒,因此这些传染伤寒不构成连续特殊性。此均,对于每种相当相同特性/原始数据统计数据分析,随访原始数据没并存利用。同时,针灸原始数据利用的一些规则在依然不得已随着星期的推移而相反。TCGA - CDR不包含前列腺肺癌化疗史,并非所有传染伤寒都被释义。因此,统计数据分析特定特性或变异的化疗取材优于概况特殊性泛肺癌统计数据分析。当患儿透过基本化疗时,受惠只用DFI和PFI绕道有效统计数据分析。

其次,TCGA采样针灸随访根据当地养老院的星期同上,或许为疾伤寒或特定部位的住院和伤寒人不可或缺生命静止状态的记录,因此没TCGA指定的针灸随访原先,极寡计算借助于来单项主要强调的分子可构造。

最后,几乎所有TCGA获得的采样和DNA及分子可原始数据来自最初诊患儿原发的单个活体,由此归因于的DNA和分子可原始数据不能在空有数或星期任何方面明确捕获代同上另一患儿结果数据特性的异质特殊性。该情况不是TCGA独有的,任何特殊性原发特殊性原始数据统计数据分析都共存。

展望

这项工作是本世纪第一次年底管理系统地处理方式TCGA泛肺癌针灸参考资料。由此归因于的TCGA-CDR的结果绕道与独立非TCGA原始数据统计数据分析结果一致,陈述该资源在空以前影响力也的针灸尺度上提供了生物体观测最初视角。也要注意到到TCGA-CDR的内在可用局限特殊性及不可或缺心理因素个人兴趣和引荐看法。早已非常特殊性,人类文明疾伤寒下一代大影响力也的分子可原始数据统计数据分析不必管理系统地利用针灸伤寒理、化疗和转归惨剧原始数据,以尽力最高规范的针灸原始数据统计数据分析。尽管有其局限特殊性,TCGA-CDR提供了基本原始元数据,以及清晰的4个针灸结果绕道导借助于,并解决了质量情况,从而在泛肺癌和生殖程度上透过转化原始数据统计数据分析。下一代原始数据原始数据统计数据分析的揉合将提高结果之有数的可比特殊性,更高地断言和赞成重复。

参考参考资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
FDA首肯Keytruda用于一线治疗宫颈癌
MSD的PD-1抗病毒 Keytruda (pembrolizumab) 已取得旧金山食品和药品监督管理局 (FDA) 的批文,用于某些宫颈癌病变的一线治疗。宫颈癌为发生在子宫颈的癌症,源...[详细]
2022-05-05
【盘点】细数针灸的健康效用
医书疗法发源地我国,在公元6世纪传到了平壤、日本人等国。在现代作为替代疗法传播到世界各地。当医书最初在西半球流行之时,它曾皆遭怀疑,现在...[详细]
2022-05-04
柴映爽:基因测序,河沟上的思考
甲基化脱氧核糖遗传物质显然是期望可惜的最初技术之一,但其真实业业价值几何?什么样的创业单项不或许海外投资?什么样的最初技术才有河堤?什...[详细]
2022-05-03
查出盆腔积液并不等于盆腔炎!医生:这种妇科病,大多只能治疗
每年去身体检查做先妇科B超后,总就会有个结果令男同性恋朋友们紧张,并且忧心忡忡的,就是超声波结果高亮阴部血块。小李上周单位刚组织先身体检...[详细]
2022-05-02
卵巢卵黄囊瘤饮茶需注意
在各种卵巢恶性生殖细胞突起之中,卵巢卵黄囊突起是最常见于的一种。 据目前的医疗技术,治疗主要以手术切除为主。在年老后曾以及治疗动手术后的...[详细]
2022-05-02
宫颈炎怎么外科手术? 宫颈炎的中西药疗法
宫颈炎的病患法则有来得多,其中,切除术病患是称得上得最后的病患法则,可以冀望,复发的机率少,但是由于各种原因的严重影响,有些患者不自已...[详细]
2022-04-28
国医大师夏桂成:下厨月经病经验
早期社会上,生活习惯节奏快、生活习惯仰理压力大,作为“半边天”的女同性恋朋友都会浮现卵巢不调的情况。这不但影响身体健康,而且还会影响深...[详细]
2022-04-27
眼睛不好怎么办?两个证型辨证,7由此可知花茶送给你
在医家门诊就会平常遇到因随之而来火光眼,或者视物昏花,双耳干美眉,来访确诊,查问是不是对耳朵好药物啖白酒饮用,病人体弱。全家人可以根据...[详细]
2022-04-26
宫寒的原因 防水不足会引起这种后果
宫寒怎么办?宫寒这个解决办法是不少特质较差的朋友都亦会有的,宫寒的原因比起复杂,但是出现了这个解决办法之后,亦会有很多的不适症状,所以...[详细]
2022-04-25
  • 地区医院
  • 医院联盟