TCGA癌症临床数据资源全面介绍---癌症科学研究领域的全谱!

2022-02-28 05:56 来源:鹰潭妇科医院

2006年,乳腺胰脏序列左图谱(The Cancer Genome Atlas, TCGA)原计划以多形连续性胶质母蛋白肉瘤(GBM)、大肠突起蛋白胰脏(LUSC)和卵巢浸润连续性囊肝胰脏(OV)开始为期3年的试行工程项目,2009年~2015年全盘进行时。到工程项目截止,TCGA网络分析工都以者已描绘了33种乳腺胰脏种类10,000余则有症状的小分子不同之处,并度量了很多小分子流感患病毒。TCGA都有的患病理极为重要不同之处都有泛化的统计资料数据查阅。为确保正确可用这些颇具序列不同之处的海量患病理统计资料数据,除此以均TCGA已完成一批重大成果,发表格在CellPress全资的学报。

本文对4年初5日发表格Cell上的一文进行时编译。社论阐述以OS(总求生存期)、PFI(无成效整整延迟)、DFI(无患病整整延迟)和DSS(患病因无关活)为四个主要患病理结果西端的TCGA泛乳腺胰脏患病理统计资料数据教育资源(TCGA-CDR)新的标准目录,并得造出了每种乳腺胰脏种类的西端可用表示同意。TCGA患病理统计资料数据可从序列统计资料数据共有约享空在在(GDC)门户网站订阅,所有的小分子统计资料数据在订阅。患病理统计资料数据和小分子统计资料数据可用同样的条形码结构,便于症状的患病理的资讯和样本小分子统计资料数据定位。

TCGA泛胰脏目录链表格不同之处

左图1A为患病理统计资料数据定位和比对方法及4个主要患病理西端衍生和分析的点阵左图,对33份初始登记和97份后续统计资料数据文件,共有约33种乳腺胰脏种类111,60则有乳腺胰脏症状的的资讯进行时了执行。表格1为每个TCGA链表格的基本不同之处。按原发样本根据小分子不同之处崭露头角每个链表格,眼部黑色素肉瘤(SKCM)的原发和集中于灶两种种类都有,其它极再加数的原发与集中于种类也有分析。

左图1. 患病理统计资料数据定位和比对方法及4个主要患病理西端衍生和分析点阵左图

表格1. TCGA 泛胰脏链表格不同之处

患病理结果西端OS、PFI、DFI和DSS

总求生存期(OS)很极为重要连续性,优点是度量OS血案时模糊连续性上限。但可用OS都以西端不太可能削弱患病理分析,因为非胰脏临案发时不一定能反映造出微海洋生物学、肆虐连续性或对化疗缓解。可用OS或才可较长的随访整整;很多患病理试验中会,往往采行相比较随访整整较短的DFI或PFI。针对结构上TCGA患病理统计资料数据,要确信连续性患病理随访整整延迟在肆虐连续性乳腺胰脏种类结果的极为重要连续性连续性,因为不太可能几年内就辨别到患病理血案,在临幸存者当年已造出现患患病罹患或成效。对肆虐连续性较差的乳腺胰脏种类,症状在数十乃至几十年后罹患,随访期在在不太可能只能辨别所需血案以大力支持可靠结果均判别。该比对的旨在是体检TCGA泛胰脏患病理检测的相比较优势和不足,个人兴趣现阶段的比对和可能会随访整整延迟整整不足等缺陷。

比对全部TCGA患病理统计资料数据后,推论如下:在统计资料数据可得到时,OS、PFI及DFI相比较正确地,但大部分完全只能大有约DSS。左图1B为33种各有不同乳腺胰脏种类的OS K-M圆弧。尽管求生存比对不是TCGA主要能够,大部分乳腺胰脏种类求生存圆弧与过往分析相同求生存西端的独立国家分析基本相同,GBM、OV(2008, 2011)和低级别胶质肉瘤(LGG)(2015)的TCGA结果就是比较好则有证。PFI、DFI和DSS的K-M圆弧见左图1C–1E。

左图1 B-E患病理统计资料数据比对

基于每种乳腺胰脏种类4个西端的辨别整整测算平均随访整整及血案或体检的中会位整整(表格2)。所有的中会位随访整整为22.1个年初,但各有不同种类乳腺胰脏该整整区别极大;GBM和急连续性髓系脑癌(LAML)最短有约12个年初,而肾嫌色蛋白胰脏(KICH)最多有约48个年初。

表格2 基本上中会位随访整整及4个西端的血案与辨别中会位整整

录用可用的患病理结果西端

患病理结果西端选择各不相同分析能够、血案才可求量、链表格不等和结果统计资料数据正确地连续性。将这些方法和联合开发的其它方法都以为对单个患病因目录的测试和补充体检,得造出在每种患病因种类中会可用每个结果西端的表示同意及不太可能(表格3)。每种乳腺胰脏种类的求生存西端才可要至再加通过一个主要测试和补充体检才被接受。33种胰脏中会的13种可用全部4个西端:膀胱尿路上皮胰脏(BLCA)、宫颈突起蛋白胰脏(CESC)、结肠胰脏(COAD)、食管胰脏(ESCA)、头颈部突起蛋白胰脏(HNSC)、肾状蛋白胰脏(KIRP)、大肠肝胰脏(LUAD)、LUSC、OV、胰肝胰脏(PAAD)、肉肉瘤(SARC)、腹腔肝胰脏(STAD)和子宫内膜胰脏(UCEC)。相反,只能一个西端的有嗜铬蛋白肉瘤和副神经节肉瘤(PCPG)。大肠脏充斥大B蛋白大肠脏肉瘤(DLBC)、LAML和胸腺肉瘤(THYM)至少一个西端;剩余乳腺胰脏种类2或3个西端,但其中会一些持保留观点。最可靠的是PFI,可无保留地录用给除LAML(无统计资料数据)、DLBC和KICH(认真可用)和PCPG(不录用)均的4种。

表格3 西端OS,PFI,DFI及DSS的分析与录用可用

的测试TCGA-CDR及案则有技术的发展

在乳肝胰脏分析中会,甲状腺激素ER阴连续性症状患病理求生存期肾功能比ER+症状差。分别用OS、PFI、DFI和DSS比起这两类症状的求生存期(左图3A–3D;圆弧截止于10年随访整整,但可用整个目录进行时比对)。单因素比对看造出,可用PFI(p= 0.005)和DFI(p = 0.001)都以为患病理西端,TCGA中会ER+乳肝乳腺胰脏状比ER-症状有更佳的求生存期,但可用OS时两类症状在在不实际上区别(p = 0.097) 。此均,两类症状的DSS(p = 0.009)有特别是在区别,表格明DSS的潜在极为重要连续性连续性。以上推断造出属实了PFI和DFI是特定种类乳肝胰脏小分子分析的适当西端。

左图3 的测试和技术的发展实则有

此均还的测试了肆虐连续性GBM求生存结果西端。TCGA中会GBM中会位OS为12.6个年初,介于此当年引述的新的标准化疗的12.1个年初和新的标准化疗建立联系替莫唑胺的14.6个年初两者之在在。中会位PFI是6.1个年初,介于此当年引述的新的标准化疗5个年初和新的标准化疗建立联系替莫唑胺的6.9个年初两者之在在。确实,TCGA目录OS和PFI血案整整与史料恰当。之后窥见OS和PFI都以为GBM小分子分析的患病理西端效度。

用Cox%-危险连续性重返建模确定高期(III、IV期)相比更高期(I、II期)乳腺胰脏症状的危险连续性比(HR),的测试4个西端的TCGA-CDR统计资料数据。由于DFI度量与其它结果的度量不恰当,对录用可用OS、PFI和DSS的14种种类乳腺胰脏比起logHR(表格3)。随后至少对满足Cox%-危险连续性推论的患病因进行时统计资料(左图3E–3G)。结果表格明,14种种类乳腺胰脏中会,除在在皮肉瘤(MESO)、PAAD和葡萄膜黑色素肉瘤(UVM)均,高期对比低期HR在3个录用西端OS、PFI及DSS上突造出偏高。采行配对样本的Wilcoxon秩和验,当可用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)计算时,logHR有特别是在区别,看造出患病因成效和求生存西端在HR上实际上系统误差;OS与DSS两者之在在只能特别是在区别(p = 0.106)。对2个logHR绝对值的新的标准误将进行时逆加权平均确定Pearson无关系数, 由logHR大有约的3种结果有极特别是在正无关:PFI和OS无关系数0.96(95%置信区在在[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区在在:0.76–0.99),OS和DSS为0.90(95%置信区在在:0.61–0.98)。这些无关连续性潜在大力支持患病理早期用PFI,前期用OS和DSS做西端。

除了定位小分子统计资料数据,还尝试比对首次化疗后无患病症状与非无患病症状到底造出现各有不同的新的血案。TCGA-CDR中会29类乳腺胰脏文档用于化解该难题,设为症状从患病患到已完成首治并达到无患病状态至再加活3个年初。以LUSC为则有,有289则有无患病症状和41则有经常性非无患病症状,NTE率共有21.8%和68.2%。用Cox%-危险连续性重返建模,推断造出在非无患病症状中会NTE危险连续性特别是在高于无患病症状(HR = 6.68,95% CI = 4.25–10.51,FDR调整q绝对值<0.05)。在另均21种乳腺胰脏种类中会也有相同结果(表格4)。直至7种中会只能辨别到这些区别。我们也在分析到底每个建模都满足%-危险连续性推论,其中会有两个不符合,才可要分析整整依赖于及多给定建模来寻找不太可能。

表格4 非无患病与无患病症状NTE发展对比

TCGA从世界性数百个条线路查阅传染患病,为化解患病理统计资料数据各有不同条线路在在的可比连续性,才可再考虑统计资料数据原始连续性、和症状不同之处等。对每种患病因而言,我们对比了当年两名提均传染患病数最多的许多组织比如说条线路(TSS)与所有其它TSS的同种患病因及4个结果西端(表格5)。

表格5 对来自当年两位TSS的每个乳腺胰脏种类分析结果进行时比起

对于GBM等极颇具肆虐连续性的,当年两位TSS(#1和#2)的发患病症群与其它TSS比起相同的有OS、PFI和DSS,因血案太再加很难比对不录用DFI做西端。BRCA等更高肆虐连续性,连续性间内录用可用PFI和DFI,但表示同意认真用OS或DSS分析。TSS #1的患病理统计资料数据激发不太好的OS和DSS,但只能辨别到PFI区别;另均,表格面上TSS#1有更佳的DFI结果,至少造出现3则有 DFI血案。这种表格里不一的现象表格明该条线路的结果统计资料数据才可进一步分析。另一不足之处,TSS #2的4个西端结果与其它地方恰当。

这个简单的结果比起表格明,当从特定结果比对结构上TCGA的患病理统计资料数据时,才可要再考虑TSS的颇具体情况文档。由于成年人、有系统/标准及化疗等因素影响各有不同TSS患患病症群的西端结果,TSS可以都以为这些和不完全患病理注释等其它并未计算区别的替代。

潜在的混因素、竞争者结果的

危险连续性及建模推论

对患病理求生存西端比对来说,表示同意可用所执行的全部患病理统计资料数据。但比起小分子/序列统计资料数据的定位比对,要请注意两个不足之处。首先,录用观点基于基线求生存建模,以小分子流感患病毒都以得造出推论因子划分样本集,有不太可能损害结果统计资料的特别是在连续性区别。因此,从互无相似性的TCGA小分子统计资料数据或流感患病毒TCGA-CDR结果统计资料数据中会得造出的推论才可在独立国家的目录中会进一步属实。

第二,我们表示同意至少可用原发的小分子统计资料数据,因为症状初诊时,极为重要连续性整整文档等给定的患病理统计资料数据已查阅相比较原始。眼部黑色素肉瘤(SKCM)在TCGA种类中会更加特殊,470则有中会至少103则有原发,其余296则有为原发局部大肠脏结集中于,68则有远端集中于。这与至少至少查阅到集中于肉瘤的其它TCGA乳腺胰脏种类形成鲜明对比。SKCM集中于肉瘤至少至少颇兼具给定的原发,而其它TCGA乳腺胰脏种类尽管至少至少有集中于肉瘤,但都颇兼具给定的原发样本。因此,对于SKCM结果的无关连续性,表示同意只可用有限才可求量的原发传染患病,尽管SCKM大肠脏结集中于的III期传染患病可都以为独立国家两大进行时分析。

在可用新的定位的TCGA-CDR目录时,还才可要请注意:潜在联想因素、竞争者结果的危险连续性及建模推论。

混因素

混因素实际上但被排除在建模之均时,误差不太可能高估或夸大普通人。如在乳肝胰脏的宗教信仰区别分析中会,黑人与黑人症状两者之在在实际上极为重要连续性的基因表格达区别,然而根据小分子流感患病毒进行时调整后,这种区别特别是在减再加甚至消失。治果也是潜在的混因素,当文档可受益时应适当再考虑调整。化疗并未知时,成年人、诊治患病房及患病患年份等新的标准化疗都以为替代文档能减再加一小误将差。对这不足之处的决断建模,鼓励可用标志物肾功能分析表示同意统计资料统计资料数据(REMARK)。

竞争者结果的危险连续性

测定DSS、DFI和PFI西端时,要对只能随之而来极为重要连续性血案且无患病的临幸存者症状进行时甄别。在这种完全,如果推论症状只能其它临案发时,那她/他终于仍不太可能临死于乳腺胰脏指征。然而,在大有约化疗等得造出推论因子对继发连续性乳腺胰脏或心血管患病因等非指数乳腺胰脏临幸存者危险连续性的得造出推论能力时,该推论相当可取。

建模推论

技术的发展Cox%-危险连续性(PH)建模需体检PH推论。大都案则有均,大大部分建模都满足Cox PH推论,但才可进一步探索这些医疗事故以找到遵守推论的不太可能,从而对HR做造出更正确地的大有约。尽管已经为掩埋统计资料数据和化解难题蒙受了前所并未有努力,但仍实际上极为重要连续性的可用上限,会见TCGA患病理统计资料数据都需了解这些上限。

首先,TCGA主要是为小分子分析设计,在此之后传染患病选择来自多个机构颇兼具适当库存许多组织的并未化疗原发传染患病,因此这些传染患病不构成连续连续性。此均,对于每种各有不同种类/分析,随访统计资料数据只能统一查阅。同时,患病理统计资料数据查阅的一些规则在过往不得不随着整整的推移而改变。TCGA - CDR不都有乳腺胰脏化疗史,并非所有传染患病都被注释。因此,比对特定种类或流感患病毒的化疗背景比起各地区连续性泛胰脏比对。当症状进行时颇具体情况化疗时,受惠能用DFI和PFI西端有效比对。

其次,TCGA样本患病理随访根据当地诊所的整整表格,不太可能为患病因或特定部位的罹患和患病症极为重要连续性生命状态的记录,因此只能TCGA指定的患病理随访原计划,至少得造出工程项目主要忽视的小分子不同之处。

最终,几乎所有TCGA得到的样本和序列及小分子统计资料数据来自新的诊症状原发的单个切口,由此激发的序列和小分子统计资料数据不能在空在在或整整任何不足之处恰当释放造出来都有另一症状结果给定的异质连续性。该难题不是TCGA独有的,任何快照恶连续性肿肉瘤分析都实际上。

全盘连续性

这项工都以是全世界第一次全盘新方法执行TCGA泛胰脏患病理的资讯。由此激发的TCGA-CDR的结果西端与独立国家非TCGA分析结果恰当,解释该教育资源在空当年规模的患病理尺度上提均了海洋生物观测新的视角。也要确信TCGA-CDR的内在可用局限连续性及极为重要连续性个人兴趣和录用观点。已经更加角度看,海洋生物患病因将会大规模的小分子分析需新方法查阅患病理患病理、化疗和转归血案统计资料数据,以坚持最高新的标准的患病理分析。尽管有其局限连续性,TCGA-CDR提均了新的标准目录,以及模糊不清的4个患病理结果西端导造出,并化解了正确地连续性难题,从而在泛胰脏和变异高度上进行时转化分析。将会统计资料的测试的融合将提高结果两者之在在的可比连续性,更佳地解释和大力支持重复使用。

参考的资讯

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
宫腔表皮会病变吗?怎么办?
宫腔蜂窝在妇科比较少见,可引发迟于量极多、闭经、经痛等病症,让女性朋友很是烦恼,如下面这位朋友的问题:宫腔蜂窝情况严重吗?但会恶性肿瘤...[详细]
2022-05-10
月经红褐色血是怎么回事
当妊娠炎是灰色的,显然是幼体着床的主因,如果近期有暴发,而且没有人做好保护的新政策,如果在妊娠在此之前用到了有灰色炎的流出,很有显然是...[详细]
2022-05-05
溢液 应对的好方法
有些青壮年的未成年,粪便道口似乎会增生借助于暗红色的物体,这样的腹泻在所谓称之为溢液。这种疾病的感染率不高,不过还是有高血压遇上了这样...[详细]
2022-05-04
紧急提醒!手足口病出现新症状近期进入受到感染高发季一定要小心...
提到手足西南侧病,大家都不无聊。一般的手足西南侧病有时候是再次发生在手足西南侧等部位且自愈难度不小。而全因,永定县妇幼保健院里病毒性科...[详细]
2022-05-03
面对乳腺结节,这2种心态是不亦然的,有可能加重、延误病情
图表结果显示,不能不每年新发在确诊子宫癌病例约27.9万,是男性发在病率略低于的恶性!检查结果是筛查子宫肥胖问题的重要意图。很多人拿到检查报...[详细]
2022-05-02
导致月经不调的可能 别让这些因素毁了你
月经不调虽说今日很常见,十个人里非常少一般都可能会月经不调,但是大家都就让到这是还好的一种表现。造成了月经不调的因素有很多,就让就让到...[详细]
2022-05-02
,可治这15种病
的妙用。的前身是逍遥散,出自唐代的《新安济宁和剂局方》。 的名炼可以用四个字来形容:如雷贯垂。 然而,很多人对它的混为一谈颇深,再进一步...[详细]
2022-04-28
月经不调的危害,最严重的可引发“子宫内膜癌”!
本文转载自年末经疾患为妇科故常见病,《妇科玉尺》中写到:“经贵乎按期,若来时或前或后,或多或少,或年末二、三至,或数年末一至,皆为不调...[详细]
2022-04-27
子宫颈炎是什么病 怎么疗程子宫颈炎
直肠炎是什么病,对于直肠炎传染病的疗程来说,防生素是最常见的解决方案,但除此之外,直肠炎传染病也还有其他多方面的疗程解决方案,比如,电...[详细]
2022-04-26
  • 地区医院
  • 医院联盟