【佳學基因檢測】如何科學地進行乳腺癌腫瘤基因檢測數(shù)據分析與解讀?
腫瘤基因檢測準確性分析所采用的樣本
根據《乳腺癌精準治療基因檢測分析方法》,乳腺癌腫瘤基因檢測數(shù)據分析解讀本研究選取了來自乳腺癌協(xié)會聯(lián)盟(BCAC)參與研究的亞血統(tǒng)女性乳腺癌患者。這些患者均有關于生存狀態(tài)和診斷至最后隨訪的年份等信息,并且均被診斷為任何階段的原發(fā)性浸潤性乳腺癌,且在診斷時年齡至少為18歲。最終的研究樣本包含了來自70個BCAC研究的91,686名乳腺癌患者。
乳腺癌患者的組織病理學、存活率和治療信息由各個參與的合作醫(yī)院和醫(yī)生收集,并在佳學基因進行匯總和協(xié)調,然后參照BCAC數(shù)據庫。所有研究均獲得了相關倫理委員會的批準,并且所有患者均簽署了知情同意書。
基因檢測結果如何將患者分為不同的類型
患者亞組的劃分依據主要基于診斷時的年齡、雌激素受體(ER)狀態(tài)、孕激素受體(PR)狀態(tài)、人類表皮生長因子受體2(HER2)狀態(tài)、腫瘤分級及系統(tǒng)治療類型(基于BCAC數(shù)據庫可獲取的相關信息)。對于診斷年齡和腫瘤分級,特別關注預后較差的亞組。因此,我們定義了15個亞組:
- 診斷時年齡小于40歲的患者;
- 腫瘤分級為3級的患者;
- ER陽性(ER+)腫瘤并接受內分泌治療的患者;
- ER陰性(ER−)腫瘤并接受化療的患者;
- 激素受體(HR)陽性(ER+或PR+)且HER2陰性的患者;
- HR陽性(ER+或PR+)且HER2陰性腫瘤,接受化療的患者;
- HR陽性且HER2陰性腫瘤,未接受化療的患者;
- HR陽性且HER2陽性(HER2+)腫瘤的患者;
- HR陰性且HER2陽性(HER2+)腫瘤的患者;
- HR陰性且HER2陰性(HR−,HER2−)腫瘤的患者;
- 接受他莫昔芬治療的患者;
- 接受芳香化酶抑制劑治療的患者;
- 接受環(huán)磷酰胺-甲氨蝶呤-氟尿嘧啶(CMF)類化療方案的患者;
- 接受紫杉醇類藥物治療的患者;
- 接受蒽環(huán)類藥物治療的患者。
每個亞組的選擇依據與文獻支持的理由請咨詢佳學基因檢測。需要注意的是,由于患者數(shù)量較少,HER2陽性腫瘤接受曲妥珠單抗治療的亞組未被納入分析,因為該亞組的事件率較低,導致分析的統(tǒng)計功效較低。
此外,研究還排除了診斷時即為轉移性乳腺癌的患者(占所有患者的1.1%),因為這類患者通常接受姑息治療,不適合基于系統(tǒng)治療類型的亞組分析。
除了亞組分析,佳學基因檢測還對所有乳腺癌患者進行了全基因組分析,評估常見遺傳變異與乳腺癌特定生存期(15年生存期)之間的關系。這項分析旨在評估是否可以在整個患者數(shù)據集中檢測到亞組分析中的遺傳變異關聯(lián)。以往也進行過類似的全基因組分析。然而,之前的分析數(shù)據來自12個GWAS數(shù)據集,其中包括來自iCOGS和OncoArray的數(shù)據(患者數(shù)為84,757人,隨訪時間較短),而當前數(shù)據集的樣本量和隨訪時間更為充足。
由于部分變量存在缺失數(shù)據,并非所有患者都能被劃分到每個亞組,因此在亞組劃分時會根據缺失值進行適當處理。每個亞組的患者數(shù)量、乳腺癌特定死亡的數(shù)量、患者/腫瘤特征、治療信息及隨訪數(shù)據請咨詢佳學基因檢測靶向藥物基因檢測合作醫(yī)院機構。
臨床與病理變量缺失值的填補
為了進行二次調整分析,我們使用R軟件的鏈式方程多重填補(MICE)包(v. 3.2.0)填補了臨床和病理變量中的缺失值。具體的填補方法和變量列表及缺失值百分比,詳見佳學基因解碼說明文檔。
基因分型和基因型填補、族群分析與質量控制
關于基因分型和基因型填補的方法,佳學基因在基因解碼專題中進行詳細介紹。簡而言之,患者使用了兩種不同的基因分型芯片:iCOGS和OncoArray。只有通過基因型數(shù)據推斷為亞州血統(tǒng)的樣本才被納入分析。對于未進行分型的變異,最初是使用1000基因組計劃第3階段(2014年10月發(fā)布)的參考面板進行填補。最近,我們使用了Haplotype Reference Consortium(HRC)參考面板重新進行填補,以提高稀有變異的填補質量。所有的分析都基于基因型變異或填補后的變異,且要求次要等位基因頻率(MAF)>0.01。僅當填補后的變異的填補r²值大于0.7時,這些變異才被納入分析。最終,共分析了大約1000萬個變異。
統(tǒng)計分析
佳學基因乳腺癌腫瘤精準用藥基因檢測的主要分析結果是乳腺癌特定生存期(因乳腺癌死亡的時間)。我們采用延遲進入的Cox回歸模型估算風險比(HR)和95%置信區(qū)間(CI)。風險時間是從研究入組時開始的,如果入組時間晚于診斷時間(22.9%的患者在診斷1年后入組,27.3%的患者在1年后入組),則時間從研究入組開始。如果入組時間缺失(24.5%的患者),則時間從診斷開始;如果入組時間在診斷之前(8.4%的患者),則時間從診斷開始。事件的發(fā)生時間右刪失,截止時間為最后隨訪或診斷后15年,以先發(fā)生者為準。如果患者死于乳腺癌以外的原因或死因不明,則在15年內或15年后進行刪失。
在分析中,我們還參考了早期乳腺癌臨床試驗者合作組(EBCTCG)的結果。特別是,對于基于系統(tǒng)治療類型的亞組分析,我們將最大隨訪時間限制在診斷后5年內。這些分析的目的是探討常見遺傳變異在接受特定系統(tǒng)治療的患者中的短期效應,因為這些效應可能隨時間變化,并且治療方案通常集中在診斷后前5年。
Cox回歸分析分別在每個亞組內進行,并按國家進行分層。所有分析都分別按基因分型平臺(iCOGS與OncoArray)進行,結果通過固定效應的Meta分析進行合并。HR估算值的標準誤差根據似然比檢驗統(tǒng)計量重新計算,如前所述。對于僅在一個基因分型平臺上符合納入標準(MAF>0.01且r²>0.7)的變異,我們僅使用該平臺的結果。對于P值<5E−08的變異,我們還在另一平臺上重新計算HR和95%置信區(qū)間,以驗證關聯(lián)的方向是否一致。
(責任編輯:佳學基因)