【佳學(xué)基因檢測】結(jié)直腸癌腫瘤基因檢測的方法與科學(xué)流程
結(jié)直腸癌(CRC)是全球范圍內(nèi)最常見的癌癥之一,其發(fā)生和發(fā)展涉及多種遺傳、環(huán)境及生活方式因素。近年來,隨著腫瘤基因組學(xué)的進(jìn)展,基因檢測技術(shù)成為早期診斷、預(yù)后評估及個(gè)性化治療的重要手段。結(jié)直腸癌的腫瘤基因檢測通過識別與腫瘤發(fā)生、進(jìn)展和藥物反應(yīng)相關(guān)的基因突變和變異,提供了對腫瘤生物學(xué)的深刻理解。這些檢測方法主要包括基因突變分析、擴(kuò)增片段長度多態(tài)性(PCR)、下一代測序(NGS)、全基因組關(guān)聯(lián)研究(GWAS)等。通過對腫瘤組織和血液樣本的檢測,科研人員能夠發(fā)現(xiàn)與結(jié)直腸癌相關(guān)的特定基因變異,如APC、KRAS、BRAF等突變,這些信息為疾病的早期診斷、風(fēng)險(xiǎn)評估以及選擇個(gè)性化治療方案提供了重要依據(jù)。同時(shí),基因檢測還能幫助預(yù)測患者對化療、靶向治療等治療方式的反應(yīng),有助于提高治療效果和患者的生存質(zhì)量。因此,腫瘤基因檢測在結(jié)直腸癌的臨床應(yīng)用中具有重要價(jià)值,推動(dòng)了精準(zhǔn)醫(yī)學(xué)的發(fā)展。
早期結(jié)直腸癌隊(duì)列的構(gòu)建
結(jié)直腸癌腫瘤基因檢測連續(xù)納入了 2018 年 1 月至 2018 年 12 月在復(fù)旦大學(xué)附屬中山醫(yī)院接受內(nèi)鏡黏膜下剝離術(shù)治療的 600 例疑似結(jié)直腸病變的結(jié)直腸癌患者。正如結(jié)直腸癌的靶向用藥基因解碼基因檢測的的方法介紹中的描述,在患者選擇上沒有偏倚,且所有患者均未接受過放療或化療等先前治療。118 例早期結(jié)直腸癌病例符合納入標(biāo)準(zhǔn)。482 例排除患者中,107 例診斷為非腫瘤(NT)病變,65 例患有間質(zhì)瘤,110 例患者因無法獲得正常組織樣本而被排除,200 例樣本未通過病理質(zhì)量檢查(如腫瘤細(xì)胞比例 < 80%)。隨后,對 30 例未接受新輔助治療且接受手術(shù)切除的晚期結(jié)直腸癌病例進(jìn)行篩查。因此,結(jié)直腸癌靶向藥物基因解碼基因檢測共選擇了 148 名結(jié)直腸癌患者構(gòu)建結(jié)直腸癌隊(duì)列。所有病例均根據(jù)美國癌癥聯(lián)合委員會(huì)第八版腫瘤-淋巴結(jié)-轉(zhuǎn)移分期系統(tǒng)進(jìn)行分期。結(jié)直腸癌腫瘤靶向用藥基因檢測符合赫爾辛基宣言 II 的倫理標(biāo)準(zhǔn),并經(jīng)復(fù)旦大學(xué)中山醫(yī)院機(jī)構(gòu)審查委員會(huì)批準(zhǔn)。所有患者在進(jìn)行任何特定研究調(diào)查之前均提供了書面知情同意書。所有患者在進(jìn)行任何特定研究調(diào)查之前均提供了知情同意書。
結(jié)直腸癌腫瘤靶向藥物基因檢測的所有樣本均符合以下標(biāo)準(zhǔn):首先,根據(jù)世界衛(wèi)生組織的分類,所有樣本均保存完好,并由兩名以上的胃腸道病理專家進(jìn)行系統(tǒng)評估,以確認(rèn)組織病理學(xué)診斷和任何變異組織學(xué),他們根據(jù)腫瘤含量(> 95%)、腫瘤壞死的存在和程度(< 5%)以及侵入固有肌層的跡象確定可接受的組織片段。其次,應(yīng)用以下標(biāo)準(zhǔn):(i)成功提取 DNA 和蛋白質(zhì);(ii)正常組織中沒有腫瘤細(xì)胞。
根據(jù)世界衛(wèi)生組織和日本的病理診斷標(biāo)準(zhǔn),早期結(jié)直腸癌隊(duì)列中的所有亞期均納入四個(gè) TNM 分期:T0(正常上皮,n = 166)、T1(T1a/b 癌癥,n = 239)、T2(n = 10)、T3(n = 10)和 T4(n = 10)。T1 被細(xì)分為低級別 IEN [LGIN;2_1(n = 37)、2_2(n = 29)、2_3(n = 20)、2_4(n = 22)、2_5(n = 4)和 2_6(n = 1)]、高級別 IEN [HGIN; 3_1 ( n = 20)、3_2 ( n = 21)、3_3 ( n = 20) 和 3_4 ( n = 16)]、LP 期 [4_1 ( n = 2)、4_2 ( n = 18) 和 4_3 ( n = 1)]、MM 期 [5_1 ( n = 1)、5_2 ( n = 11)、5_3 ( n = 1) 和 5_4 ( n = 1)],以及粘膜下浸潤癌期,即 SMIA [6 ( n = 11)] 和 SMIB 期 [7_1 ( n = 1)、7_2 ( n = 1) 和 7_3 ( n = 1)]。所有樣本分為四個(gè)階段:NT期、IEN期(包括LGIN和HGIN期)、IFT期(從LP至SMIB期)、以及晚期結(jié)直腸癌期(從T2至T4期)。
福爾馬林固定、石蠟包埋標(biāo)本的采集和處理
所有福爾馬林固定石蠟包埋 (FFPE) 標(biāo)本均由復(fù)旦大學(xué)中山醫(yī)院制備和提供。如腫瘤的靶向用藥基因檢測基因檢測所述,對于臨床樣本制備,對 FFPE 塊的載玻片 (10 μm 厚) 進(jìn)行大體解剖,用二甲苯脫蠟,并用乙醇清洗。將 FFPE 塊切成 3 μm 厚的切片,進(jìn)行蘇木精和伊紅染色。所有亞期標(biāo)本均由兩名以上經(jīng)驗(yàn)豐富且獲得委員會(huì)認(rèn)證的胃腸道病理學(xué)家刮取、評估和確認(rèn),并將材料分裝并儲(chǔ)存在 –80°C 下,直至進(jìn)一步處理。
左側(cè)結(jié)腸直腸癌和右側(cè)結(jié)腸直腸癌樣本
根據(jù)結(jié)直腸癌患者病變部位,將其分為三組:單獨(dú)左側(cè)結(jié)直腸癌組,僅患有左側(cè)結(jié)直腸癌;單獨(dú)右側(cè)結(jié)直腸癌組,僅患有右側(cè)結(jié)直腸癌;混合組,即左側(cè)和右側(cè)結(jié)直腸癌均有記載。在主要隊(duì)列中,混合組記錄了左側(cè)和右側(cè)結(jié)直腸癌。結(jié)直腸癌腫瘤基因檢測有效性僅收集其中一個(gè)部位(左側(cè)或右側(cè))的病變,收集腫瘤位置相應(yīng)側(cè)的正常組織。在驗(yàn)證隊(duì)列中,混合組同時(shí)患有左側(cè)和右側(cè)結(jié)直腸癌,收集腫瘤組織和相應(yīng)的正常組織。驗(yàn)證隊(duì)列中所有結(jié)直腸癌樣本(n = 60)均切成 3 mm 厚的切片,然后在蘇木精和伊紅染色的切片上進(jìn)行標(biāo)記。所有正常/腫瘤樣本均從 FFPE 載玻片上分別解剖,并由兩名以上經(jīng)驗(yàn)豐富的胃腸病理學(xué)家進(jìn)行評估。
全外顯子組測序
全外顯子組測序(WES)由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司完成。如腫瘤基因解碼基因檢測中所述,從FFPE腫瘤組織樣本中采集DNA,從NT組織樣本中獲得匹配的種系DNA。對37例106個(gè)樣本進(jìn)行了WES分析,方法的細(xì)節(jié)由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司提供。使用Qubit 2.0(Thermo Fisher Scientific)對得到的序列文庫(雙端序列和兩端之間的插入DNA)進(jìn)行定量,使用Agilent 2100生物分析儀(RRID:SCR_018043)測定插入片段大小。使用堿基調(diào)用從原始圖像數(shù)據(jù)中獲取原始數(shù)據(jù)(測序讀?。?/p>
DNA 提取和 DNA 鑒定
對37例結(jié)直腸癌病例的106個(gè)樣本進(jìn)行了WES分析,方法學(xué)細(xì)節(jié)由佳學(xué)基因靶向藥物基因檢測提供。所有樣本首先用二甲苯脫蠟,然后在1%瓊脂糖凝膠上監(jiān)測DNA降解和污染。隨后,使用Qubit DNA分析在Qubit 2.0熒光計(jì)(Invitrogen)中測量DNA濃度。每個(gè)樣本至少使用0.6 μg基因組DNA作為DNA樣本制備的輸入。
文庫制備
方法學(xué)細(xì)節(jié)由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司提供。每個(gè)樣本的基因組 DNA 量為 0.6 μg,用于 DNA 樣本制備。按照制造商的建議,使用 Agilent SureSelect Human All Exon 試劑盒(安捷倫科技)生成測序文庫,并為每個(gè)樣本添加索引代碼。
使用流體力學(xué)剪切系統(tǒng)(Covaris)進(jìn)行片段化,隨機(jī)生成180至280 bp的片段。剩余的突出端通過外切酶/聚合酶活性轉(zhuǎn)化為平端。在DNA片段的3′端腺苷酸化后,連接接頭寡核苷酸。在PCR中選擇性富集兩端連接有接頭分子的DNA片段。PCR后,用生物素標(biāo)記的探針將文庫與液相雜交,然后使用含有鏈霉素的磁珠捕獲基因的外顯子。在PCR中富集捕獲的文庫以添加索引標(biāo)簽以準(zhǔn)備測序。使用AMPure XP系統(tǒng)(Beckman Coulter)純化產(chǎn)物,并使用Agilent Bioanalyzer 2100系統(tǒng)上的Agilent高靈敏度DNA分析進(jìn)行定量。
使用 HiSeq PE 聚類試劑盒(Illumina),按照制造商的說明,在 cBot 聚類生成系統(tǒng)上對索引編碼樣本進(jìn)行聚類。聚類生成后,在 Illumina HiSeq 平臺(tái)上對 DNA 文庫進(jìn)行測序,并生成 150 bp 的雙端讀取。
數(shù)據(jù)處理和分析的質(zhì)量控制
具體實(shí)驗(yàn)與操作方法由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司提供。雙端測序(PE150)在 Illumina HiSeq(Illumina NovaSeq 6000)上進(jìn)行。使用 Qubit 2.0(Thermo Fisher Scientific)對得到的序列文庫(雙端序列和兩端之間的插入片段 DNA)進(jìn)行定量,使用 Agilent 2100 生物分析儀測定插入片段大小。從 HiSeq 平臺(tái)獲取的原始熒光圖像文件通過堿基調(diào)用轉(zhuǎn)換為短讀(原始數(shù)據(jù)),并將這些短讀記錄為 FASTQ 格式,其中包含序列信息和相應(yīng)的測序質(zhì)量信息。使用堿基調(diào)用從原始圖像數(shù)據(jù)中獲取原始數(shù)據(jù)(測序讀段)。
質(zhì)量控制:
- (一)如果任一讀取包含適配器污染(與適配器對齊的核苷酸 > 10 個(gè),允許≤10%的錯(cuò)配),則丟棄配對讀??;
- (二)如果任一讀取中超過 10% 的堿基不確定,則丟棄配對讀??;
- (三)如果任一讀取中低質(zhì)量(Phred 質(zhì)量 < 5)堿基的比例超過 50%,則丟棄配對讀取。
所有下游生物信息學(xué)分析均以高質(zhì)量的干凈數(shù)據(jù)為基礎(chǔ),保留干凈數(shù)據(jù),同時(shí)計(jì)算并匯總質(zhì)控統(tǒng)計(jì)數(shù)據(jù),包括總read數(shù)、原始數(shù)據(jù)、原始深度、測序錯(cuò)誤率、Q30(Phred-scaled質(zhì)量得分>30的堿基百分比)reads百分比、QC內(nèi)容分布等。
讀取映射到參考序列
方法的細(xì)節(jié)由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司提供。使用 Burrows–Wheeler Aligner(BWA)軟件(RRID:SCR_010910)將有效測序數(shù)據(jù)比對到參考人類基因組(UCSC hg19),以獲得以 BAM 格式存儲(chǔ)的原始比對結(jié)果。如果一個(gè)或一對讀取被映射到多個(gè)位置,BWA 采用的策略是選擇最可能的位置。如果存在兩個(gè)或兩個(gè)以上最可能的位置,BWA 會(huì)隨機(jī)挑選一個(gè),然后使用 SAMtools(RRID:SCR_002105)和 Picard(http://broadinstitute.github.io/picard/,RRID:SCR_006525)對 BAM 文件進(jìn)行排序,并進(jìn)行重復(fù)標(biāo)記、局部重新比對和堿基質(zhì)量重新校準(zhǔn),以生成最終的 BAM 文件,用于計(jì)算序列覆蓋率和深度。由于存在錯(cuò)配(包括真突變和測序錯(cuò)誤)以及 PCR 擴(kuò)增導(dǎo)致的重復(fù),映射步驟非常困難。這些重復(fù)讀取沒有信息量,不應(yīng)被視為變異的證據(jù)。使用 Picard(RRID:SCR_006525)標(biāo)記這些重復(fù),以便進(jìn)行后續(xù)分析。
體細(xì)胞突變的檢測和調(diào)用
方法學(xué)細(xì)節(jié)由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司提供。使用BWA和Samblaster進(jìn)行基因組比對,使用MuTect軟件(RRID:SCR_000559)定位體細(xì)胞單核苷酸變異位點(diǎn),使用Strelka檢測體細(xì)胞INDEL信息。本文使用的統(tǒng)計(jì)數(shù)據(jù)包括適度t統(tǒng)計(jì)量和Fisher精確檢驗(yàn)。
新突變的獲得
為了探究結(jié)直腸癌致癌過程中各個(gè)階段的突變情況,首先統(tǒng)計(jì)每個(gè)階段的突變,然后重點(diǎn)關(guān)注新突變的獲得。在結(jié)直腸癌基因解碼基因檢測中,新突變意味著只在某個(gè)階段發(fā)生,而不是在更早的階段存在。例如,如果AFP在LGIN階段未發(fā)生突變,而在HGIN階段發(fā)生突變,則AFP在HGIN階段即為新突變。某一階段的新突變也可以反映特定突變在結(jié)直腸癌進(jìn)展中的作用。
檢測到的突變對蛋白質(zhì)和磷蛋白水平的影響
體細(xì)胞拷貝數(shù)改變及其對蛋白質(zhì)組的影響
對于體細(xì)胞拷貝數(shù)變異 (SCNA) 分析,使用了在體細(xì)胞突變檢測流程中處理的 WES 衍生 BAM 文件。為了研究SCNA 在 chr20q 增加和 chr17q 丟失時(shí)的順式/反式效應(yīng),重點(diǎn)研究了在 SCNA 和蛋白質(zhì)水平上均檢測到的基因,然后計(jì)算了斯皮爾曼相關(guān)系數(shù) (FDR < 0.05)。
定義癌癥相關(guān)基因
癌癥相關(guān)基因 (CAG) 是根據(jù) Bailey 及其同事定義并由 Mertins 及其同事列出的基因匯編而成的。CAG 列表請查閱《人體基因序列變與人的疾病表征》數(shù)據(jù)庫。
蛋白質(zhì)提取和胰蛋白酶消化
如前文所述,所有標(biāo)本均采用顯微切割技術(shù)進(jìn)行切割,收集于1.5 mL EP管中,保存于-80℃冰箱中。每片F(xiàn)FPE切片厚度為10 μM,每個(gè)亞組標(biāo)本細(xì)胞數(shù)不超過10,000個(gè)。
將 50 μL Tris(2-羧基乙基)-膦-HCl 緩沖液(2% 脫氧膽酸鈉鹽(Solarbio,目錄號 D8330)、40 mmol/L 2-氯乙酰胺(Aldrich,目錄號 22790-250G-F)、100 mmol/L Tris-膦鹽酸鹽(Amresco,目錄號 0497)、10 mmol/L(2-羧基)-膦鹽酸鹽(Aldrich,目錄號 4706-10G)和 1 mmol/L 苯甲基磺酰氟(Amresco,目錄號 M145-5G)與質(zhì)譜 (MS) 級水(JT Baker,目錄號 4218-03,pH 8.8)混合,加入裝有制備樣品的 1.5 mL EP 管中,然后在99°C 金屬浴中加熱 30 分鐘。冷卻至室溫后,向每管中加入 3 μg 胰蛋白酶(Promega,目錄號 V528A),并在 37°C 培養(yǎng)箱中消化 18 小時(shí)。然后,向每管中加入 13 μL 10% 甲酸 (FA;Sigma,目錄號 F0507),渦旋 3 分鐘,然后離心 5 分鐘(12,000 g)。之后,使用新的 1.5 mL 管和 350 μL 緩沖液[0.1% FA 在 50% 乙腈 (ACN;JT Baker,目錄號 9830-03)] 收集上清液進(jìn)行提?。u旋 3 分鐘,然后在 12,000 g下離心5 分鐘)。將上清液轉(zhuǎn)移到新管中并在 60°C 下真空干燥。干燥后用100 μL 0.1% FA溶解多肽,旋渦混合,離心3 min(12 000 g),將上清液收集至新管中脫鹽。脫鹽前需用兩片3M C18 盤片對柱子進(jìn)行活化,活化液為:90 μL 100% ACN 2次,90 μL 50%和80% ACN 依次活化1次,90 μL 50% ACN 1次。然后將上清液裝入柱子2次,再用90 μL 0.1% FA 凈化2次。最后加入90 μL 洗脫緩沖液(0.1% FA in 50% ACN)洗脫2次,僅收集流出液進(jìn)行MS分析。將收集液在60°C下真空干燥(約1.5小時(shí))。
使用 LC-MS/MS 分析進(jìn)行蛋白質(zhì)組分析
如我們之前的研究(16、17、21)中所述,對于樣品的蛋白質(zhì)組學(xué)分析,使用 Q Exactive HF-X 混合四極桿軌道阱質(zhì)譜儀(賽默飛世爾科技)結(jié)合高效液相色譜系統(tǒng)(EASY-nLC 1200,賽默飛世爾科技)對肽進(jìn)行分析。將干燥的肽樣品重新溶解在溶劑 A(水中 0.1% FA)中,然后使用溶劑 A 將其裝入 2 cm 自填充捕獲柱(內(nèi)徑 100 μm,實(shí)踐尺寸 3 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),并在 150 μm 內(nèi)徑、長度 15 cm 的柱上進(jìn)行分離(實(shí)踐尺寸 1.9 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),梯度洗脫時(shí)間為 150 分鐘(溶劑 A:水中 0.1% FA;溶劑 B:80% ACN 中的 0.1% FA),恒定流速為 600 nL/分鐘(0-150 分鐘,0 分鐘,4% B;0-10 分鐘,4%-15% B;10-125 分鐘, 15%–30% B;125–140分鐘,30%–50% B;140–141分鐘,50%–100% B;141–150分鐘,100% B)。將洗脫的肽在2.0 kV下電離并引入質(zhì)譜儀)。MS在數(shù)據(jù)依賴性采集模式下執(zhí)行。對于MS1光譜全掃描,使用Orbitrap質(zhì)譜分析儀以120,000的高分辨率采集m/z范圍為300至1,400的離子。自動(dòng)增益控制(AGC)目標(biāo)值設(shè)置為3E6。最大離子注入時(shí)間為80 ms。MS2光譜采集在離子阱模式下快速進(jìn)行。選擇前體離子并以更高能量碰撞解離碎裂,標(biāo)準(zhǔn)化碰撞能量為27%。使用離子阱質(zhì)譜分析儀分析碎片離子,AGC 目標(biāo)為 5E4。MS2 的最大離子注入時(shí)間為 20 毫秒。觸發(fā) MS/MS 掃描的肽在 12 秒內(nèi)被動(dòng)態(tài)排除在進(jìn)一步的 MS/MS 掃描之外。
對于磷酸化蛋白質(zhì)組學(xué)樣品,使用 Q Exactive HF-X 混合四極桿軌道阱質(zhì)譜儀(賽默飛世爾科技)結(jié)合高效液相色譜系統(tǒng)(EASY-nLC 1200,賽默飛世爾科技)對肽進(jìn)行分析。將干燥的肽樣品重新溶解在溶劑 A(水中含 0.1% FA)中,使用溶劑 A 將其裝入 2 cm 自填充捕獲柱(內(nèi)徑 100 μm,實(shí)踐尺寸 3 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),并在 150 μm 內(nèi)徑、長度 30 cm 的柱上進(jìn)行分離(實(shí)踐尺寸 1.9 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),在 150 分鐘的梯度(緩沖液 A:水中含 0.1% 甲酸;緩沖液 B:80% ACN 中含 0.1% FA)下以 600 nL/分鐘的恒定流速進(jìn)行分離(0-150 分鐘,0 分鐘,4% B;0-10 分鐘,4%-15% B;10-125 分鐘, 15%–30% B;125–140 分鐘,30%–50% B;140–141 分鐘,50%–100% B;141–150 分鐘,100% B)。洗脫的磷酸肽被電離并使用 Q Exactive HF-X 混合四極桿軌道阱質(zhì)譜檢測。質(zhì)譜采集范圍為 m/z 300 至 1,400,分辨率為 120,000(AUG 目標(biāo)值為 3E+06,最大注射時(shí)間為 80 毫秒)。對于 MS2 掃描,在標(biāo)準(zhǔn)化碰撞能量為 30% 的情況下執(zhí)行更高能量碰撞解離碎片。MS2 AGC 目標(biāo)設(shè)置為 5E4,最大注射時(shí)間為 100 毫秒。選擇肽模式進(jìn)行單同位素前體掃描,并啟用電荷狀態(tài)篩選以拒絕未分配的 1+、7+、8+ 和 >8+ 離子,動(dòng)態(tài)排除時(shí)間為 40 秒,以區(qū)分±10 ppm 之間先前分析的離子。
磷酸肽富集與分析
所有符合要求的分析數(shù)據(jù)均在 Firmiana 平臺(tái)上根據(jù) NCBI 中的人類 RefSeq 蛋白質(zhì)數(shù)據(jù)庫(更新于 2013-07-04;RRID:SCR_003496)進(jìn)行處理。由于樣本量有限,只有來自 36 名結(jié)腸直腸癌患者的 101 個(gè)樣本適合進(jìn)行磷酸化蛋白質(zhì)組分析:NT 期(n = 31)、LGIN 期(n = 23)、HGIN 期(n = 17)、LP 期(n = 6)、MM 期(n = 7)、SMIA 期(n = 6)、SMIB 期(n = 3)、T2 期(n = 3)、T3 期(n = 3)和 T4 期(n = 2;補(bǔ)充表 S1D)。
如腫瘤發(fā)生的基因解碼技術(shù)方案中所述,根據(jù)制造商的說明,使用 Fe-NTA 磷酸肽富集試劑盒(Thermo Fisher Scientific,目錄號 A32992)制備磷酸化蛋白質(zhì)組樣品。簡而言之,將 2 mg 肽懸浮在 200 μL 結(jié)合/洗滌緩沖液中,并加載到平衡的旋轉(zhuǎn)柱中。輕輕拍打使樹脂與樣品混合。將混合物孵育 30 分鐘,以 1,000 × g離心 30 秒以棄去流出物。然后用 200 μL 結(jié)合/洗滌緩沖液洗滌柱子,以 1,000 × g離心30 秒,共 3 次,再用 200 μL LC-MS 級水洗滌一次。用100 μL洗脫緩沖液洗脫磷酸肽,以1,000 × g離心30秒,重復(fù)2次。將磷酸肽干燥后進(jìn)行LC-MS/MS分析。
整體蛋白質(zhì)組數(shù)據(jù)和磷酸化蛋白質(zhì)組數(shù)據(jù)的量化
如結(jié)直腸癌的致病基因鑒定基因解碼所述,所有 MS 原始文件均在 Firmiana 平臺(tái)(一站式蛋白質(zhì)組學(xué)云平臺(tái):http://www.firmiana.org )上進(jìn)行處理,并在 Mascot 搜索引擎(版本 2.3,Matrix Science Inc.,RRID:SCR_014322)中根據(jù) NCBI 人類 RefSeq 蛋白質(zhì)數(shù)據(jù)庫(2013 年 4 月 7 日更新,32,015 個(gè)條目)進(jìn)行搜索。使用胰蛋白酶作為蛋白水解酶,最多允許兩次漏切。脲甲基 (C) 被視為固定修飾。對于蛋白質(zhì)組分析數(shù)據(jù),可變修飾是氧化 (M) 和乙?;ǖ鞍踪|(zhì) N 端)。對于磷酸化蛋白質(zhì)組數(shù)據(jù),可變修飾是氧化 (M)、乙酰化(蛋白質(zhì) N 端)和磷酸化 (S/T/Y)。所有已鑒定的肽均在 Firmiana 平臺(tái)上定量,峰面積由其 MS1 強(qiáng)度得出。通過 Q-Exactive HFX 收集的母體和產(chǎn)物的質(zhì)量公差分別為 20 ppm 和 50 mmu。母體離子分電荷限制為 +2、+3 和 +4。肽譜匹配和蛋白質(zhì)的 FDR 設(shè)定為最大 1%。我們的研究采用了無標(biāo)記蛋白質(zhì)定量,即所謂的 iBAQ 算法,該算法將蛋白質(zhì)豐度(由已鑒定肽的強(qiáng)度得出)除以理論上可觀察到的肽的數(shù)量。然后,總量的分?jǐn)?shù)(定義為蛋白質(zhì)的 iBAQ 除以一個(gè)樣本中所有已鑒定蛋白質(zhì)的總 iBAQ)用于表示特定蛋白質(zhì)在樣本中的標(biāo)準(zhǔn)化豐度。
數(shù)據(jù)歸納
如結(jié)直腸癌的致病基因鑒定基因解碼所述,對于研究中的缺失值,首先應(yīng)用了運(yùn)行間匹配算法,該算法已被證明是一種有效的填充缺失值的技術(shù)。簡而言之,根據(jù)樣品中的常見識別肽建立了一個(gè)動(dòng)態(tài)回歸函數(shù)。根據(jù)相關(guān)值R 2,函數(shù)選擇線性或二次函數(shù)進(jìn)行回歸計(jì)算相應(yīng)隱藏肽的保留時(shí)間(RT),并根據(jù) m/z 和計(jì)算出的 RT 檢查提取離子色譜圖的存在。該函數(shù)評估所顯示的提取離子色譜圖的峰面積值。這些峰面積值被視為相應(yīng)蛋白質(zhì)的一部分。
層次聚類分析
如結(jié)直腸癌的致病基因鑒定基因解碼所述所述,在 R (版本 3.5.1) 中實(shí)現(xiàn)了層次聚類分析和主成分分析 (PCA),以評估我們的蛋白質(zhì)組數(shù)據(jù)集中關(guān)于以下兩個(gè)變量的批次效應(yīng):批次身份和樣本類型 (亞階段/亞型/面板)。對于層次聚類分析,首先研究了同一亞階段中樣本的成對 Spearman 相關(guān)系數(shù)。為此,同一類型的樣本表現(xiàn)出較高的相似性,而不同亞型的樣本明顯不同。此外,使用了平均鏈接算法,以一減去 Spearman 相關(guān)系數(shù)作為相異度度量。
在全局熱圖中,全局蛋白質(zhì)組表達(dá)矩陣中的每個(gè)蛋白質(zhì)表達(dá)值都轉(zhuǎn)換為所有樣本的Z分?jǐn)?shù)。對于樣本和蛋白質(zhì)聚類,距離設(shè)置為“歐幾里得”距離,權(quán)重方法為“完整”。使用 R 包 pheatmap(版本 1.0.12,RRID:SCR_016418)對Z分?jǐn)?shù)轉(zhuǎn)換后的矩陣進(jìn)行聚類。
差異蛋白質(zhì)組學(xué)分析和通路富集
為了比較結(jié)直腸癌進(jìn)展過程中不同階段的差異表達(dá)蛋白(DEP)(圖1),關(guān)注每個(gè)階段的蛋白質(zhì)豐度(平均值),這些蛋白質(zhì)由京都基因和基因組百科全書(KEGG;RRID:SCR_012773)/基因本體(GO;RRID:SCR_002811)數(shù)據(jù)庫和 ConsensusPathDB(http://cpdb.molgen.mpg.de/,RRID:SCR_002231 )富集。然后,我們注釋了信號通路(調(diào)整。FDR < 0.05)并手動(dòng)檢查通路相關(guān)蛋白,然后估計(jì)這些蛋白是否與結(jié)直腸癌分期顯著相關(guān)(Kruskal-Wallis 檢驗(yàn),調(diào)整。P < 0.05)。
為了分析KRAS和BRAF突變的不同功能(圖2),分別對KRAS突變組與野生型(WT)組、BRAF突變組與WT組進(jìn)行DEP檢驗(yàn)(Wilcoxon秩和檢驗(yàn),F(xiàn)DR < 0.05,Mut vs. WT比例≥2),然后基于基因集富集分析(GSEA)進(jìn)行比較分析。
為了在磷蛋白水平分析KRAS和BRAF突變?nèi)绾卧诮Y(jié)直腸癌進(jìn)展中調(diào)控不同的功能(圖2 ),我們分別在KRAS突變組與WT組之間、BRAF突變組與WT組之間進(jìn)行了DEP分析(Wilcoxon秩和檢驗(yàn),F(xiàn)DR < 0.05,Mut vs. WT比例≥ 2,Phos vs. Pro≥ 2),并對KRAS突變組和BRAF突變組的磷酸化蛋白質(zhì)組進(jìn)行激酶-底物富集分析(KSEA),建立KRAS突變-激酶-底物網(wǎng)絡(luò)和BRAF突變-激酶-底物網(wǎng)絡(luò)。
為了在磷酸化蛋白水平分析DDX5缺失和TOP1擴(kuò)增對細(xì)胞周期的影響(圖3),對DDX5缺失組與WT組、TOP1擴(kuò)增組與WT組進(jìn)行DEP檢驗(yàn)(Wilcoxon秩和檢驗(yàn),F(xiàn)DR < 0.05,Del/Amp vs. WT比例≥2,Phos vs. Pro≥2),然后應(yīng)用KEGG/GO數(shù)據(jù)庫進(jìn)行通路富集,并對DDX5缺失組和TOP1擴(kuò)增組的磷酸化蛋白質(zhì)組進(jìn)行KSEA,建立DDX5缺失-激酶-底物網(wǎng)絡(luò)和TOP1擴(kuò)增-激酶-底物網(wǎng)絡(luò)。
為分析KRAS與TP53共突變的功能(圖4),建立4組:KRAS WT和TP53 WT(KRAS WT/ TP53 WT)組、KRAS WT和TP53 Mut(KRAS WT/ TP53 Mut)組、KRAS Mut和TP53 WT(KRAS Mut/ TP53 WT)組、KRAS Mut和TP53 Mut(KRAS Mut/ TP53 Mut)組。利用4組間的DEPs進(jìn)行通路富集分析(Kruskal–Wallis檢驗(yàn),F(xiàn)DR < 0.05),然后應(yīng)用KEGG/GO數(shù)據(jù)庫進(jìn)行通路富集分析。
為了分析左側(cè)結(jié)直腸癌單獨(dú)組和右側(cè)結(jié)直腸癌單獨(dú)組之間的差異(圖5),收集了435個(gè)樣本的主要隊(duì)列和另一個(gè)包含60個(gè)樣本的獨(dú)立驗(yàn)證隊(duì)列,并在左側(cè)結(jié)直腸癌單獨(dú)組和右側(cè)結(jié)直腸癌單獨(dú)組之間應(yīng)用DEP(Wilcoxon秩和檢驗(yàn),F(xiàn)DR < 0.05,左側(cè)結(jié)直腸癌與右側(cè)結(jié)直腸癌的比例≥2或≤0.5)。在混合組中,在正常組織和腫瘤組織之間應(yīng)用DEP(Wilcoxon秩和檢驗(yàn),F(xiàn)DR < 0.05,正常與腫瘤的比例≥2或≤0.5)。為了分析左側(cè)結(jié)直腸癌/右側(cè)結(jié)直腸癌與混合組的差異,采用左側(cè)結(jié)直腸癌/右側(cè)結(jié)直腸癌與混合組之間的DEP(Wilcoxon秩和檢驗(yàn),F(xiàn)DR < 0.05,左側(cè)結(jié)直腸癌/右側(cè)結(jié)直腸癌與混合比≥2或≤0.5),然后應(yīng)用KEGG/GO數(shù)據(jù)庫進(jìn)行通路富集。
為了分析基于 CMS 和 CRIS 分類的進(jìn)展路徑(圖 6),我們評估了結(jié)直腸癌進(jìn)展過程中不同階段的 DEP(Kruskal-Wallis 檢驗(yàn),F(xiàn)DR < 0.05),然后通過 KEGG/GO 數(shù)據(jù)庫和 ConsensusPathDB(http://cpdb.molgen.mpg.de/)進(jìn)行富集。然后我們注釋了信號通路(FDR < 0.05)并手動(dòng)檢查了通路相關(guān)蛋白,然后估計(jì)這些是否與結(jié)直腸癌的分期顯著相關(guān)(Kruskal-Wallis 檢驗(yàn),F(xiàn)DR < 0.05)。
為了分析 MSI 和 MSS 之間的差異(圖 7),我們使用了 MSI 和 MSS 腫瘤之間的 DEP(Wilcoxon 秩和檢驗(yàn),F(xiàn)DR < 0.05,MSI 與 MSS 比率 ≥ 2 或 ≤ 0.5),然后應(yīng)用 GSEA 進(jìn)行通路富集。
為了分析AOM/DSS導(dǎo)入結(jié)直腸癌小鼠模型三組(對照組、第I周期組、第II周期組)的分子特征(圖8 ),采用各組高表達(dá)蛋白(Kruskal-Wallis檢驗(yàn),F(xiàn)DR < 0.05),然后使用ConsensusPathDB( http://cpdb.molgen.mpg.de/ )進(jìn)行富集。
構(gòu)建和驗(yàn)證預(yù)測模型以區(qū)分KRAS Mut/ TP53 Mut 與其他、結(jié)直腸癌肝轉(zhuǎn)移與 WT
使用 R 軟件 v3.5.1,基于 20 種蛋白采用二項(xiàng) Logistic 回歸分析構(gòu)建區(qū)分KRAS Mut/ TP53 Mut 與其他、結(jié)直腸癌肝轉(zhuǎn)移與 WT 的預(yù)測模型。采用后向逐步法進(jìn)行特征選擇。將樣本隨機(jī)分為訓(xùn)練集和測試集。此外,使用 ROC 分析(pROC R 包版本 1.16.2 和 caret R 包版本 6.0-86)驗(yàn)證該模型的診斷價(jià)值。使用靈敏度、特異度、準(zhǔn)確度和 AUC 確定預(yù)測值。在驗(yàn)證隊(duì)列中對預(yù)測模型進(jìn)行驗(yàn)證。
補(bǔ)體級聯(lián)和細(xì)胞外基質(zhì)信號傳導(dǎo)評分
使用 R 包 GSVA,利用單樣本 GSEA 根據(jù)蛋白質(zhì)組學(xué)數(shù)據(jù)為每個(gè)樣本獲得分?jǐn)?shù)。使用 Pearson 相關(guān)性確定基質(zhì)分?jǐn)?shù)與補(bǔ)體級聯(lián)/細(xì)胞外基質(zhì) (ECM) 信號之間的相關(guān)性。使用 R 包 GSVA 中實(shí)現(xiàn)的單樣本 GSEA 執(zhí)行推斷的補(bǔ)體級聯(lián)和 ECM 信號分?jǐn)?shù)。
激酶活性預(yù)測和磷酸肽分析
使用 MaxQuant(RRID:SCR_014485)在同一數(shù)據(jù)庫中搜索 101 份結(jié)直腸癌樣本的磷酸化蛋白質(zhì)組數(shù)據(jù)。如我們之前的研究(16、17)所述,將S 或 T 或 Y 的磷酸化設(shè)置為可變修飾,其中允許 3 次錯(cuò)誤切割,光譜匹配的最低 Andromeda 評分為 40。所有樣品中已鑒定的磷酸化位點(diǎn)的比例用于通過 KSEA 算法估算激酶活性。激酶-底物關(guān)系的信息來自公開數(shù)據(jù)庫,包括 PhosphoSite(RRID:SCR_001837)、Phospho.ELM(RRID:SCR_001109)和 PhosphoPOINT(RRID:SCR_002109)。底物基序的信息來自文獻(xiàn)或使用 Motif(sP)分析 KSEA 數(shù)據(jù)集獲得。激酶-底物-基序網(wǎng)絡(luò)分析參考自 PhosphoSitePlus ( https://www.phosite.org/homeAction , RRID: SCR_001837) 和 NetworKIN 3.0 (RRID: SCR_007818)。使用 R (版本 3.5.1) 中的 Kruskal–Wallis 檢驗(yàn)進(jìn)行統(tǒng)計(jì)分析。
軌跡推理方法和進(jìn)展路徑分析
我們利用單片眼鏡(版本 2.10.1)和軌跡推斷方法追蹤 148 名早期結(jié)直腸癌患者的譜系。如我們之前的研究(16、17)所述,突出顯示并篩選了平均表達(dá)量超過 1.0E−1 的蛋白質(zhì)。使用 R(版本3.5.1)中 Rtsne(版本 0.15)的 Barnes–Hut 實(shí)現(xiàn)對數(shù)據(jù)集進(jìn)行聚類并通過 t 分布隨機(jī)鄰域嵌入進(jìn)行預(yù)處理。每位早期結(jié)直腸癌患者的所有階段都被視為偽時(shí)間,以構(gòu)建基于 CMS 和 CRIS 的亞型分類中結(jié)直腸癌患者的軌跡。
單元格
HEK293T 細(xì)胞系 (Cat# CRL-11268, RRID: CVCL_QW54)、HCT116 細(xì)胞系 (Cat# CCL-247, RRID: CVCL_0291)、SW480 細(xì)胞系 (Cat# CCL-228, RRID: CVCL_0546) 和 SW620 細(xì)胞系 (Cat# CCL-227, RRID: CVCL_0547) 均購自 ATCC。HEK293T 細(xì)胞、HCT116 細(xì)胞、SW480 細(xì)胞和 SW620 細(xì)胞在 DMEM/高葡萄糖培養(yǎng)基 (HyClone) 中培養(yǎng),培養(yǎng)基中添加 10% FBS (BI)、100 U/mL 青霉素和 100 μg/mL 鏈霉素 (Sangon Biotech)。所有細(xì)胞均在 37°C 的加濕培養(yǎng)箱中培養(yǎng),培養(yǎng)液中含有 5% CO 2。通過短串聯(lián)重復(fù)分析(Cell ID,Promega)確認(rèn)細(xì)胞系的遺傳身份,最后于 2023 年 12 月重復(fù)一次。使用Venor GeM Kit(Minerva Biolabs)定期檢測細(xì)胞是否感染支原體,所有細(xì)胞系的支原體污染檢測結(jié)果均為陰性。
IHC 分析
2008 年 6 月至 2018 年 12 月,上海交通大學(xué)醫(yī)學(xué)院新華醫(yī)院收集了用于組織陣列的人類結(jié)直腸癌樣本。所有樣本收集均獲得了機(jī)構(gòu)審查委員會(huì)的批準(zhǔn)和知情同意(n = 244)。根據(jù)一般方案對組織陣列進(jìn)行 IHC 染色,使用 DDX5 兔抗體(Abcam,目錄號 ab126730,RRID:AB_11130291,稀釋度 1:250)分析 DDX5 的表達(dá)。通過染色強(qiáng)度和染色百分比對 IHC 的半定量分析進(jìn)行評分。
逆轉(zhuǎn)錄病毒的包裝和感染
為了生成針對人類 DDX5 過度表達(dá)的逆轉(zhuǎn)錄病毒,將目標(biāo)序列克隆到 pBABE-FLAG-puro 載體中。為了生成針對人類 DDX5 的逆轉(zhuǎn)錄病毒 shRNA 構(gòu)建體,將目標(biāo)序列克隆到 pMKO.1 puro 載體(Addgene,Cat# 8452,RRID:Addgene_8452)中。shRNA 序列如下:
shDDX5:5?-AGG?TGG?AAA?CAT?ACA?GAA?GAA-3?
細(xì)胞增殖
將細(xì)胞接種于 96 孔板中,密度為每孔 4,000 個(gè)細(xì)胞(HCT116 細(xì)胞、SW480 細(xì)胞和 SW620 細(xì)胞)。根據(jù)制造商的方案,使用 Cell Counting Kit-8(Dojindo)測定細(xì)胞數(shù)。簡而言之,將培養(yǎng)基替換為 100 μL 新鮮培養(yǎng)基,其中含有 10 μL CCK8。在 37°C 下孵育 3 小時(shí)后,將培養(yǎng)板搖動(dòng) 5 分鐘,并在 450 nm 處讀取光密度值。
小鼠異種移植體外研究
裸鼠(4-6 周齡,雄性,n = 32)來自中國上海 SLAC 實(shí)驗(yàn)室動(dòng)物有限責(zé)任公司。所有小鼠程序均經(jīng)新華醫(yī)院動(dòng)物護(hù)理和使用委員會(huì)批準(zhǔn)(XHEC-NSFC-2021-326)。將 pMKO-Control、pMKO-shDDX5、pBABE-Control 和 pBABE-oeDDX5 細(xì)胞(1 × 10 6)分別懸浮在 100 mL 1 × PBS 中,然后皮下注射到雙側(cè)腋窩脂肪墊中。21 天后,通過脫頸法處死小鼠。解剖腫瘤、成像并稱重。收集腫瘤組織,在 10% 中性緩沖福爾馬林中固定,以備后續(xù)分析。
AOM/DSS誘發(fā)的小鼠結(jié)直腸癌模型
小鼠稱重后,第 1 天腹腔注射 AOM(6-8 周齡,10 mg kg −1體重,溶于 PBS),然后從第 2 天開始,以 1.25%–1.5%–1.75% 的濃度逐步增加的方式,進(jìn)行 3 次 DSS 溶解在飲用水中。在每個(gè) DSS 周期中,小鼠飲用 DSS 水 7 天,然后在下一個(gè)周期前停止 14 天。在本研究中,小鼠在第 21 天(周期 I,n = 4)和第 44 天(周期 II,n = 5)處死??v向解剖結(jié)腸后計(jì)算并拍照。具體而言,周期 I 和周期 II 中的腫瘤代表早期和晚期的樣本。所有小鼠(n = 13)均飼養(yǎng)在無病原體動(dòng)物設(shè)施(新華醫(yī)院動(dòng)物護(hù)理和使用委員會(huì),XHEC-NSFC-2021-326)的通風(fēng)籠中,可自由飲水和食用標(biāo)準(zhǔn)嚙齒動(dòng)物飲食。小鼠在受控溫度(22°±2°)和 12 小時(shí)明暗循環(huán)下飼養(yǎng)。
免疫沉淀
對于免疫沉淀,用含有 50 mmol/L Tris-HCl(pH 7.5)、150 mmol/L NaCl 和多種蛋白酶抑制劑(苯甲基磺酰氟 1 mmol/L、抑肽酶 1 mg/mL、亮抑酶肽 1 mg/mL、胃酶抑素 1 mg/mL、Na 3 VO 4 1 mmol/L 和 NaF 1 mmol/L(用于乙?;瘜?shí)驗(yàn);另外還有 TSA 2.5 mmol/L 和 NAM 25 mmol/L,最終濃度為)的 1% Nonidet P40 緩沖液裂解細(xì)胞。將細(xì)胞裂解物與抗 FLAG M2 磁珠(Sigma)在 4°C 下孵育。用 NP40 緩沖液洗滌免疫復(fù)合物三次。然后使用指示的一抗檢查裂解物和免疫沉淀物。
使用的網(wǎng)站和下載的蛋白質(zhì)
在本研究中,為了下載巨噬細(xì)胞標(biāo)志物(圖 4),我們進(jìn)入了 CellMarker 網(wǎng)站(http://xteam.xbio.top/CellMarker/download.jsp ),并通過篩選出關(guān)鍵詞“巨噬細(xì)胞”下載了巨噬細(xì)胞相關(guān)標(biāo)志物數(shù)據(jù)庫(n = 285)。為了獲得錨定蛋白,我們進(jìn)入了人類蛋白質(zhì)圖譜(HPA; n = 49;https://www.proteinatlas.org ),并通過篩選出關(guān)鍵詞“錨定蛋白”下載了錨定蛋白數(shù)據(jù)庫(n = 49)。
量化和統(tǒng)計(jì)分析
所有數(shù)據(jù)均使用 R 和 GraphPad Prism 9 軟件進(jìn)行分析和繪圖,并使用 R(版本 3.5.1)進(jìn)行 Fisher 精確檢驗(yàn)、Bartlett 檢驗(yàn)、Kruskal-Wallis 檢驗(yàn)、Wilcoxon 符號秩檢驗(yàn)和 Spearman 相關(guān)性檢驗(yàn)。條形圖中的數(shù)據(jù)以平均值±SEM 表示。所有統(tǒng)計(jì)檢驗(yàn)均為雙尾,當(dāng)(調(diào)整后的)P值 < 0.05 時(shí)認(rèn)為具有統(tǒng)計(jì)學(xué)意義,使用 Benjamini-Hochberg 程序進(jìn)行調(diào)整。Kaplan-Meier 圖(對數(shù)秩檢驗(yàn))用于描述總體生存率。隨機(jī)選擇結(jié)直腸癌患者的組織樣本。為了驗(yàn)證本研究中的結(jié)果,每個(gè)實(shí)驗(yàn)至少獨(dú)立重復(fù)三次。所有實(shí)驗(yàn)均可靠地重現(xiàn)并在圖例、方法和材料以及結(jié)果中指明。箱線圖中的數(shù)據(jù)表示為中位數(shù)(中心線)、上四分位數(shù)和下四分位數(shù)(箱界)和 1.5× IQR(須)。對于樣品處理、PCA 和共識聚類分析,所有研究人員都對結(jié)果不知情。
(責(zé)任編輯:佳學(xué)基因)