【佳學(xué)基因檢測(cè)】基因解碼如何使用UCSC/Ensembl數(shù)據(jù)庫(kù)進(jìn)行基因檢測(cè)結(jié)果的分析
ANNOVAR 可以選擇處理 UCSC 已知基因注釋或 Ensembl 基因注釋,這兩種注釋都比 RefSeq 更全面,包括許多注釋不良或計(jì)算預(yù)測(cè)的基因。 下面顯示了使用 UCSC 已知基因注釋變體的示例:
[jiaxuejiyin@genejiedu ~/]$ annotate_variation.pl -out ex1 -build hg19 example/ex1.avinput humandb/ -dbtype knownGene NOTICE: The --geneanno operation is set to ON by default NOTICE: Reading gene annotation from humandb/hg19_knownGene.txt ... Done with 78963 transcripts (including 18502 without coding sequence annotation) for 28495 unique genes NOTICE: Reading FASTA sequences from humandb/hg19_knownGeneMrna.fa ... Done with 45 sequences WARNING: A total of 43 sequences will be ignored due to lack of correct ORF annotation NOTICE: Finished gene-based annotation on 15 genetic variants in example/ex1.avinput NOTICE: Output files were written to ex1.variant_function, ex1.exonic_variant_function
轉(zhuǎn)錄本名稱(在 ex1.exonic_variant_function 文件中)看起來(lái)像 uc002eg1.1 等,它們是 UCSC 基因標(biāo)識(shí)符。
要使用 Ensembl 基因注釋變體,請(qǐng)使用以下命令。 輸出格式與上面描述的類似。 “ENSG”和“ENST”是注釋基因和轉(zhuǎn)錄本的 Ensembl 標(biāo)識(shí)符。
[jiaxuejiyin@genejiedu ~/]$ annotate_variation.pl -out ex1 -build hg19 ex1.hg19.avinput humandb/ -dbtype ensGene
NOTICE: The --geneanno operation is set to ON by default
NOTICE: Reading gene annotation from humandb/hg19_ensGene.txt ... Done with 196501 transcripts (including 101155 without coding sequence annotation) for 57905 unique genes
NOTICE: Reading FASTA sequences from humandb/hg19_ensGeneMrna.fa ... Done with 20 sequences
WARNING: A total of 6780 sequences will be ignored due to lack of correct ORF annotation
NOTICE: Finished gene-based annotation on 15 genetic variants in example/ex1.avinput
NOTICE: Output files were written to ex1.variant_function, ex1.exonic_variant_function
由于輸出僅包含 Ensembl 標(biāo)識(shí)符,因此如果想將其翻譯為基因同義詞,可以下載 hg19 的此文件并自行使用兩列文件進(jìn)行翻譯。
比較來(lái)自三個(gè)不同基因定義系統(tǒng)的程序消息(“Done with xxxtranscripts for yyy uniquegenes”),可以看到,Ensembl 注釋了人類基因組中賊多數(shù)量的基因,而 RefSeq 注釋了賊少數(shù)量的基因。
基因解碼說(shuō)明:從技術(shù)上講,RefSeq 基因和 UCSC 基因是基于轉(zhuǎn)錄本的基因定義。 該數(shù)據(jù)庫(kù)根據(jù)轉(zhuǎn)錄數(shù)據(jù)建立了基因模型,然后將基因模型同人類基因組序列進(jìn)行比對(duì)。 相比之下,Ensemble Gene 和 Gencode Gene 是基于組裝的基因定義,試圖直接從人類基因組的參考序列構(gòu)建基因的判斷。 這兩個(gè)數(shù)據(jù)分析方法從不同的角度出發(fā),試圖做同一件事:將基因測(cè)序獲得的DNA序列給矛盾適當(dāng)?shù)幕蛎Q。
然而,這兩種分析方法會(huì)產(chǎn)生不同的分析結(jié)果。 例如,RefSeq 通過(guò)組裝群體中的轉(zhuǎn)錄數(shù)據(jù)來(lái)構(gòu)建基因模型,但參考人類基因組可能有一個(gè)等位基因是一個(gè)次要等位基因。 在這種情況下,獲得的序列可能無(wú)法與基因組 100% 對(duì)齊,從而導(dǎo)致基因測(cè)序結(jié)果的 FASTA 文件與從全基因組序列(通過(guò)將外顯子連接在一起)生成的 FASTA 文件之間存在差異。
由于這些原因,外顯子變異的正確注釋不能依賴于公共數(shù)據(jù)庫(kù)中的cDNA序列,而只能基于基因組本身中實(shí)際的chr:start-end位點(diǎn)。 為此,基因解碼針對(duì)幾個(gè)特定基因組構(gòu)建了FASTA序列,基因檢測(cè)機(jī)構(gòu)可以直接從ANNOVAR網(wǎng)站下載序列; 基因解碼還提供程序 (retrieve_seq_from_fasta.pl) 來(lái)為未提供預(yù)構(gòu)建文件的任何其他基因組構(gòu)建 FASTA 序列。
由于這些原因,基因解碼提供的文件中的 FASTA 序列可能與您從 RefSeq 獲得的 FASTA 序列不同。 ANNOVAR 使用的序列是基于特定基因組構(gòu)建和組裝的“理論”序列,但 RefSeq 編譯的 FASTA 序列是來(lái)自大型數(shù)據(jù)庫(kù)的“觀察到”序列,與特定組裝版本沒(méi)有任何關(guān)系。 它們可能具有相同的標(biāo)識(shí)符,但它們是不同的東西。
- 上一篇:【佳學(xué)基因檢測(cè)】2023年諾貝爾醫(yī)學(xué)獎(jiǎng),授予新冠病毒疫苗技術(shù)創(chuàng)新者!
- 下一篇:【佳學(xué)基因檢測(cè)】基因測(cè)序結(jié)果如何使用更新的Hg38數(shù)據(jù)庫(kù)進(jìn)行解碼分析
- 【佳學(xué)基因檢測(cè)】基因解碼與基因檢測(cè)的區(qū)別:科普解析...
- 【佳學(xué)基因檢測(cè)】如何通過(guò)基因解碼技術(shù)提高腫瘤靶向藥物和遺傳病鑒定的準(zhǔn)確性和檢出率...
- 【佳學(xué)基因檢測(cè)】多種多樣的基因檢測(cè)?...
- 【佳學(xué)基因檢測(cè)】人工智能加持下的基因檢測(cè)有什么優(yōu)勢(shì)?...
- 【佳學(xué)基因檢測(cè)】全基因組測(cè)序基因檢測(cè)(WGS)在臨床應(yīng)用中優(yōu)勢(shì)、困難和前景...
- 【佳學(xué)基因檢測(cè)】全基因組測(cè)序如何率先用于基因解碼生物醫(yī)學(xué)?...
- 【佳學(xué)基因檢測(cè)】如何在實(shí)體瘤的基因檢測(cè)中使用熒光原位雜交技術(shù)?...
- 【佳學(xué)基因檢測(cè)】免疫組織化學(xué) (IHC)、顯色原位雜交 (CISH) 和熒光原位雜交 (FISH) 技術(shù)的比較...
- 【佳學(xué)基因檢測(cè)】熒光原位雜交(FISH)在實(shí)體瘤診斷和個(gè)體化治療中的應(yīng)用...
- 【佳學(xué)基因檢測(cè)】腫瘤基因檢測(cè)為什么要納入正常組織樣本?...
- 【佳學(xué)基因檢測(cè)】基因檢測(cè)中的連鎖分析:科研服務(wù)...
- 【佳學(xué)基因檢測(cè)】心里所想直接以文字顯示! 讀心頭盔問(wèn)世 可翻譯人類腦電波...
- 【佳學(xué)基因檢測(cè)】基因解碼器與生信一體機(jī)...
- 【佳學(xué)基因檢測(cè)】可以進(jìn)行基因篩查的新生兒遺傳病種類及其技術(shù)...
- 【佳學(xué)基因檢測(cè)】人類表型數(shù)據(jù)庫(kù)(簡(jiǎn)稱HPO)...
- 【佳學(xué)基因檢測(cè)】基因解碼基因檢測(cè)如何構(gòu)建專屬數(shù)據(jù)庫(kù)以增加正確性和檢出率...
- 【佳學(xué)基因檢測(cè)】基因測(cè)序結(jié)果如何通過(guò)GENECODE/CCDS進(jìn)行解碼檢測(cè)...
- 【佳學(xué)基因檢測(cè)】基因測(cè)序結(jié)果如何使用更新的Hg38數(shù)據(jù)庫(kù)進(jìn)行解碼分析...
- 【佳學(xué)基因檢測(cè)】基因解碼如何使用UCSC/Ensembl數(shù)據(jù)庫(kù)進(jìn)行基因檢測(cè)結(jié)果的分析...
- 【佳學(xué)基因檢測(cè)】2023年諾貝爾醫(yī)學(xué)獎(jiǎng),授予新冠病毒疫苗技術(shù)創(chuàng)新者!...
- 【佳學(xué)基因檢測(cè)】非小細(xì)胞肺癌生物標(biāo)志物的檢測(cè)方法或技術(shù)...
- 【佳學(xué)基因檢測(cè)】人體細(xì)胞年輕態(tài)的基因檢測(cè)與評(píng)價(jià)方法...
- 【佳學(xué)基因檢測(cè)】端粒長(zhǎng)度與干細(xì)胞衰老基因檢測(cè)...
- 【佳學(xué)基因檢測(cè)】基因解碼技術(shù)成份之基因型填充:Genotype Imputation...
- 【佳學(xué)基因檢測(cè)】基因突變對(duì)疾病發(fā)生的影響分析:GWAS分析的技術(shù)...
- 【佳學(xué)基因檢測(cè)】肺癌靶向藥物塞普替尼selpercatinib (Retevmo)基因檢測(cè)...
- 【佳學(xué)基因檢測(cè)】LINUX文本文件的各種替代形式...
- 【佳學(xué)基因檢測(cè)】如何從基因組序列文件中獲取特定基因的全部序列、編碼序列、啟動(dòng)子序列?...
- 【佳學(xué)基因檢測(cè)】如何貯存用于基因序列比對(duì)的全部基因組序列?...
- 【佳學(xué)基因檢測(cè)】基因解碼如何構(gòu)建人的標(biāo)準(zhǔn)基因序列數(shù)據(jù)庫(kù)的?...
- 來(lái)了,就說(shuō)兩句!
-
- 最新評(píng)論 進(jìn)入詳細(xì)評(píng)論頁(yè)>>