百家論壇更多分類
百家秘籍
蛋白查詢數(shù)據(jù)庫EMBL-EBI
蛋白家族檢索數(shù)據(jù)庫:Pfam 33.1(2020年5月,18259個(gè)條目) [http://pfam.xfam.org/]。
Pfam數(shù)據(jù)庫是大量蛋白質(zhì)家族的集合,每個(gè)蛋白質(zhì)家族都由multiple sequence alignments 和hidden Markov models (HMMs)表示。
蛋白質(zhì)通常由一個(gè)或多個(gè)功能區(qū)(通常稱為結(jié)構(gòu)域)組成。域的不同組合產(chǎn)生了自然界中發(fā)現(xiàn)的各種蛋白質(zhì)。因此,鑒定蛋白質(zhì)中存在的結(jié)構(gòu)域可以提供對其功能的了解。
Pfam還會生成相關(guān)條目的更高級別的分組,稱為“ 氏族”。氏族是Pfam條目的集合,這些條目通過序列,結(jié)構(gòu)或配置文件-HMM的相似性相關(guān)。
為每個(gè)條目提供的數(shù)據(jù)均基于 UniProt參考蛋白質(zhì)組, 但仍可通過輸入蛋白質(zhì)登錄來找到有關(guān)單個(gè)UniProtKB序列的信息。通過搜索各種數(shù)據(jù)庫,可以提供Pfam完全比對,以提供不同的登錄名(例如,all UniProt and NCBI GI)或不同級別的冗余。
數(shù)據(jù)庫輸入
數(shù)據(jù)庫提供了多種輸入方式:
1)輸入序列來進(jìn)行比對查看具體是哪個(gè)蛋白家族的;
2)可以輸入蛋白相關(guān)的結(jié)果:結(jié)構(gòu)域;
3) 也可以通過檢測詞來檢索符合要求的蛋白家族信息;
4)同時(shí)可以基于物種來見來查找某一物種的所有蛋白家族信息。
應(yīng)用舉例:
如果查詢想要使用和凋亡相關(guān)的有哪些蛋白,就在關(guān)鍵詞檢索里面輸入:apoptosis
由于我們這里是進(jìn)行了關(guān)鍵詞的檢索,所以會出來很多相似的結(jié)果。如果靶定到一個(gè)具體的結(jié)構(gòu)域上的話,那就可以直接到結(jié)果界面了。
在關(guān)鍵詞檢索完之后,我們會得到一個(gè)和這個(gè)關(guān)鍵詞相關(guān)的表格。在這個(gè)表格當(dāng)中,可以看到每一個(gè)相關(guān)家族在數(shù)據(jù)庫當(dāng)中都包括哪些信息。
以Bcl-2家族來進(jìn)行結(jié)果說明。
基本家族信息匯總
在總的結(jié)果的界面,首先看到的是這個(gè)蛋白家族的基本信息,這些基本的介紹主要來自于維基百科。這里我們能看到這個(gè)蛋白家族基本的構(gòu)造、功能、家族相關(guān)結(jié)構(gòu)域以及可能相關(guān)的基因。
主要結(jié)構(gòu)域匯總
由于這里能查找的一系列具有相似功能的蛋白家族,但是一個(gè)蛋白不可能只有一個(gè)結(jié)構(gòu)域的情況。所以這個(gè)部分就匯總了包含bcl-2的所有的蛋白結(jié)構(gòu)域情況。
不同物種蛋白相關(guān)進(jìn)化情況
在進(jìn)行基因研究的時(shí)候,我們經(jīng)常要比較各個(gè)物種之間蛋白序列的保守型情況。這種比較的方式基本上是通過進(jìn)化樹的方式來進(jìn)行實(shí)現(xiàn)的。所以數(shù)據(jù)庫也進(jìn)行了簡單的進(jìn)化樹構(gòu)建。當(dāng)然這個(gè)只是基本的查看。想要構(gòu)建好看的進(jìn)化樹數(shù)據(jù)庫也提供的原始數(shù)據(jù)下載的地方,點(diǎn)擊下載。
相互作用關(guān)系
蛋白與蛋白不是單獨(dú)發(fā)揮作用的。所以我們經(jīng)常也需要查看這些蛋白家族是和哪些蛋白有相互作用關(guān)系的。在這個(gè)部分,數(shù)據(jù)庫就提供了可能相互所有的其他蛋白
每個(gè)物種包括的相似蛋白結(jié)構(gòu)域的蛋白名稱
以上都是基本的匯總,有時(shí)候我們想要知道到底哪些蛋白具有這個(gè)結(jié)構(gòu)域。這個(gè)時(shí)候就可以在在結(jié)構(gòu)當(dāng)中查看了。這里提供了蛋白的PDB ID號。如果想要基因 名的話。就得轉(zhuǎn)換一下了。
以上就是這個(gè)數(shù)據(jù)庫的基本內(nèi)容了。主要還是通過檢索某一個(gè)特定結(jié)構(gòu)域來獲得相關(guān)的蛋白家族的信息。
Citing Pfam
If you find Pfam useful, please consider citing the reference that describes this work:
The Pfam protein families database in 2019: S. El-Gebali, J. Mistry, A. Bateman, S.R. Eddy, A. Luciani, S.C. Potter, M. Qureshi, L.J. Richardson, G.A. Salazar, A. Smart, E.L.L. Sonnhammer, L. Hirsh, L. Paladin, D. Piovesan, S.C.E. Tosatto, R.D. Finn
Nucleic Acids Research (2019) doi: 10.1093/nar/gky995
資料參考:醫(yī)學(xué)數(shù)據(jù)庫百科
資料啊