-
如何預測新基因編碼蛋白的氨基酸序列
發(fā)布時(shí)間: 2021-08-21 點(diǎn)擊次數: 1969次當我們想研究一個(gè)新基因的功能時(shí),我們首先預測一下它是否編碼蛋白,如果編碼蛋白,那編碼出的蛋白的最有可能的氨基酸序列是什么?
當我們預測出該基因編碼的蛋白的氨基酸序列后,在數據庫中比對,如果比對出了一個(gè)高度相似的已知蛋白,那我們可以根據該蛋白的功能來(lái)大概的推測我們要研究的新基因所編碼的蛋白的功能,這將為我們之后研究該新基因的功能提供方向。
接下來(lái)我們就來(lái)說(shuō)一下怎樣預測一個(gè)新基因編碼的蛋白的氨基酸序列。首先我們需要做的就是通過(guò) 5’- and 3’-RACE 技術(shù)得到該基因的全長(cháng) cDNA 序列,然后按以下步驟進(jìn)行即可。
1.首先打開(kāi):web.expasy.org/translate/
2.將 DNA/RNA 序列輸入白色框中(應輸入 cDNA 序列)
3.點(diǎn)擊下方的 TRANSLATE SEQUENCE。
4.點(diǎn)擊 TRANSLATE SEQUENCE 后會(huì )看到如下結果(紅色部分為可能的該段 DNA 序列的 ORF 編碼的氨基酸,因為輸入 cDNA 序列后,并不是該段序列上的所有堿基都用來(lái)編碼氨基酸, 而是只有位于 ORF 框內的堿基用來(lái)編碼氨基酸,ORF 是不確定,所以編碼的蛋白也不確定,那我們現在要做的就是得到最有可能的 氨基酸序列,紅色區域為各種可能)。
5.一般我們認為紅色最多(即最長(cháng))的就是該段 cDNA 序列編碼的氨基酸序列。
6.因為第一個(gè)紅色最多(即最長(cháng)),那接下來(lái)就點(diǎn)擊第一個(gè)。
7.點(diǎn)擊進(jìn)入后會(huì )看到以下結果,我們會(huì )看到紅色中有許多的藍色字母(畫(huà)紅線(xiàn)的部分),如果我們仔細看了之后會(huì )發(fā)現藍色部分就是M---甲硫氨酸,我們都知道真核蛋白的起始氨基酸都是甲硫氨酸,也就是說(shuō)畫(huà)紅線(xiàn)的部分就是可能的起始氨基酸部分,那只有一個(gè)是最有可能的,那就是使氨基酸序列最長(cháng)的。因為下圖的結果中只有一個(gè)終止------在最后面,那我們選擇第一個(gè)劃線(xiàn)的 M 作為起始氨基酸使編碼的氨基酸序列最長(cháng) ,所以第一個(gè)M 最有可能是起始氨基酸。
8.那接下來(lái)就點(diǎn)擊第一個(gè)藍色的M,點(diǎn)擊后進(jìn)入會(huì )看到以下結果(紅色框內即為該段cDNA序列最有可能編碼的氨基酸序列)
9.我們還可以看到在結果的的最下方有一些工具(點(diǎn)擊第一個(gè)劃線(xiàn)部分可以得到該段氨基酸序列的 Fast 格式。那下方的四個(gè)劃線(xiàn)部分就是一些分析蛋白氨基酸序列的一些工具,比如可以拿該段氨基酸序列在數據庫中 Blast,劃線(xiàn)部分的這些工具就是對該段氨基酸序列進(jìn)行進(jìn)一步的分析,得到有關(guān)該段氨基酸序列更多的信息)。
-
血清系列
-
細胞轉染
-
細胞凍存
-
實(shí)驗耗材
-
分子試劑
-
細胞增殖與凋亡
-
Biozellen系列
-
培養基
-
ELISA試劑盒
-
TOYOBO(東洋紡)
-
ZYMO RESEARCH
-
Greiner(格瑞納)
-
IKA(艾卡)
-
化學(xué)發(fā)光底物(ECL)
-
PROSPEC系列
-
Epigentek系列
-
微生物檢測
-
細胞生物學(xué)
-
Corning康寧
-
解離試劑
-
細胞類(lèi)-實(shí)驗耗材
-
原代細胞
-
植物檢測系列試劑盒
-
SERANA
-
細胞系
-
生化試劑盒
-
環(huán)境檢測系列試劑盒(AKEN)
-
類(lèi)器官培養
-
緩沖器和解決方案
-
生物三凝膠基質(zhì)
-
細胞因子分子
-
生物樣本庫