版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、蛋白質是生命的基礎物質,構成細胞的基本有機物,是生命活動的主要承擔者。蛋白質不僅與其它化合物結合,蛋白質自身結合也有重要的意義,蛋白質與蛋白質之間的交互對生命活動有著重要的作用。當一對蛋白質之間的結合自由能的值很大的時候,說明這一對蛋白質在藥物設計階段能夠成功結合并對生物產(chǎn)生作用,從而更好的治愈疾病。反之,將它們結合為藥物就幾乎毫無意義。回歸分析是一種應用十分廣泛的數(shù)據(jù)分析方法,擅長用觀測數(shù)據(jù)內在規(guī)律,分析數(shù)據(jù)變量間的依賴關系,尤其是在
2、定量預測上應用更多。建立準確的回歸模型來預測蛋白質間的結合自由能是一種很好的途徑。因此,選擇有價值的特征集和回歸模型是本文的研究重心,根據(jù)有價值蛋白質的特征來預測蛋白質之間的結合自由能可以完善蛋白質相互作用設計,對于推動蛋白質對接研究的進步,加速針對蛋白質相互作用的藥物設計開發(fā),高效治療疾病是有重要的作用。
目前有很多計算蛋白質結合自由能的方法,但這些方法計算需要大量的時間和資源,并且無法得到較高的準確率,從而很難被直接應用到
3、實踐中。本文旨在設計準確,快速計算的模型來預測蛋白質結合自由能,主要研究工作如下:
(1)收集并計算與蛋白質結合自由能相關的序列特征和結構特征、135對蛋白質復合物當做訓練集、39對蛋白質復合物當做外部集。
(2)使用最小冗余最大相關(mRMR)來選擇那些與蛋白質自由能顯著相關的特征并去除冗余特征,從而得到最小冗余最大相關的特征集,然后把這特征集用于建立6種回歸模型。
(3)對于6種回歸模型通過10折交叉驗
4、證對比得到最佳回歸模型,然后通過模型特征優(yōu)化得到最佳特征集,并對優(yōu)化后的特征集進行移除特征來對比分析特征的重要性。
(4)用優(yōu)化后的特征集建立最佳回歸模型來預測蛋白質結合自由能,將模型預測的性能與別的方法進行構象變化和外部集驗證對比。
實驗結果表明,本文使用Linear Regression和SMOreg回歸模型相結合來預測蛋白質結合自由能,優(yōu)化后得到的最佳回歸模型比其它方法的模型具有著更高的性能,并且也適用于那些構
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于序列特征的蛋白質分子功能預測.pdf
- 基于序列信息的DNA結合蛋白質預測方法研究.pdf
- 基于序列特征的蛋白質功能類預測方法研究.pdf
- 蛋白質序列中RNA結合位點的預測.pdf
- 基于機器學習和統(tǒng)計方法的蛋白質結構特征預測.pdf
- 使用蛋白質和mRNA序列信息預測蛋白質亞線粒體定位.pdf
- 蛋白質結構預測
- 7965.基于序列的蛋白質結構預測的機器學習模型
- 蛋白質-蛋白質復合物結構預測.pdf
- 基于氨基酸序列的蛋白質結構功能預測方法研究.pdf
- 通過構建蛋白質結構域功能模版庫做基于序列的蛋白質功能位點預測.pdf
- 基于多特征融合的蛋白質三級結構預測.pdf
- 序列替代的蛋白質三級結構預測方法.pdf
- 基于蛋白質網(wǎng)絡與蛋白質功能的關鍵蛋白質預測研究.pdf
- 蛋白質局部結構-局部序列統(tǒng)計勢的構建以及RNA結合位點的預測.pdf
- 2357.基于多序列特征提取的蛋白質相互作用預測
- 蛋白質序列數(shù)據(jù)的分類預測研究.pdf
- 基于序列的蛋白質相互作用預測方法研究.pdf
- 結構對稱蛋白質的序列分析.pdf
- 蛋白質序列特征提取及其在功能預測中的應用.pdf
評論
0/150
提交評論