2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多元統(tǒng)計(jì)分析中的降維方法在四川省社會(huì)福利中的應(yīng)用由于計(jì)算機(jī)的發(fā)展和日益廣泛的使用,多元分析方法也很快地應(yīng)用到社會(huì)學(xué)、農(nóng)業(yè)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、地質(zhì)、氣象等各個(gè)領(lǐng)域。在國外,從自然科學(xué)到社會(huì)科學(xué)的許多方面,都已證實(shí)了多元分析方法是一種很有用的數(shù)據(jù)處理方法;在我國,多元分析對(duì)于農(nóng)業(yè)、氣象、國家標(biāo)準(zhǔn)和誤差分析等許多方面的研究工作都取得了很大的成績,引起了廣泛的注意。在許多領(lǐng)域的研究中,為了全面系統(tǒng)地分析問題,對(duì)研究對(duì)象進(jìn)行綜合評(píng)價(jià),我們常常需要考慮

2、衡量問題的多個(gè)指標(biāo)(即變量),由于變量之間可能存在著相關(guān)性,如果采用一元統(tǒng)計(jì)方法,把多個(gè)變量分開,一次分析一個(gè)變量,就會(huì)丟失大量的信息,研究結(jié)果也會(huì)偏差很大。因此需要采用多元統(tǒng)計(jì)分析的方法,同時(shí)對(duì)所有變量的觀測數(shù)據(jù)進(jìn)行分析。多元統(tǒng)計(jì)分析就是一種同時(shí)研究多個(gè)變量之間的相互關(guān)系,經(jīng)過對(duì)變量的綜合處理,充分提取變量之間的信息,進(jìn)行綜合分析和評(píng)價(jià)的統(tǒng)計(jì)方法。多元統(tǒng)計(jì)分析法主要包括降維、分類、回歸及其他統(tǒng)計(jì)思想。一多元統(tǒng)計(jì)分析方法中降維的方法1.

3、概述多元統(tǒng)計(jì)分析方法是同時(shí)對(duì)多個(gè)變量的觀察數(shù)據(jù)做綜合處理和分析。在不損失有價(jià)值信息的情況下,簡化觀測數(shù)據(jù)或數(shù)據(jù)結(jié)構(gòu),盡可能簡單地將被研究對(duì)象描述出來,使得對(duì)復(fù)雜現(xiàn)象的解釋變得更容易些。同時(shí),采用多元統(tǒng)計(jì)分析中的聚類分析或判別分析可以對(duì)變量或樣品進(jìn)行分類與分組。根據(jù)所測量的特征和分類規(guī)則將一些“類似的”對(duì)象或變量分組。多元統(tǒng)計(jì)分析也可以研究變量間依賴性。即對(duì)變量間關(guān)系的本質(zhì)進(jìn)行研究。是否所有的變量都相互獨(dú)立還是一個(gè)變量或多個(gè)變量依賴于其他

4、變量它們又是怎樣依賴的通過觀測變量數(shù)據(jù)的散點(diǎn)圖,我們可以建立多元回歸統(tǒng)計(jì)模型,確定出變量之間具體的依賴關(guān)系,進(jìn)而可以根據(jù)某些變量的觀測值預(yù)測另一個(gè)或另一些變量的值對(duì)事物現(xiàn)象的發(fā)展作預(yù)測。最后我們需要構(gòu)造假設(shè),并對(duì)所建立的以多元總體參數(shù)形式陳述的多種特殊統(tǒng)計(jì)假設(shè)進(jìn)行檢驗(yàn)。在多元統(tǒng)計(jì)分析方法中數(shù)據(jù)簡化或結(jié)構(gòu)簡化,實(shí)質(zhì)上就是數(shù)學(xué)中的降維方法。多元統(tǒng)計(jì)分析中的降維方法主要包括聚類分析、判別分析、主成分分析、因子分析、對(duì)應(yīng)分析和典型相關(guān)分析等幾種

5、方法。其中主成分分析和因子分析是在作綜合評(píng)價(jià)方面應(yīng)用最廣泛、較為有效的方法。本文主要介紹這兩種多元統(tǒng)計(jì)分析方法的應(yīng)用。2主成分分析2.1主成分分析的基本思想在大部分實(shí)際問題中,需要考察的變量多,變量之間是有一定的相關(guān)性的,主成分分析就是以損失很少部分信息為代價(jià),保留絕大部分信息的前提下,將原來眾多具有一定線性相關(guān)性的個(gè)指標(biāo)壓縮成少數(shù)幾個(gè)互不相關(guān)的綜合指p標(biāo)(主成分),并通過原來變量的少數(shù)幾個(gè)的線性組合來給出各個(gè)主成分的具有實(shí)際背景和意義

6、的解釋。由于主成分分析濃縮了眾多指標(biāo)的信息,降低了指標(biāo)的維度,從而簡化指標(biāo)的結(jié)構(gòu),深刻反映問題的內(nèi)在規(guī)律。,為矩陣各特征值對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量,則對(duì)12n???????12p????A任意向量有,x10maxxxAxxx?????0minnxxAxxx?????性質(zhì)2:設(shè)隨機(jī)向量的協(xié)方差矩陣為,12()pXXXX????為的特征值,為矩陣各特征值對(duì)應(yīng)的標(biāo)準(zhǔn)正交向12p????????12p?????量,則第個(gè)主成分為:,此時(shí)i1122

7、iiipipYXXX????????(12)ip??,。var()iiiiY???????cov()0ijiiYY??????由以上性質(zhì),我們把原始變量的協(xié)方差矩陣的非零特12()pXXXX????征值對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量分別作為系數(shù)向量,120p????????12p????即,,……,分別為的第一主11YX???22YX???ppYX???12()pXXXX???成分、第二主成分,……,第主成分的充要條件是:p(1),,即為階正交陣

8、;YuX??uuI??up(2)的分量之間相互獨(dú)立;Y12pYYY?(3)的個(gè)分量方差依次遞減。Yp12pYYY?于是隨機(jī)向量與隨機(jī)向量之間存在關(guān)12()pXXXX?????12pYYYY???系式:11111211121222222212ppppppppppuuuuXXuuuXXuYuXXuuuXXu????????????????????????????????????????????????????????????????????

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論