avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV

上海士鋒生物科技有限公司
免費(fèi)會(huì)員

士鋒生物基因表達(dá)數(shù)據(jù)分析主成分分析 PCA

時(shí)間:2014/2/18閱讀:1543
分享:

主成分分析 ( Principal Component Analysis , PCA ) 是一種掌握事物主要矛盾的統(tǒng)計(jì)分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡(jiǎn)化復(fù)雜的問(wèn)題。計(jì)算主成分的目的是將高維數(shù)據(jù)投影到較低維空間。給定 n 個(gè)變量的 m 個(gè)觀察值,形成一個(gè) n ′ m 的數(shù)據(jù)矩陣, n 通常比較大。對(duì)于一個(gè)由多個(gè)變量描述的復(fù)雜事物,人們難以認(rèn)識(shí),那么是否可以抓住事物主要方面進(jìn)行重點(diǎn)分析呢?如果事物的主要方面剛好體現(xiàn)在幾個(gè)主要變量上,我們只需要將這幾個(gè)變量分離出來(lái),進(jìn)行詳細(xì)分析。但是,在一般情況下,并不能直接找出這樣的關(guān)鍵變量。這時(shí)我們可以用原有變量的線性組合來(lái)表示事物的主要方面, PCA 就是這樣一種分析方法。PCA 的目標(biāo)是尋找 r ( r

基因表達(dá)數(shù)據(jù)分析主成分分析 PCA

。

在進(jìn)行基因表達(dá)數(shù)據(jù)分析時(shí),一個(gè)重要問(wèn)題是確定每個(gè)實(shí)驗(yàn)數(shù)據(jù)是否是獨(dú)立的,如果每次實(shí)驗(yàn)數(shù)據(jù)之間不是獨(dú)立的,則會(huì)影響基因表達(dá)數(shù)據(jù)分析結(jié)果的準(zhǔn)確性。對(duì)于利用基因芯片所檢測(cè)到的基因表達(dá)數(shù)據(jù),如果用 PCA 方法進(jìn)行分析,可以將各個(gè)基因作為變量,也可以將實(shí)驗(yàn)條件作為變量。當(dāng)將基因作為變量時(shí),通過(guò)分析確定一組“主要基因元素”,它們能夠很好地說(shuō)明基因的特征,解釋實(shí)驗(yàn)現(xiàn)象;當(dāng)將實(shí)驗(yàn)條件作為變量時(shí),通過(guò)分析確定一組“主要實(shí)驗(yàn)因素”,它們能夠很好地刻畫(huà)實(shí)驗(yàn)條件的特征,解釋基因的行為。下面著重考慮以實(shí)驗(yàn)條件作為變量的 PCA 分析方法。假設(shè)將數(shù)據(jù)的維數(shù)從 R N 降到 R 3 ,具體的 PCA 分析步驟如下:

(1) *步計(jì)算矩陣 X 的樣本的協(xié)方差矩陣 S :

基因表達(dá)數(shù)據(jù)分析主成分分析 PCA

, i = 1,2,…,N 。本征值按大到小排序:

基因表達(dá)數(shù)據(jù)分析主成分分析 PCA

?,F(xiàn)在數(shù)據(jù)可以在三維空間中展示為云狀的點(diǎn)集。

對(duì)于 PCA ,確定新變量的個(gè)數(shù) r 是一個(gè)兩難的問(wèn)題。我們的目標(biāo)是減小 r ,如果 r 小,則數(shù)據(jù)的維數(shù)低,便于分析,同時(shí)也降低了噪聲,但可能丟失一些有用的信息。究竟如何確定 r 呢?這需要進(jìn)一步分析每個(gè)主元素對(duì)信息的貢獻(xiàn)。

基因表達(dá)數(shù)據(jù)分析主成分分析 PCA

(8-45)

前 r 個(gè)主成分的累計(jì)貢獻(xiàn)率為:

基因表達(dá)數(shù)據(jù)分析主成分分析 PCA

 

基因表達(dá)數(shù)據(jù)分析主成分分析 PCA

會(huì)員登錄

×

請(qǐng)輸入賬號(hào)

請(qǐng)輸入密碼

=

請(qǐng)輸驗(yàn)證碼

收藏該商鋪

X
該信息已收藏!
標(biāo)簽:
保存成功

(空格分隔,最多3個(gè),單個(gè)標(biāo)簽最多10個(gè)字符)

常用:

提示

X
您的留言已提交成功!我們將在第一時(shí)間回復(fù)您~
在線留言