特征值和特征向量是干嘛用的(特征值和特征向量有什么作用)
特征值和特征向量具有良好的性質(zhì),是線性代數(shù)中的重要概念之一。它們在多元統(tǒng)計分析方法中也有重要的應(yīng)用。
在數(shù)學(xué)中,特別是在線性代數(shù)中,A是一個n階矩陣,如果數(shù)個和n維非零列向量v,滿足Av=v,那么數(shù)稱為A的特征值,v稱為A的對應(yīng)于特征值的特征向量。
在多元統(tǒng)計中,特征值和特征向量主要在PCA主成分分析和FA因子分析中發(fā)揮作用。
主成分分析中
特征向量的正交化確保主成分具有成對獨立的屬性。單位化使得主成分表達式中線性組合的系數(shù)更加簡單;主成分的方差等于構(gòu)成線性組合的特征向量對應(yīng)的特征值。特征值之和等于原始變量的方差之和,這意味著所有主成分準確地反映了所有原始變量的所有信息。在選擇主成分的過程中,特征值通過限制方差貢獻程度來控制包含更多信息的主成分。特征向量彼此正交。
特征值之和=矩陣R的跡(主對角線元素之和)=總方差。
特征值的乘積=矩陣的行列式值=廣義方差。
因子分析中
特征值和特征向量用于估計因子模型,在對應(yīng)分析中用于計算因子載荷矩陣。進一步解釋特征值/向量的作用,本文假設(shè)一個雙變量模型。
給定相關(guān)系數(shù)矩陣R,從中得到2對特征值和特征向量。
特征向量描述了這個橢圓的兩條軸的方向。橢圓軸的半長和特征值的平方根是成比例的。所以,在2個變量時,特征值比較大的特征向量對應(yīng)的就是長軸方向。因為這里只有2個維度,所以是一個平面圖形。
在原始坐標系中,每個樣本對應(yīng)一個水平和垂直坐標。現(xiàn)在我們有了特征向量,我們沿著特征向量的方向繪制兩個新軸,即圍繞橢圓創(chuàng)建新軸。因為軸沒有變化,所以每個樣本到軸的距離也沒有變化。僅水平和垂直坐標發(fā)生變化。
由于軸的順序基于特征值的大小,因此在解釋樣本變化的方向時,首先排序的軸更為重要。
實例:
如下圖所示,特征值之和為2。但是每張圖片的特征值和特征向量不同。
左:兩個特征值非常接近,因此橢圓的兩個軸的長度相似。因此,樣品的分散位置接近于圓形。1稍大,所以紅軸稍微重要一些,我們可以推測可能存在一些負相關(guān),但它也很小,接近于0,幾乎不相關(guān)。
中:1對應(yīng)紅軸,負方向。2對應(yīng)于綠軸,即正方向。12,推斷負相關(guān)是更常見的趨勢,但也存在正相關(guān),因此這描述了中度負相關(guān)。
右圖:1遠大于2。說明紅軸所代表的正相關(guān)性非常強。沿著綠軸,可以發(fā)現(xiàn)樣本變異程度很小。因此,推斷該樣本之間的正相關(guān)性仍占主導(dǎo)地位。