A為n階矩陣,若數(shù)λ和n維非0列向量x滿足Ax=λx,那么數(shù)λ稱為A的特征值,x稱為A的對(duì)應(yīng)于特征值λ的特征向量。
它的物理意義是:
一個(gè)矩陣A乘以一個(gè)向量x,
就相當(dāng)于做了一個(gè)線性變換λx。
方向仍然保持不變,
只是拉伸或者壓縮一定倍數(shù)λ。
特征向量和特征值的幾何本質(zhì),其實(shí)就是:
空間矢量的旋轉(zhuǎn)和縮放。
線性變換 A 對(duì)于特征空間只起到“擴(kuò)張(或者壓縮)”的作用(擴(kuò)張后還是同樣的特征空間)
求解特征向量
計(jì)算特征多項(xiàng)式→求解特征值→求解齊次線性方程組,得出特征向量。沒(méi)錯(cuò),就是這個(gè)再普通不過(guò)的基礎(chǔ)數(shù)學(xué)求解公式。這也是教科書(shū)里面求特征值的方法!然而,三位物理學(xué)家PeterDenton、StephenParke、張西寧發(fā)現(xiàn)了一個(gè)全新的方法:知道特征值,只需要列一個(gè)簡(jiǎn)單的方程式,特征向量便可迎刃而解。大神和三位物理學(xué)家一起發(fā)表了論文,闡述了這個(gè)公式的證明過(guò)程!△三位物理學(xué)家分別是:張西寧、Peter Denton和Stephen Parke。
這個(gè)公式看起來(lái)好得令人難以置信。我完全沒(méi)想過(guò),子矩陣的特征值編碼了原矩陣特征向量的隱藏信息。
陶哲軒對(duì)這個(gè)新方法第一反應(yīng)卻是:這么短、這么簡(jiǎn)單的東西,早就應(yīng)該出現(xiàn)在教科書(shū)里了?。。?/section>
但三位物理學(xué)家在計(jì)算中微子振蕩概率的時(shí)候發(fā)現(xiàn):
特征向量和特征值的幾何本質(zhì),其實(shí)就是空間矢量的旋轉(zhuǎn)和縮放。而中微子的三個(gè)味(電子,μ子,τ子),不就相當(dāng)于空間中的三個(gè)向量之間的變換嗎?中微子振蕩是一種量子力學(xué)現(xiàn)象。實(shí)驗(yàn)發(fā)現(xiàn),電子中微子、μ子中微子和τ子中微子這三種中微子之間是可以相互轉(zhuǎn)化的,而這就是中微子振蕩現(xiàn)象。△圖源:Quantamagazine
三個(gè)物理學(xué)家意識(shí)到,特征向量和特征值之間,可能存在更普遍的規(guī)律。于是,教科書(shū)級(jí)別的公式被發(fā)現(xiàn)了:
通過(guò)刪除原始矩陣的行和列,創(chuàng)建子矩陣。子矩陣和原始矩陣的特征值組合在一起,就可以計(jì)算原始矩陣的特征向量。簡(jiǎn)而言之,已知特征值,一個(gè)方程式就可以求得特征向量。△圖源:Quantamagazine
這個(gè)新公式有多牛?
數(shù)學(xué)天才、菲爾茲獎(jiǎng)得主陶哲軒評(píng)價(jià)道:新公式的非凡之處是,在任何情況下,你不需要知道矩陣中的任何元素,就可以計(jì)算出你想要的任何東西。
別被上面的話嚇著了,其實(shí)很簡(jiǎn)單,我們用一個(gè)naive的二階對(duì)稱矩陣試一試就知道:
陶哲軒和Peter Denton、Stephen Parke、張西寧三位物理學(xué)家一起發(fā)表了論文,論文給出了兩種解法,一種給出一個(gè)Cauchy-Binet類型的行列式公式作為引理,構(gòu)造式證明方法比較巧妙;ps:小編還在啃論文,希望能給出一個(gè)通俗的過(guò)程解釋。
在現(xiàn)實(shí)世界中,無(wú)論是在數(shù)學(xué)、物理學(xué)還是工程學(xué)中,許許多多的問(wèn)題都涉及到特征向量和特征值的計(jì)算。圖像處理中的PCA方法,選取特征值最高的k個(gè)特征向量來(lái)表示一個(gè)矩陣,從而達(dá)到降維分析+特征顯示的方法,還有圖像壓縮的K-L變換。再比如很多人臉識(shí)別,數(shù)據(jù)流模式挖掘分析等方面。在力學(xué)中,慣量的特征向量定義了剛體的主軸。慣量是決定剛體圍繞質(zhì)心轉(zhuǎn)動(dòng)的關(guān)鍵數(shù)據(jù)。在譜系圖論中,一個(gè)圖的特征值定義為圖的鄰接矩陣A的特征值,或者(更多的是)圖的拉普拉斯算子矩陣, Google的PageRank算法就是一個(gè)例子。在量子力學(xué)中,特別是在原子物理和分子物理中,在Hartree-Fock理論下,原子軌道和分子軌道可以定義為Fock算子的特征向量。相應(yīng)的特征值通過(guò)Koopmans定理可以解釋為電離勢(shì)能。在這個(gè)情況下,特征向量一詞可以用于更廣泛的意義,因?yàn)镕ock算子顯式地依賴于軌道和它們的特征值。在神經(jīng)網(wǎng)絡(luò)中,深度神經(jīng)網(wǎng)絡(luò)本身可以看成是一種對(duì)特征向量空間的轉(zhuǎn)換過(guò)程。因此是否可以在神經(jīng)網(wǎng)絡(luò)每次作轉(zhuǎn)換的時(shí)候,根據(jù)特征值(奇異值)大小來(lái)表示每一維特征的重要性大小,從而調(diào)整相應(yīng)權(quán)重的大小,這樣是否會(huì)使得訓(xùn)練過(guò)程更加高效。https://arxiv.org/abs/1908.03795
https://arxiv.org/abs/1907.02534
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。