- For two real numbers a and non-zero b,
- (5 points) Please find the two eigen-values and the related eigen-vectors of the 2-by-2 matrix A and
- (5 points) Please find the two eigen-values and the related eigen-vectors of the transpose A′ of A below:
A=(01−(a2+b2)2a)
- 考慮 A 的特徵多項式為
p(x)=det(xI−A)=|x−1a2+b2x−2a|=x2−2ax+a2+b2=(x−a)2+b2.
故解 p(x)=0 可得 x=a±bi。- 當 x=a+bi 時所對應的特徵向量為 (1a+bi);
- 當 x=a−bi 時所對應的特徵向量為 (1a−bi)。
- 由於轉置矩陣 A′ 的特徵多項式與 A 的相同,故特徵根相同。藉由觀察可以知道
- 當 x=a+bi 時所對應的特徵向量為 (a−bi−1)
- 當 x=a−bi 時所對應的特徵項向量為 (a+bi−1)。
- (10 points) Please find a Jordan normal form for A given above.
- Let us define as follows the exponential function of tA for a real number t and for the square matrix A given above
exp[tA]=I+tA+⋯+[tA]k/k!+⋯
Please find for exp[tA]- (5 points) the inverse,
- (5 points) the derivative on t and
- (5 points) the integral on t.
- exp[tA] 的反方陣可計算如下
(exp[tA])−1=(Pexp[tΛ]P−1)−1=Pexp[−tΛ]P−1=−12bi(11a+bia−bi)(e−(a+bi)t00e−(a−bi)t)(a−bi−1−a−bi1)=−12bi((a−bi)e−(a+bi)t−(a+bi)e−(a−bi)t−e(a+bi)t+e−(a−bi)t(a2+b2)(e−(a+bi)t−e−(a−bi)t)−(a+bi)e−(a+bi)t+(a−bi)e−(a−bi)t).
【註】 事實上有 (exp[tA])−1=exp[−tA]。 - 求導有
ddtexp[tA]=P(ddtexp[tΛ])P−1=PΛexp[tΛ]P−1=(PΛP−1)(Pexp[tΛ]P−1)=Aexp[tA].
- 對 t 取不定積分可得
∫exp[tA]dt=A−1exp[tA]+C,
此處 C 為二階常數方陣。 - (30 points) Let A be the matrix (12−14). Please complete the following questions.
- Derive its eigenvalues and corresponding eigenvectors.
- Compute its determinant |A|.
- Compute trace(A).
- Calculate A1/2.
- Is A idempotent? Why or why not?
- 矩陣 A 的特徵多項式為
p(x)=det(xI−A)=|x−1−21x−4|=x2−5x+6=(x−2)(x−3).
故其特徵值為 2 與 3。- 當 x=2 時所對應的特徵向量為 (21);
- 當 x=3 時所對應的特徵向量為 (11)。
- 矩陣 A 的行列式為特徵根之乘積,因此 |A|=2⋅3=6。行列式值亦可直接計算為 1⋅4−2⋅(−1)=4+2=6。
- 矩陣的跡為特徵值之和,即為 trace(A)=2+3=5。跡亦可由對角線和得 trace(A)=1+4=5。
- 運用第一小題的結果,我們取 P=(2111) 以及 Λ=(2003),如此滿足
A=PΛP−1.
如此所求為A1/2=PΛ1/2P−1=(2111)(±√200±√3)(1−1−12)=(±2√2∓√3∓2√2±2√3±√2∓√3∓√2±2√3).
即 A1/2 有四種可能的矩陣。 - 由於 A 的特徵根不全為 0 或 1 故非冪等矩陣。亦可直接檢驗計算如下
A2=(12−14)2=(−110−514)≠A
如可其非冪等矩陣。 - (15 points) Define y=x′Ax where x is a 3×1 vector and A is a 3×3 symmetric matrix. Please derive the derivative of y with respect to x.
- (20 points) Let y be a known 3×1 vector, X be a 3×3 invertible constant matrix, Σ=σ2I where I is a 3×3 identity matrix, and β be a 3×1 vector. Both σ2 and β are unknown. Now define function
f(β,σ2)=(2π)−3/2|Σ|−1/2exp{−12σ2(y−Xβ)′(y−Xβ)}.
Please derive ˆβ and ˆσ2 such that logf(β,σ2) is maximized at ˆβ and ˆσ2.
(Note: You do not need to verify the second derivative.)
訣竅
按照特徵值的定義求特徵多項式的根,並由此觀察對應的特徵向量。解法
訣竅
由於前一小題確認其有兩個相異的特徵根,從而可對角化。解法
由於矩陣 A 可對角化,故其 Jordan normal form 為(a+bi00a−bi).
訣竅
利用對角化的方式表達矩陣 A,從而求指數矩陣。解法
取 P=(11a+bia−bi) 以及 Λ=(a+bi00a−bi),此時有A=PΛP−1.
如此便有exp[tA]=Pexp[tΛ]P−1=−12bi(11a+bia−bi)(e(a+bi)t00e(a−bi)t)(a−bi−1−a−bi1)=−12bi(e(a+bi)te(a−bi)t(a+bi)e(a+bi)t(a−bi)e(a−bi)t)(a−bi−1−a−bi1)=−12bi((a−bi)e(a+bi)t−(a+bi)e(a−bi)t−e(a+bi)t+e(a−bi)t(a2+b2)(e(a+bi)t−e(a−bi)t)−(a+bi)e(a+bi)t+(a−bi)e(a−bi)t).
據此有下列結果:訣竅
按照特徵值的定義求解,並且留意到行列式值為特徵值之積而跡為特徵值之和。再者矩陣之根號可對角化後開平方求得,最後按冪等的定義確認即可。解法
訣竅
對向量微分的意義即為對各個分量微分後寫為行向量。解法
設矩陣 A=(abcbdecef) 而 x=(x1x2x3),如此有y=(x1x2x3)(abcbdecef)(x1x2x3)=ax21+dx22+fx23+2(bx1x2+cx1x3+ex2x3).
如此所求為dydx=(dydx1dydx2dydx3)=(2ax1+2bx2+2cx32bx1+2dx2+2ex32cx1+2ex2+2fx3)=2Ax.
訣竅
利用一階偏導為零處求其極值候選點。【原命題有誤,我們更正函數 f。】解法
命 g(β,σ2)=logf(β,σ2),那麼g(β,σ2)=−12σ2(y−Xβ)′(y−Xβ)−32log(2π)−32logσ2.
對 σ2 求導有 ∂g∂σ2=12(σ2)2(y−Xβ)′(y−Xβ)−32σ2,那麼解 ∂g∂σ2=0 可得關係式 3σ2=(y−Xβ)′(y−Xβ)。另一方面,函數 g 亦可寫為g(β,σ2)=−12σ2(y′y−y′Xβ−β′X′y+β′X′Xβ)−32log(2π)−32logσ2.
此外注意到 β′X′y=y′Xβ。從而對 β 求導可得∂g∂β=12σ2(2y′X−2X′Xβ).
因此 ∂g∂β=0 給出 (X′X)β=y′X。假若 X 為可逆方陣,那麼可得 ˆβ=(X′X)−1y′X。另一方面,有
σ2=(y−(X′)−1y′X)′(y−(X′)−1y′X)3.
假若 X 不為可逆矩陣,則運用 X′X 的廣義反方陣表達得
β=(X′X)−y′X+[I−(X′X)−X′X]ω.
此處 ω 為任意的 3×1 向量,同樣可得 σ2 的表達式。
沒有留言:
張貼留言