2015年12月14日 星期一

[線性代數] $A^2 = I \implies A=I?$

考慮以下問題 令 $A$ 為 任意 $n \times n$ 矩陣,試問下列陳述是否正確
Claim: $ A^2 = I  $則 $A = I$?

讀者可能注意到 $A^2 = AA = I$ 表示我們有
\[
A= A^{-1}
\]故上述陳述看來頗為誘人讓人想回答 True 但事實上此陳述為錯誤陳述,因為若我們考慮
\[A = \left[ {\begin{array}{*{20}{c}}
0&1\\
1&0
\end{array}} \right]\]則
\[
A^2 = I_{2 \times 2}
\]但 $A \neq I_{2 \times 2}$


2015年12月7日 星期一

[線性代數] 線性算子 與 特徵值/特徵向量(1) - 線性算子的矩陣代表 所表示的等價特徵問題

令 $V$ 為有限維度向量空間配備基底 $S=\{{\bf s}_1,{\bf s}_2,...,{\bf s}_n\}$ 且 $L: V \to V$ 為線性算子,則必存在唯一 的 一個 對應於基底 $S$ 的 $n \times n$ 矩陣代表 $A$  來 表示 $L$ (我們稱此矩陣代表 $A$ 為  representation of $L$ with respect to $S$) 使得 對任意 ${\bf x} \in V$ 我們有
\[
[L({\bf x})]_S = A [{\bf x}]_S \;\;\;\;\; (\star)
\]其中 $[{\bf x}]_S$ 表示 ${\bf x}$基於 基底 $S$ 的座標向量 (coordinate vector),亦即 若\[{[{\bf{x}}]_S} = \left[ \begin{array}{l}
{a_1}\\
{a_2}\\
 \vdots \\
{a_n}
\end{array} \right] \Leftrightarrow {\bf{x}} = {a_1}{{\bf{s}}_1} + {a_2}{{\bf{s}}_2} + ... + {a_n}{{\bf{s}}_n}\]

現在我們回憶原本 定義在 線性算子 $L$ 之上的特徵問題:亦即我們要 找出一組 特徵值 $\lambda$ 與其對應的 特徵向量 ${\bf x} \neq {\bf 0}$ 且 ${\bf x} \in V$ 滿足
\[
L({\bf x}) = \lambda {\bf x}\;\;\;\;\; (*)
\]
觀察 $(\star)$ 式,我們可得到透過 $A$ 矩陣所描述的等價特徵問題如下
\[\begin{array}{l}
{[L({\bf{x}})]_S} = A{[{\bf{x}}]_S}\;\\
 \Rightarrow {[\lambda {\bf{x}}]_S} = A{[{\bf{x}}]_S}\;\\
 \Rightarrow \lambda {[{\bf{x}}]_S} = A{[{\bf{x}}]_S}\;
\end{array}
\]則我們的目標變成要找 一組 $\lambda \in \mathbb{R}$ (or $\in \mathbb{C}$) 與 $[{\bf x}]_S \neq {\bf 0}$ 且 $[{\bf x}]_S \in \mathbb{R}^n$ (or $\mathbb{C}^n$)  滿足
\[
\lambda {[{\bf{x}}]_S} = A{[{\bf{x}}]_S}
\]

現在我們考慮以下例子:

Example 1
令 $L: P_1 \to P_1$ 為線性算子滿足
\[
L( at + b) := bt + a
\]另外給定一組 $P_1$ 的 有序基底 $S:=\{t, 1\}$,
(a) 試求透過 基底 $S$ 的矩陣 $A$ 來代表線性算子 $L$
(b) 定義對應於 $A$ 矩陣的等價特徵問題


Solution (a):
令 $A$ 為 線性算子 $L$ 為透過 基底 $S$ 的矩陣代表 ,則 $A$ 必須滿足 對任意 ${\bf x} \in P_1$,
\[
[L({\bf x})]_S = A [{\bf x}]_S
\]注意到我們的基底元素 ${\bf s}_1, {\bf s}_2 \in P_1$ 故我們現在若觀察
\[\left\{ \begin{array}{l}
L\left( {{{\bf{s}}_1}} \right) = L\left( t \right) = 1\\
L\left( {{{\bf{s}}_2}} \right) = L\left( 1 \right) = t
\end{array} \right.\]亦即
\[\left\{ \begin{array}{l}
{\left[ {L\left( {{{\bf{s}}_1}} \right)} \right]_S} = {\left[ 1 \right]_S} = \left[ \begin{array}{l}
0\\
1
\end{array} \right]\\
{\left[ {L\left( {{{\bf{s}}_2}} \right)} \right]_S} = {\left[ t \right]_S} = \left[ \begin{array}{l}
1\\
0
\end{array} \right]
\end{array} \right.\]故我們求得矩陣代表 (基於 $S$) 為
\[A = \left[ {\begin{array}{*{20}{c}}
{{{\left[ {L\left( {{{\bf{s}}_1}} \right)} \right]}_S}}&{{{\left[ {L\left( {{{\bf{s}}_2}} \right)} \right]}_S}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
0&1\\
1&0
\end{array}} \right]\]
Solution (b)
等價的矩陣代表的特徵問題為要找 一組 $\lambda \in \mathbb{R}$ (or $\in \mathbb{C}$) 與 $[{\bf x}]_S \neq {\bf 0}$ 且 $[{\bf x}]_S \in \mathbb{R}^2$  滿足
\[
A{[{\bf{x}}]_S} = \lambda {[{\bf{x}}]_S}
\] 或者更簡而言之,我們要找 $\lambda \in \mathbb{R}^1$ (or $\mathbb{C}^1$) 與非零向量 ${\bf v} \in \mathbb{R}^2$ 滿足
\[
A {\bf v} = \lambda {\bf v}
\]

上述討論說明了 對線性算子的特徵問題(Eigenproblem) 可以透過 其矩陣代表 描述,事實上對任意方陣,我們皆可定義其特徵問題如下:
若 $A$ 為 $n \times n$ 方陣 ,定義 線性算子 $L: \mathbb{R}^n \to \mathbb{R}^n$ or ($\mathbb{C}^n \to \mathbb{C}^n$) 滿足 對任意 ${\bf x} \in \mathbb{R}^n$ (or $\mathbb{C}^n$)
\[
L({\bf x}) = A{\bf x}
\]現在,若存在 $\lambda \in \mathbb{R}$ (or $\mathbb{C}$) 且 ${\bf x} \neq {\bf 0}, {\bf x} \in \mathbb{R}^n$ or ($\mathbb{C}^n$) 使得
\[
A {\bf x} = \lambda {\bf x}
\]則我們說 $\lambda$ 為 $A$ 的特徵值 且 ${\bf x}$ 為其 對應於 $\lambda$ 的特徵向量,亦即 $\lambda$ 為 $L$ 的特徵值 且 ${\bf x}$ 為其 對應於 $\lambda$ 的特徵向量




2015年12月5日 星期六

[線性代數] 線性算子 與 特徵值/特徵向量(0)

======================
Definition: Linear Operator
令 $V$ 為 $n$ 維 向量空間 且 $L: V \to V$ 為線性轉換 (Linear transformation):亦即給定任意兩向量 ${\bf u,v} \in V$ 與 $c \in \mathbb{R}$ (or $c \in \mathbb{C}$)滿足
\[\begin{array}{l}
L\left( {{\bf{u}} + {\bf{v}}} \right) = L\left( {\bf{u}} \right) + L\left( {\bf{v}} \right)\\
L\left( {c{\bf{u}}} \right) = cL\left( {\bf{u}} \right)
\end{array}\]則我們稱該 $L:V \to V$ 為定義在 $V$ 上的線性算子 (Linear Operator)
======================

那麼我們現在想問一個基本問題:是否可以找到 一組非零向量 ${\bf v} \neq {\bf 0}$ 與 純量 $\lambda \in \mathbb{R}$ (or $\in \mathbb{C}$) 使得
\[
L({\bf v}) = \lambda{\bf v}
\]
此問題在工程領域有諸多應用,一般而言上述問題又稱為特徵值問題。

Comments:
1. 上述討論中所提及的 Linear Operator 僅僅表示 domain 與 codomain 都為同一個向量空間 $V$,其餘皆與線性轉換定義相同。也就是說若我們將 domain $V$ 與 codomain $W$ 設為不同的向量空間,且若 $L: V \to W$ 滿足
\[\begin{array}{l}
L\left( {{\bf{u}} + {\bf{v}}} \right) = L\left( {\bf{u}} \right) + L\left( {\bf{v}} \right)\\
L\left( {c{\bf{u}}} \right) = cL\left( {\bf{u}} \right)
\end{array}\]則我們稱 $L$ 為線性轉換 (Linear Transformation)。

2. 若 ${\bf v} = {\bf 0}$ 則 $L({\bf v}) = \lambda{\bf v}$ 自動滿足故我們只需關心 ${\bf v} \neq {\bf 0}$ 的情況
3. 注意到若 $V:= \mathbb{R}^n$ 或者複數向量空間 $V= \mathbb{C}^n$ 則我們可從幾何觀點來看上述特徵值問題,則此問題變成決定是否 $L({\bf v})$ 與 ${\bf v}$ 平行。
4. 給定任意線性算子 $L: V \to V$ ,其(實數)特徵值與其對應的特徵向量不一定存在,比如說考慮 旋轉轉換 $L: \mathbb{R}^2 \to \mathbb{R}^2$ 滿足
\[L\left( {\left[ \begin{array}{l}
{x_1}\\
{x_2}
\end{array} \right]} \right) = \left[ {\begin{array}{*{20}{c}}
{\cos \theta }&{ - \sin \theta }\\
{\sin \theta }&{\cos \theta }
\end{array}} \right]\left[ \begin{array}{l}
{x_1}\\
{x_2}
\end{array} \right]\]其中 $0 < \theta < \pi$ 則此算子為線性算子但不存在(實數)特徵值與特徵向量。但存在 (複數)特徵值與複數特徵向量

Example 1:
令 Linear operator $L : \mathbb{R}^2 \to \mathbb{R}^2$ 滿足
\[L\left( {\bf{v}} \right) = L\left( {\left[ \begin{array}{l}
{v_1}\\
{v_2}
\end{array} \right]} \right): = \left[ \begin{array}{l}
{v_1}\\
 - {v_2}
\end{array} \right]\]試求 ${\bf v} \neq {\bf 0}$ 與 $\lambda$ 使得 $L({\bf v}) = \lambda {\bf v}$?

Solution
觀察
\[L\left( {\bf{v}} \right) = L\left( {\left[ \begin{array}{l}
{v_1}\\
{v_2}
\end{array} \right]} \right): = \left[ \begin{array}{l}
{v_1}\\
 - {v_2}
\end{array} \right]\]因為我們要求 $L({\bf v}) = \lambda {\bf v}$ 故
\[\begin{array}{*{20}{l}}
{\left[ {\begin{array}{*{20}{l}}
{{v_1}}\\
{ - {v_2}}
\end{array}} \right] = \lambda \left[ {\begin{array}{*{20}{l}}
{{v_1}}\\
{{v_2}}
\end{array}} \right]}\\
{ \Rightarrow \lambda \left[ {\begin{array}{*{20}{l}}
{{v_1}}\\
{{v_2}}
\end{array}} \right] - \left[ {\begin{array}{*{20}{l}}
{{v_1}}\\
{ - {v_2}}
\end{array}} \right] = {\bf{0}}}\\
{ \Rightarrow \left[ {\begin{array}{*{20}{c}}
{\lambda  - 1}&0\\
0&{\lambda  + 1}
\end{array}} \right]\left[ {\begin{array}{*{20}{l}}
{{v_1}}\\
{{v_2}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{l}}
0\\
0
\end{array}} \right]}
\end{array}\]由上式可知我們在決定 $\lambda$ 使得並求解 Null Space of ${\left[ {\begin{array}{*{20}{c}}
{\lambda  - 1}&0\\
0&{  \left( {\lambda  + 1} \right)}
\end{array}} \right]}$ 故若我們選 $\lambda := \lambda_1 = 1 $ 則對應的 ${\bf v}_1 = [s\;\;0]^T$ 其中 $s \in \mathbb{R}^1$。

另外若選 $\lambda := \lambda_2 = -1$ 則對應的 ${\bf v}_2 = [0\;\;t]$ 其中 $t \in \mathbb{R}^1$。 $\square$


由上述討論所求出的 $\lambda$ 與 ${\bf v}$ 即為所謂特徵值與特徵向量,現在我們引入 eigenvalue 與 eigenvector 定義


======================
Definition:  Eigenvalue and Eigenvector
令 $V$ 為 $n$ 維度向量空間且 $L: V \to V$ 為定義在 $V$ 上的 線性算子。我們稱 $\lambda$ 為 $L$ 的特徵值( eigenvalue of $L$) 若存在一組非零向量 ${\bf x} \in V$ 使得
\[
L({\bf x}) = \lambda {\bf x}
\]且 任意非零向量 ${\bf x}$ 滿足上式稱為 $L$ 對應於特徵值 $\lambda $ 的特徵向量 (eigenvector of $L$ associated with the eigenvalue $\lambda$)
======================

Remark: 
1. 上述定義中的純量 $\lambda$ 與向量 ${\bf x}$皆可為 實數或者複數。有興趣的讀者請看 Example 2
2. 若我們允許 ${\bf x} = {\bf 0}$ 則 任意 $\lambda$ 都可為 eigenvalue 因為
\[
L({\bf x}) = \lambda {\bf x} \Rightarrow L({\bf 0}) = \lambda {\bf 0}
\]則任何 $\lambda$ 都滿足上式。
3. 事實上特徵值與特徵向量在無窮維向量空間 亦可被定義,有興趣讀者請看 Example 3


===================
Fact: 令 $L:V\to V$ 為線性算子,若 ${\bf x}$ 為 eigenvector of $L$ associated with the eigenvalue ${\lambda}$ 則 對任意實數 $c \in \mathbb{R}^1$ 我們有
\[
L(c {\bf x}) = \lambda (c {\bf x})
\]===================

Proof:
由於 ${\bf x}$ 為 eigenvector of $L$ associated with the eigenvalue ${\lambda}$ 我們有 對任意非零向量 ${\bf x} \neq {\bf 0}$
\[
L({\bf x}) = \lambda ({\bf x})
\] 現在觀察
\[\begin{array}{l}
L(c{\bf{x}}) = cL({\bf{x}})\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = c\left( {\lambda {\bf{x}}} \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = \lambda \left( {c{\bf{x}}} \right)
\end{array}\]讀者應注意到上述第一條等式應用 $L$ 為線性算子的性質。$\square$


以下我們用一個例子來說明何時會發生複數的 eigenvalue $\lambda$ 與 負數特徵向量 ${\bf x}$

Example 2:
考慮線性算子 $L: \mathbb{R}^2 \to \mathbb{R}^2$ 滿足
\[L\left( {\left[ \begin{array}{l}
{x_1}\\
{x_2}
\end{array} \right]} \right) = \left[ \begin{array}{l}
 - {x_2}\\
{x_1}
\end{array} \right]\]試求 eigenvalue of $L$ 與對應的 eigenvector

Solution
回憶前述定義,線性算子 $L$ 的特徵值 $\lambda$ 必須滿足 $L\left( {\bf{x}} \right) = \lambda {\bf{x}}$ 故現在觀察
\[\begin{array}{l}
L\left( {\bf{x}} \right) = \lambda {\bf{x}}\\
 \Rightarrow L\left( {\left[ \begin{array}{l}
{x_1}\\
{x_2}
\end{array} \right]} \right) = \left[ \begin{array}{l}
 - {x_2}\\
{x_1}
\end{array} \right] = \lambda \left[ \begin{array}{l}
{x_1}\\
{x_2}
\end{array} \right]\\
 \Rightarrow \lambda \left[ \begin{array}{l}
{x_1}\\
{x_2}
\end{array} \right] - \left[ \begin{array}{l}
 - {x_2}\\
{x_1}
\end{array} \right] = \left[ \begin{array}{l}
0\\
0
\end{array} \right]\\
 \Rightarrow \left[ {\begin{array}{*{20}{c}}
\lambda &1\\
{ - 1}&\lambda
\end{array}} \right]\left[ \begin{array}{l}
{x_1}\\
{x_2}
\end{array} \right] = \left[ \begin{array}{l}
0\\
0
\end{array} \right]
\end{array}\]觀察上述線性系統方程,求解 Null Space of $\left[ {\begin{array}{*{20}{c}}
\lambda &1\\
{ - 1}&\lambda
\end{array}} \right]$ 可得到以下結果:

若 $\lambda = \lambda_1 = i$ 則對應的特徵向量可透過將 $\lambda = \lambda_1$ 帶回上述線性系統方程並求解 ${\bf x}_1$ 如下 \[
{\bf x}_1 = s[i \;\; 1]^T,\;\; \forall s \in \mathbb{R}^1
\]
若 $\lambda = \lambda_i =-i$ 則對應的特徵向量可透過將 $\lambda = \lambda_2$ 帶回上述線性系統方程並求解 ${\bf x}_2$ 如下
\[
{\bf x}_2 = t[-i \;\; 1]^T,\;\; \forall t \in \mathbb{R}^1
\]
注意到上述結果之中,$L$ 的 特徵值皆為複數:亦即 $\lambda_{i} \in \mathbb{C}$ 對任意 $i=1,2$ 且對應的特徵向量亦為 $\mathbb{C}^2$ 複數向量。且這表示原本題目之中要求 $L: \mathbb{R}^2 \to \mathbb{R}^2$ 並無法找到對應的複數向量除非我們更改 domain 與 codomain 使其變成 $\mathbb{C}^2$


Example 3: Eigenvalue Problem in Function Space
考慮 $V:=C^\infty (\mathbb{R})$ 亦即 $V$ 為所有 單變數實數函數所成的向量空間 且我們假設其上的函數任意階導數存在。現在令 $L: V \to V$ 為線性算子滿足
\[
L(f) := f'
\]
則我們想問是否可找到 常數 $\lambda$ 與 函數 $f \neq 0$ 且 $f \in V$ 使得 $L(f) = \lambda f$ 成立?

 Solution
令 $f \in V$ 為單變數函數,注意到 $L(f) = f'$ 為線性算子(why?),現在觀察 $L(f) = f' = \lambda f $ 亦即 我們要找出 $\lambda$ 與對應的 $f \neq 0, f \in V$ 滿足
\[
f' = \lambda f
\] 由於我們要找的 $f$ 必須無窮維導數存在 且一次導數必須滿足 $f' = \lambda f$,故我們猜 $f(t) = e^{\lambda t}$ 則
\[\frac{d}{{dt}}\left( {{e^{\lambda t}}} \right) = \lambda {e^{\lambda t}} = \lambda f\left( t \right)\]故現在我們找到一組 $f$ 滿足該方程,但是否有其他人選?答案是肯定的,比如說我們改令
\[
f(t) = K e^{\lambda t}
\]仍為該方程 $f' = \lambda f$ 的解 (讀者可自行驗證),因此我們有以下結果,對任意 特徵值 $\lambda \in \mathbb{R}^1$,其特徵向量 $f(t) = K e^{\lambda t} $ 其中 $K$ 為任意非零常數。$\square$

Comment:
1. 上述例子中顯示微分方程 $f' = \lambda f$ 的解 $f(t) = exp(\lambda t)$ 剛好為該 $L(f) = f'$ 的對應於特徵值 $\lambda$ 的特徵向量。

2. 若我們只關心 $f>0$ 上述微分方程可直接求解不必猜測,解法如下:
\[\begin{array}{l}
f' = \lambda f\\
 \Rightarrow \frac{{df\left( t \right)}}{{dt}} = \lambda f\left( t \right)\\
 \Rightarrow \frac{{df\left( t \right)}}{{f\left( t \right)}} = \lambda dt\\
 \Rightarrow \int {\frac{1}{{f\left( t \right)}}df\left( t \right)}  = \int {\lambda dt} \\
 \Rightarrow \log f\left( t \right) + C = \lambda t + D\\
 \Rightarrow f\left( t \right) = {e^{\lambda t}}{e^{D-C}}: = K{e^{\lambda t}}
\end{array}\]