2010年8月29日 星期日

[線性系統] 對角化 與 Eigenvalues and Eigenvectors

首先我們給出相關定義

============================
Definition (Eigenvalue and Eigenvector)
設 $A$ 為 $n \times n$ 方陣,若存在一非零向量 $x \in \mathbb{R}^n$ (or $\in \mathbb{C}^n$) 與 純量 $\lambda \in \mathbb{R}^1$ (or $\in \mathbb{C}^1$)滿足
\[
Ax = \lambda x
\]則我們稱 $\lambda$ 為 $A$ 的 特徵值 (eigenvalue) 且 $x$ 為 $A$對應於 $\lambda $ 的特徵向量(eigenvector)。
============================
Comments:
1. 上述定義中 $Ax = \lambda x$ 又稱 eigenvalue-eigenvector 關係: $( \lambda I - A)x =0$,注意! $0$ 為 零向量!!。
2. 若 $A$ 為 $n \times n$ 方陣,則我們稱下式
\[\det (\lambda I - A)\]為 $A$ 矩陣的 特徵多項式(characteristic polynomial) 且 $\det(\lambda I -A)=0$ 為特徵方程(characteristic equation)。

現在考慮 LTI 系統 (但無考慮外力 $u=0$) 以狀態空間表示
\[
\dot {x} = Ax,
\]其中 $x$ 為 $n \times 1$ 狀態向量,$A$ 為 $n \times n$ 常數矩陣。現在對上式取拉式轉換 且令初值為零,
\[sX\left( s \right) = AX\left( s \right) \Rightarrow \left( {sI - A} \right)X\left( s \right) = 0
\] 亦即對上述系統而言,其解特徵方程 (characteristic polynomial) 可寫為
\[
\det( s I - A) =0
\]且 特徵方程式的根 即為 eigenvalue。


對角化 (Diagonalization)

考慮  $A$ 為 $n$ 階方陣 ,且 $A$ 與 一個 對角矩陣(diagonal matrix) $ \Lambda$ 相似 (亦即有相同的 eigenvalue),則稱此 $A$ 矩陣為可對角化 (diagonalizable);亦即存在一個 non-singular transformation matrix $T$ 使得
\[
\Lambda = T^{-1}AT
\]

FACT: 若 $n$ 階方陣 $A$ 為可對角化(Diagonalizable),則必須具備 $n$個線性獨立的 eigenvector。
Proof: omitted
NOTE: $n$個線性獨立的 eigenvector 具有 $n$ 個對應的 相異 eigenvalue


由於矩陣的對角化可借助 eigenvalue 與 eigenvector 來達成,且依照 eigenvalue 的不同情況(共有三種情況)會有所各自不同的衍生討論,我們將各種情況總結如下:
  1. 矩陣 $A$ 具有 相異特徵值 (distinct eigenvalues)
  2. 矩陣 $A$ 具有 重複特徵值 (repeated eigenvalues)
  3. 矩陣 $A$ 具有 複數特徵值 (complex eigenvalues)

以下我們逐項討論:

Case I: 相異特徵值 (Distinct eigenvalues)
考慮  $A$ 為 $n \times n$ 方陣,其特性方程
\[
\det(\lambda_iI - A) =0, \; \forall i
\]且 $\lambda_1 \neq \lambda_2 \neq ... \neq \lambda_n$。那麼對於 第 i 個 eigenvalue $\lambda_i$而言,其對應的 eigenvector 定為 $v_i$,且滿足 eigenvalue-eigenvector 關係
\[({\lambda _i}I - A){v_i} = 0\]那麼對任意 $i$ 而言,我們有
\[({\lambda _i}I - A){v_i} = 0 \Rightarrow {\lambda _i}{v_i} = A{v_i}\]亦即
\[ \Rightarrow \left\{ \begin{array}{l}
{\lambda _1}{v_1} = A{v_1}\\
{\lambda _2}{v_2} = A{v_2}\\
 \vdots \\
{\lambda _n}{v_n} = A{v_n}
\end{array} \right.
\]現在將上述結果寫成矩陣形式:
\[\begin{array}{*{20}{l}}
{\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}{v_1}}&{{\lambda _2}{v_2}}& \cdots &{{\lambda _n}{v_n}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{A{v_1}}&{A{v_2}}& \cdots &{A{v_n}}
\end{array}} \right]}\\
{ \Rightarrow \underbrace {\left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]}_{n \times n}\underbrace {\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}}&0& \cdots &0\\
0&{{\lambda _2}}&{}& \vdots \\
 \vdots &{}& \ddots &0\\
0& \cdots &0&{{\lambda _n}}
\end{array}} \right]}_{n \times n} = A\underbrace {\left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]}_{n \times n}}
\end{array}\]令 $T: = \left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]$ 且
\[
\Lambda := {\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}}&0& \cdots &0\\
0&{{\lambda _2}}&{}& \vdots \\
 \vdots &{}& \ddots &0\\
0& \cdots &0&{{\lambda _n}}
\end{array}} \right]}
\]則我們有
\[\begin{array}{l}
T\Lambda  = AT \Rightarrow \Lambda  = {T^{ - 1}}AT
\end{array}\]若 $T$ 為 nonsingular (i.e., $T$ 有 $n$ 個線性獨立的 row or columns 亦即 eigenvectors 之間彼此線性獨立)。

那麼現在我們證明 $T$ 確實為 nonsingular matrix。
Proof
用歸納法:令 $n=2$ 對任意兩個 eigenvector $v_i, v_j$ 而言,我們要證明此兩者為線性獨立,亦即由線性獨立的定義,對下式
\[
\alpha_i v_i + \alpha_j v_j =0 \ \ \ \ (*)
\]其係數 $\alpha_i = \alpha_j =0$。

故現在觀察 $(*)$ 式,兩邊同乘 $(\lambda_i I - A)$
\[\begin{array}{l}
{\alpha _i}\underbrace {({\lambda _i}I - A){v_i}}_{ = 0\begin{array}{*{20}{c}}
{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}def.} + {\alpha _j}({\lambda _i}I - A){v_j} = 0\\
 \Rightarrow {\alpha _j}({\lambda _i}I - A){v_j} = 0\\
 \Rightarrow {\alpha _j}({\lambda _i}I - A - {\lambda _j}I + {\lambda _j}I){v_j} = 0\\
 \Rightarrow {\alpha _j}({\lambda _i}I - {\lambda _j}I + \left( {{\lambda _j}I - A} \right)){v_j} = 0\\
 \Rightarrow {\alpha _j}\left( {{\lambda _i}I - {\lambda _j}I} \right){v_j} + \underbrace {{\alpha _j}\left( {{\lambda _j}I - A} \right){v_j}}_{ = 0\begin{array}{*{20}{c}}
{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}def.} = 0\\
 \Rightarrow {\alpha _j}\left[ {\left( {{\lambda _i} - {\lambda _j}} \right)I} \right]{v_j} = 0
\end{array}\]又因為 $\lambda_i \neq \lambda_j$ (因為我們假設相異特徵值),且特徵向量 $ v_j \neq 0$ 故必然 $\alpha_j = 0$。
同理可推至 $n$個情況,這邊留給讀者自行證明。 $\square$


透過以上討論我們知道對相異 eigenvalue的情況必定存在 nonsingular matrix $T$ 使得 $A$ 可被對角化 (亦即由 彼此線性獨立 eigenvector 建構 $T$ 矩陣),但若我們有矩陣並不具有 $n$ 個獨立 eigenvector 該怎麼辦呢?  這個情況將會發生在 $A$ 矩陣有重根的時候:


Case II: 重複特徵值 (Repeated eigenvalues) 
考慮矩陣 $A$ 為 $n \times n$ 矩陣且具有 $m$ 個重複特徵值,亦即
\[
\lambda_1 = \lambda_2 = ... = \lambda_m
\]那麼這些重複的特徵值仍必須滿足特徵方程,亦即我們有
\[
\det(\lambda_m I - A) =0
\]且由於出現重根,在此情況下我們不再具有 $n$ 個線性獨立的 eigenvectors;故我們想知道到底剩下幾個 eigenvector 仍是線性獨立,故我們計算 rank: 若
\[
\text{rank}\{ \lambda_m I - A\} =i
\] 則 我們具有 $n -i$ 個 對應於 $\lambda_m$ 的線性獨立 eigenvectors。

重根的情況其實頗為複雜,現在我們看一些例子:

Example 1
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&0&0\\
0&{{\lambda _m}}&0\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根  $\lambda_m$ ,且 $\text{rank} \{\lambda_m I - A \} =0$ 故此三重根 $\lambda_m$ 會對應 $3 - 0 = 3$ 個各自獨立的 eigenvectors。

Example 2
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&0&0\\
0&{{\lambda _m}}&1\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根  $\lambda_m$ ,但 $\text{rank} \{\lambda_m I - A \} = 1$ 故此三重根 $\lambda_m$ 會對應 $3 - 1 = 2$ 個各自獨立的 eigenvectors。

Example 2
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&1&0\\
0&{{\lambda _m}}&1\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根  $\lambda_m$ ,但 $\text{rank} \{\lambda_m I - A \} = 2$故此三重根 $\lambda_m$ 會對應 $3 - 2 = 1$ 個各自獨立的 eigenvectors。


那麼當矩陣 $A$ 不具備足夠的線性獨立 eigenvector 時,我們需引入新的概念,稱作廣義特徵向量(Generalized eigenvector)。且 eigenvector 與 generalized eigenvector 可以建構一個
 non-singular matrix $T$ 使得 $J:= T^{-1}AT$ 且我們稱此 $J$ 矩陣為 Jordan matrix。
=============================
Definition: Generalized eigenvector
我們稱向量 $v$ 為 矩陣 $A$ 對應於 eigenvalue, $\lambda$ 的 rank $k$ 廣義特徵向量(generalized eigenvector) 若下列條件成立
\[\left\{ \begin{array}{l}
{\left( {\lambda I - A} \right)^k}v = 0\\
{\left( {\lambda I - A} \right)^{k - 1}}v \ne 0
\end{array} \right.
\]其中 $k$ 為矩陣 $A$ 的重根數目
=============================
NOTE: $k=1$ 即為原本的 eigenvalue 與 eigenvector。 (無重根)


Example
試求 $A$ 矩陣的 Jordan matrix 。
\[A = \left[ {\begin{array}{*{20}{c}}
1&1&2\\
0&1&3\\
0&0&2
\end{array}} \right]
\]
Solution
首先求解 $A$ 矩陣對應的 eigenvalue:注意由於此矩陣為上三角矩陣,eigenvalue 直接就是對角線元素。或者讀者亦可由特徵方程 $\det(\lambda I - A) =0$ 可解得 $\lambda_i = 1,1,2, \;\; i=1,2,3$ (雙重根 $\lambda_1 = \lambda_2 = 1$)。

我們可先計算單根 $\lambda_3 = 2$ 部分對應的 eigenvector :由 eigenvalue-eigenvector 關係
\[\begin{array}{l}
\left( {{\lambda _3}I - A} \right){v_3} = 0\\
 \Rightarrow \left( {2\left[ {\begin{array}{*{20}{c}}
1&0&0\\
0&1&0\\
0&0&1
\end{array}} \right] - \left[ {\begin{array}{*{20}{c}}
1&1&2\\
0&1&3\\
0&0&2
\end{array}} \right]} \right){v_3} = 0\\
 \Rightarrow \left[ {\begin{array}{*{20}{c}}
1&{ - 1}&{ - 2}\\
0&1&{ - 3}\\
0&0&0
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{31}}}\\
{{v_{32}}}\\
{{v_{33}}}
\end{array}} \right] = 0\\
 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{31}}}\\
{{v_{32}}}\\
{{v_{33}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
5\\
3\\
1
\end{array}} \right]
\end{array}\]接著我們回頭對付重根 $( \lambda_1 = \lambda_2 = 1)$,先計算 $\text{rank}\{ \lambda_1 I - A\} = \text{rank}\{ \left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right] = 2 \}$ 故重根對應的線性獨立 eigenvector 數目為 $3 - 2 = 1$。我們先求此 eigenvector:
\[\begin{array}{*{20}{l}}
{\left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = 0}\\
{ \Rightarrow \left\{ {\begin{array}{*{20}{l}}
{ - {v_{12}} - 2{v_{13}} = 0}\\
{ - 3{v_{13}} = 0}\\
{ - {v_{13}} = 0}
\end{array}} \right. \Rightarrow \left\{ {\begin{array}{*{20}{l}}
{{v_{12}} = 0}\\
{{v_{13}} = 0}
\end{array}} \right.}
\end{array}\]三個未知數,兩條方程式,故 $v_{11}$ 為自由變數,令 $v_{11} =1 $ 可得 $\lambda_m$ 對應的一組 eigenvector 為
\[\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{1}}\\
{\rm{0}}\\
{\rm{0}}
\end{array}} \right]\]接著我們利用此eigenvector 產生 generalized eigenvector 且滿足
\[\begin{array}{l}
\left( {{\lambda _2}I - A} \right){v_2} =  - {v_1}\\
 \Rightarrow \left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{21}}}\\
{{v_{22}}}\\
{{v_{23}}}
\end{array}} \right] =  - \left[ {\begin{array}{*{20}{c}}
1\\
0\\
0
\end{array}} \right]\\
 \Rightarrow \left\{ \begin{array}{l}
 - {v_{22}} - 2{v_{23}} =  - 1\\
{v_{23}} = 0
\end{array} \right. \Rightarrow \left\{ \begin{array}{l}
{v_{22}} = 1\\
{v_{23}} = 0
\end{array} \right.
\end{array}\]故我們選 $v_{22} = 1$ 亦即
\[\left\{ {\begin{array}{*{20}{l}}
{{\lambda _1} = 1 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{1}}\\
{\rm{0}}\\
{\rm{0}}
\end{array}} \right];{\lambda _2} = 1 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{21}}}\\
{{v_{22}}}\\
{{v_{23}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{0}}\\
{\rm{1}}\\
{\rm{0}}
\end{array}} \right]}\\
{{\lambda _3} = 2 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{5}}\\
{\rm{3}}\\
{\rm{1}}
\end{array}} \right]}
\end{array}} \right.\]故其 nonsingular transformation matrix
\[T = \left[ {\begin{array}{*{20}{c}}
1&0&5\\
0&1&3\\
0&0&1
\end{array}} \right]\]
 Jordan matrix
\[
J = T^{-1} A T =\left[ {\begin{array}{*{20}{c}}
1&1&0\\
0&1&0\\
0&0&2
\end{array}} \right]
\]

Case III: Complex eigenvalues
考慮 $A$ 為 $2 \times 2$ 方陣,其特性方程滿足
\[
\det(\lambda_i - A) = 0
\]且 eigenvalue $\lambda = \sigma + j \omega$ 為 complex number 。

由上述可知 eigenvalue-eigenvector 關係
\[
(\lambda I - A) v_i =0
\] eigenvalue 為 complex value,其對應的 eigenvector $v_i$ 亦為 complex vector。

Example
考慮矩陣
\[A = \left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\]$a,b \in \mathbb{R}, b \ne 0$。則我們可對此矩陣先求 eigenvalue,利用特性方程式可知
\[\begin{array}{l}
\det \left( {\lambda I - A} \right) = 0 \Rightarrow \det \left( {\left[ {\begin{array}{*{20}{c}}
{\lambda  - a}&{ - b}\\
b&{\lambda  - a}
\end{array}} \right]} \right) = 0\\
 \Rightarrow {\left( {\lambda  - a} \right)^2} + {b^2} = 0\\
 \Rightarrow {\lambda ^2} - 2a\lambda  + \left( {{a^2} + {b^2}} \right) = 0\\
 \Rightarrow \lambda  = a \pm jb
\end{array}\]現在我們求對應的 eigenvectors:

對 ${\lambda _1} = a + jb$ 我們可計算其 eigenvector 為
\[\begin{array}{l}
\left( {{\lambda _1}I - A} \right){v_1} = 0 \Rightarrow \left( {\left( {a + jb} \right)I - A} \right){v_1} = 0\\
 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{\left( {a + jb} \right) - a}&{ - b}\\
b&{\left( {a + jb} \right) - a}
\end{array}} \right]{v_1} = 0\\
 \Rightarrow b\left[ {\begin{array}{*{20}{c}}
j&{ - 1}\\
1&j
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = 0\\
 \Rightarrow \left\{ \begin{array}{l}
j{v_{11}} - {v_{12}} = 0\\
{v_{11}} + j{v_{12}} = 0
\end{array} \right. \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
1\\
j
\end{array}} \right]
\end{array}\]
接著對 ${\lambda _2} = a - jb$
\[\begin{array}{l}
\left( {{\lambda _2}I - A} \right){v_2} = 0 \Rightarrow \left( {\left( {a - jb} \right)I - A} \right){v_2} = 0\\
 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{\left( {a - jb} \right) - a}&{ - b}\\
b&{\left( {a - jb} \right) - a}
\end{array}} \right]{v_2} = 0\\
 \Rightarrow b\left[ {\begin{array}{*{20}{c}}
{ - j}&{ - 1}\\
1&{ - j}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = 0\\
 \Rightarrow \left\{ \begin{array}{l}
 - j{v_{11}} - {v_{12}} = 0\\
{v_{11}} - j{v_{12}} = 0
\end{array} \right. \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
j\\
1
\end{array}} \right]
\end{array}\]故 nonsingular transformation matrix $T$ 為
\[T = \left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]\]且
\[\begin{array}{l}
{T^{ - 1}}AT = {\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]^{ - 1}}\left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right] = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
1&{ - j}\\
{ - j}&1
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
1&{ - j}\\
{ - j}&1
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{a + bj}&{aj + b}\\
{ - b + aj}&{ - bj + a}
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
{\left( {a + bj} \right) - j\left( { - b + aj} \right)}&{aj + b - j\left( { - bj + a} \right)}\\
{ - j\left( {a + bj} \right) - b + aj}&{ - j\left( {aj + b} \right) - bj + a}
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
{2a + 2jb}&0\\
0&{2a - 2jb}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{a + jb}&0\\
0&{a - jb}
\end{array}} \right]
\end{array}\]


2010年8月18日 星期三

[機率論] 隨機漫步- Wald's equation

這次要介紹 Random Walk + stopping time 的重要的結果,介紹之前我們需要一些先導概念

考慮 $T$ 為 stopping time,則 $ET =?$
注意到幾件事實:
1. 若 $P(T=\infty) >0$,則 $ET = \infty$
2. 若 $P(T = \infty)=0$ 且 $n \sum_n P(T=n) < \infty$ 若且唯若 $ET < \infty$
3. $P(T < \infty) = \sum_n^\infty P(T=n)$

=================
Theorem: Wald's Equation
令 $X_1, X_2,...$ 為 i.i.d. 且 $E|X_i| < \infty$,令 $S_n:=\sum_m^n X_m$。若 $N$ 為 stopping time 且 $EN < \infty $ 則 $ES_N = EX_1 EN$
=================

Proof:
首先假設 $X_i \ge 0$,觀察
\[E{S_N} = \sum\limits_{n = 1}^\infty  {E\left[ {{S_n}{1_{N = n}}} \right]}  = \sum\limits_{n = 1}^\infty  {E\left( {\sum\limits_{k = 1}^n {{X_k}{1_{N = n}}} } \right)} \]由於 $X_n \ge 0$ 故 利用 Fubini Theorem 我們可對調 summation 順序:
\[\sum\limits_{n = 1}^\infty  {\sum\limits_{k = 1}^n {E{X_k}{1_{N = n}}} }  = \sum\limits_{k = 1}^\infty  {\sum\limits_{n = k}^\infty  {E{X_k}{1_{N = n}}} } \]現在注意到 ${1_{\left\{ {N \ge k} \right\}}} = {1_{{{\left\{ {N \le k - 1} \right\}}^c}}} \in {F_{k - 1}}$ 由於 $X_k$ 為 independent,故 $X_k \perp F_{k-1}$ ,亦即可將其改寫為
\[\begin{array}{l}
\sum\limits_{k = 1}^\infty  {E{X_k}{1_{N \ge k}}}  = \sum\limits_{k = 1}^\infty  {E{X_k}E{1_{N \ge k}}} \\
 \Rightarrow E{S_N} = E{X_1}\sum\limits_{k = 1}^\infty  {E{1_{N \ge k}}}  = E{X_1}\sum\limits_{k = 1}^\infty  {P\left( {N \ge k} \right)} \ \ \ \ \ (*)
\end{array}\]現在注意到
\[\begin{array}{l}
\sum\limits_{k = 1}^\infty  {P\left( {N \ge k} \right)}  = P\left( {N \ge 1} \right) + P\left( {N \ge 2} \right) + P\left( {N \ge 3} \right) + ...\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} = \left[ \begin{array}{l}
P\left( {N = 1} \right) + P\left( {N = 2} \right) + P\left( {N = 3} \right) + ... + \\
\begin{array}{*{20}{c}}
{}&{}
\end{array} + P\left( {N = 2} \right) + P\left( {N = 3} \right) + ... + \\
\begin{array}{*{20}{c}}
{}&{}
\end{array} + P\left( {N = 3} \right) + P\left( {N = 4} \right) + ... + \\
\begin{array}{*{20}{c}}
{}&{}
\end{array} + ...
\end{array} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} = P\left( {N = 1} \right) + 2P\left( {N = 2} \right) + 3P\left( {N = 3} \right) + ...\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} = \sum\limits_{k = 1}^\infty  {kP\left( {N = k} \right)}  = E\left[ N \right]
\end{array}\]故 $(*)$ 可表為
\[E{S_N} = E{X_1}\sum\limits_{k = 1}^\infty  {P\left( {N \ge k} \right)}  = E{X_1}ET\]


2010年8月15日 星期日

[半導體] 半導體的不均勻參雜 (Nonuniform doping) 與內建電場

回憶若半導體為均勻參雜(uniform doping),則
對於參雜 III 族元素(e.g., ) 而言,會得到 P-type 半導體,hole 為主要載子,濃度為 $p=N_A$
對於參雜 V 族元素而言,會得到 N-type 半導體,electron 為主要載子,濃度為 $n=N_D$

但現在若考慮參雜為不均勻分布,則對應的 $N_A, N_D$ 濃度將不再是固定常數,而是一個隨空間變化的函數,為了分析簡便我們這邊採用 1-Dimensional ,亦即 electron or hole 的濃度為 $x$ 的函數如下
\[
N_A(x), N_D(x)
\]現在令  $p^+(x)$ 表 電洞濃度,$N_A^-(x)$ 表對應的三價雜質的離子濃度。則此時我們不能再說電洞濃度 $p^+(x) = N_A^-(x)$ 或者 電子濃度 $n^-(x) = N_D^+(x)$,因為一旦成為了空間的函數,若濃度不均,就會產生 擴散效應 (diffusion ) 。

故在不均勻參雜的情況,我們有
\[\left\{ \begin{array}{l}
p\left( x \right) \approx {N_A}\left( x \right)\\
n\left( x \right) \approx {N_D}\left( x \right)
\end{array} \right.\]
現在我們以一個 開路 P-type 半導體為例
繪製濃度與空間的圖形如下:
上圖顯示了在 $N_A(x)$ 濃度較高處 (e.g., $x=x_1$),則我們有
\[
N_A^-(x) \ge p^+(x)
\]亦即此時的 淨電荷(net charge)為 負電荷。
在 $N_A(x)$ 濃度較低處 (e.g., $x=x_2$),則我們有
\[
N_A^-(x) \le p^+(x)
\]亦即此時的 淨電荷(net charge)為 正電荷。

故整體而言,雜質的濃度會在 $x_2$ 區域 積聚淨正電荷,並在 $x_1$ 區域積聚淨負電荷,此時便會產生內建電場 (build-in electric field) $\vec E(x)$,其方向會由正電荷指向負電荷方向 (濃度高指向濃度低) 如下圖所示

一旦產生此內建電場,便會對其中的半導體中的載子形成飄移電流(Drift current) 進而產生有所謂的 內建電位差 $V_{21}$

那麼我們的問題便是 內建電位差是多少?
我們首先逐步計算此電位差,由於 P-type 為開路,故電流為 $0$,亦即我們令 $J_p$ 表總電洞電流密度,$J_{p,drift}$ 為電洞的飄移電流密度,$J_{p,diffusion}$ 為電洞的擴散電流密度,則我們有
\[{J_{p,total}} = {J_{p,drift}} + {J_{p,diffusion}} \equiv 0 \ \ \ \ (*)
\]回憶電洞飄移電流密度與飄移速度 $v_d$成正比以及 電洞擴散電流密度與濃度梯度成正比,故我們有下列關係
\[\left\{ \begin{array}{l}
{J_{p,drift}} = \left( {qp} \right){v_d} = qp{\mu _p}E\\
{J_{p,diffusion}} =  - q{D_p}\frac{{dp}}{{dx}}
\end{array} \right.\]現在將上式帶入 $(*)$ 可得
\[\begin{array}{l}
{J_{p,drift}} + {J_{p,diffusion}} \equiv 0\\
 \Rightarrow qp{\mu _p}E - q{D_p}\frac{{dp}}{{dx}} = 0\\
 \Rightarrow E = \frac{{{D_p}}}{{p{\mu _p}}}\frac{{dp}}{{dx}}
\end{array}
\]現在利用電場定義 $E = -dV/dx$ 帶入上式並且兩邊同取積分,我們可得
\[\begin{array}{l}
\frac{{ - dV}}{{dx}}dx = \frac{{{D_p}}}{{{\mu _p}}}\frac{{dp}}{p}\\
 \Rightarrow \int_1^2 {dV}  =  - \frac{{{D_p}}}{{{\mu _p}}}\int_1^2 {\frac{{dp}}{p}} \\
 \Rightarrow {V_2} - {V_1} = \underbrace {\frac{{{D_p}}}{{{\mu _p}}}}_{: = {V_T}}\ln \left( {\frac{{{p_1}}}{{{p_2}}}} \right)\\
 \Rightarrow {V_{21}} = {V_T}\ln \left( {\frac{{{p_1}}}{{{p_2}}}} \right)
\end{array}\]


[半導體] 霍爾量測 (Hall measurement)

現在考慮 N-type 半導體並且施加外力電場 $\vec E$ 與外力磁場 $\vec B$ 如下圖所示


由 N-type 定義 與 上圖我們知道:
1. N-type 半導體 電子為多數載子,電洞為少數載子。
2. 電子帶負電,由於受到外力電場 $\vec E$ 往 $+x$ 方向作用之下,電子會往 $-x$ 方向飄移(drift),在者電子亦受到外力磁場 $\vec B$ 往 $+y$ 方向作用,此時由右手定則 ($-x \times y = -z$) 但由於電子帶負電,故會產生向 $+z$ 方向的力在電子身上。也就是說電子受到合力為向 $-x$ 與 向 $+z$ 方向,故最後電子會逐漸積聚在 N-type 半導體的上板,如下圖結果


再由於上板積聚負電荷,最終導致下版產生感應正電荷如下


此時若我們量測 N-type 上下版的電壓 $v_H$,如下圖
則此時我們會得到 $v_H <0$ 我們稱此電壓為 Hall voltage,且這樣僅施加外力電場 與 外力磁場到 半導體上來量測電壓的方法稱作 Hall measurement。
注意到此時 carrier 為帶負電的 electrons 朝 $-x$ 方向飄移。

現在我們看看 P-type 半導體:
同樣對其施加外力電場 $\vec E$ 與外力磁場 $\vec B$ 如下圖所示

由 P-type 定義 與 上圖我們知道:
1. P-type 半導體 電洞 (hole) 為多數載子,電子 (electron) 為少數載子
2. hole 帶正電,由於受到外力電場 $\vec E$ 往 $+x$ 方向作用之下,電洞會往 $+x$ 方向飄移(drift),在者電洞亦受到外力磁場 $\vec B$ 往 $+y$ 方向作用,此時由右手定則 ($x \times y = +z$) 且由於電洞帶正電,故最終會產生向 $+z$ 方向的力在電洞身上。也就是說電洞受到合力為向 $+x$ 與 向 $+z$ 方向,故最後帶正電的 hole 會逐漸積聚在 N-type 半導體的上板,且下版會產生感應負電荷,如下圖結果

此時若我們量測 P-type 上下版的電壓 $v_H$,如下圖

則此時我們會得到 Hall voltage, $v_H > 0$ 。此時 載子carrier 為 帶正電的電洞朝 $+x$ 方向飄移。

2010年8月14日 星期六

[半導體] 半導體中的電流- drift current & diffusion current

半導體中的電流是由電子(electron)及電洞(hole)兩種載子(carrier)移動所產生

載子移動的方式:
  1. 擴散(diffusion) $\Rightarrow$ 擴散電流 (不受外力電場作用)
  2. 飄移(drift) $\Rightarrow$ 飄移電流 (受外力電場作用)
擴散 與 擴散電流
現在定義電子濃度為 $n$,電洞濃度為 $p$,單位皆為  $(\#/{cm}^3)$

擴散電流(Diffusion Current)
若半導體中濃度分布不均就會產生擴散 (由濃度高流向濃度低),無關外力電場只與濃度 $p, n$ 的梯度 (gradient) $\frac{dp}{dx}$ 有關  

亦即,擴散電流 $ \propto \frac{\Delta p}{\Delta x}$

現在我們定義 電流方向 為 電荷 流動的方向

則對於電子 electron 而言,由於其 帶負電,故當濃度高的電子往濃度低的電子擴散的時候,帶負電的電子移動產生 diffusion current,且此 diffusion current 的方向可如下圖所示

則對於電洞 hole 而言,由於其 帶電,故當濃度高的電洞往濃度低的電子擴散的時候,帶正電的電洞移動產生 diffusion current,且此 diffusion current 的方向可如下圖所示




現在我們定義電流密度(current density) $J$ 為 單位面積流過的電流 (單位: 安培/平方公分):
\[
J := \frac{I}{A}, \; (A/{cm^2})
\]
故我們現在可寫下對應 electron 與 hole 的擴散電流密度 diffusion current density $J_{diffusion}$ 如下
\[{J_{diffusion}} \propto \frac{{dp}}{{dx}} \Rightarrow \left\{ \begin{array}{l}
{J_{p,diffusion}} =  - q{D_p}\frac{{dp}}{{dx}}\\
{J_{n,diffusion}} = q{D_n}\frac{{dn}}{{dx}}
\end{array} \right.
\]其中 $D_p$ 表 電洞的擴散常數diffusion constant of hole; $D_n$ 表 電子的擴散常數(diffusion constant of electron)。

另外注意到上式中 $J_{p,diffusion}$前方有負號,是因為其濃度梯度方向 $dp/dx$ 為梯度下降方向,但是擴散電流方向仍朝右方前進 ($x$ 增加的方向),故若總結電流方向 (朝右),則勢必要額外多乘上 負號 來維持我們的方向一致。

且 總擴散電流密度 (Total diffusion current density)
\[\begin{array}{l}
{J_{total,diffusion}} = {J_{p,diffusion}} + {J_{n,diffusion}}\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} =  - q{D_p}\frac{{dp}}{{dx}} + q{D_n}\frac{{dn}}{{dx}}
\end{array}\]
Comment:
$D_p, D_n$ 的單位可計算如下:
令 $[ \cdot ]$ 表示 $\cdot$ 的單位,現在以 $D_n$ 為例,
\[
{J_{n,diffusion}} = q{D_n}\frac{{dn}}{{dx}}
\]現在對上式兩邊取單位,我們可得
\[\begin{array}{*{20}{l}}
{ \Rightarrow \left[ {{D_n}} \right] = \frac{{\left[ {{J_{n,diffusion}}} \right]}}{{\left[ {q\frac{{dn}}{{dx}}} \right]}}}\\
{\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} = \frac{{\left[ {A/c{m^2}} \right]}}{{\left[ {Q\frac{{\# /c{m^3}}}{{cm}}} \right]}} = \left[ {\frac{A}{Q}} \right]\left[ {c{m^2}} \right] = \left[ {\frac{{c{m^2}}}{{\sec }}} \right]}
\end{array}\]又因為電荷量 = 電流 乘上時間,亦即 $q = I \cdot t \Rightarrow \left[ q \right] = \left[ {I \cdot t} \right] \Rightarrow Q = A \cdot \sec $故
\[\left[ {{D_n}} \right] =  {\frac{{[c{m^2}]}}{{[\sec ]}}} \]


飄移電流(Drift current)
電荷載子在電場 $\vec E$ 中受到力的作用,而在電場 $\vec E$ 方向產生運動稱為飄移
(Example: 假設施加電場方向向右,則對帶正電的hole而言,其產生的飄移電流會往右移動,但對於帶負電的電子而言,其(平均)飄移電流則會往左移動)

下圖顯示了電場 $E$ 與 dirft velocity $v_d$ 之間的關係:
可以看出在低電場 $E < 10^3 \; (v/cm)$的狀態,載子的飄移速度(drift velocity, $v_d$) 與電場強度成正比 (線性關係)
\[
{v_d} \propto E
\]故我們可額外引入一個常數 $\mu$ 來描述此現象,我們稱 $\mu$ 為 遷移率(mobility),是用來描述在有電場作用下,用以測量載子飄移速度快慢的物理量。

我們可進一步寫為
\[{v_d} \propto E \Rightarrow \left\{ \begin{array}{l}
{v_{p,drift}} = {\mu _p}E\\
{v_{n,drift}} =  - {\mu _n}E
\end{array} \right.
\]其中 $\mu_p$ 為 電洞遷移率 (mobility of holes),$\mu_n$ 為電子遷移率。

上式 $v_{n,drift}$ 負號來自於由於當施加電場時,電子流向與電場方向相反。注意到 $\mu$ 的單位為
\[\begin{array}{*{20}{l}}
{\left[ {{v_{p,drift}}} \right] = \left[ {{\mu _p}E} \right]}\\
{ \Rightarrow \left[ {{\mu _p}} \right] = \frac{{\left[ {{v_{p,drift}}} \right]}}{{\left[ E \right]}} = \frac{{\left[ {cm/\sec } \right]}}{{\left[ {v/cm} \right]}} = \left[ {\frac{{c{m^2}}}{{v \cdot \sec }}} \right]}
\end{array}\]
有了 drift velocity $v_d$ 我們便可開始計算對應的 Drift current density $J_{drift}$。

Drift Current Density

飄移電流密度定義為 電荷密度 $\rho$ 與 載子 drift velocity $v_d$ 的乘積;亦即
\[
J_{drift} := \rho \cdot v_d
\] 現在我們用下圖說明為何上式如此定義:考慮一具有截面積 $A$ 長度為 $l$ 且內含 電荷密度 $\rho$ 的微小立方體,並且在施加電場 $E$ 後,載子具有飄移速度 $v_d = l/t$ 如下圖
上圖自截面積 $A$ 處流出的電流 為單位時間 $t$ 流過的電量$Q$,亦即 $I := Q/t$,又因為電荷密度 $\rho := Q/V$ 其中 $V$ 為體積。故我們可得
\[I = \frac{Q}{t} = \frac{{\rho V}}{t}
\]由上圖我們知道微小立方體體積為 $V = A \times l$ 故
\[I = \frac{Q}{t} = \frac{{\rho V}}{t} = \frac{{\rho Al}}{t} = \rho A{v_d}
\]又由電流密度的定義 $J := I/A$ 可知
\[{J_{drift}} = \frac{I}{A} = \rho \cdot{v_d} \ \ \ \ (*)
\]

現在我們分別針對載子為電洞 與 電子的情況來討論:
在前面討論中我們已知

  • 電洞飄移速度 $v_{p,drift} = \mu_p E$,
  • 電子飄移速度為 $v_{n,drift} = -\mu_n E$

且我們又知道
對電洞載子而言,電荷密度 $\rho $= 電荷量 $q$ 與 電洞濃度 $p$ 的乘積:$\rho = q \times p$
對電子載子而言。電荷密度 $\rho $ = 電荷量 $q$ 與 電子濃度 $n$ 的乘積:$\rho = -q \times n$ (因為電子帶負電)
故我們總結以上結果,可進一步改寫電流密度 $(*)$如下
\[\left\{ {\begin{array}{*{20}{l}}
{{J_{p,drift}} = \rho {v_{p,drift}}}\\
{{J_{n,drift}} = \rho {v_{n,drift}}}
\end{array}} \right. \Rightarrow \left\{ {\begin{array}{*{20}{l}}
{{J_{p,drift}} = \left( {qp} \right)\left( {{\mu _p}E} \right)}\\
{{J_{n,drift}} = \left( { - qn} \right)\left( { - {\mu _n}E} \right)}
\end{array}} \right.\]故總電流密度
\[
{J_{drift}} = {J_{p,drift}} + {J_{n,drift}} = q\left( {p{\mu _p} + n{\mu _n}} \right)E \ \ \ \ (\star)
\]

半導體導電度(conductivity)
半導體導電度 $\sigma$ 定義為單位電場強度的飄移電流密度,亦即
\[\sigma : = \frac{{{J_{drift}}}}{E}
\]故由 $(\star)$ 可知
\[\sigma  = \frac{{{J_{drift}}}}{E} = q\left( {p{\mu _p} + n{\mu _n}} \right)
\]亦即 導電度是與 電子電洞濃度 $n,p$ 與 飄移率 $\mu_n, \mu_p$ 有關,現在我們可以給個

總結

本質半導體:$p=n=n_i\Rightarrow \sigma= q{n_i}\left( {{\mu _p} + {\mu _n}} \right)$
外質半導體 (本質半導體參雜 III 族 (P type) 或者 V族元素 (N type) 之後的半導體):
  • N-type 半導體:$n=N_D >>p \Rightarrow \sigma   \cong q\left( {{N_D}{\mu _n}} \right)$
  • P-type 半導體:$p = N_A >> n \Rightarrow \sigma \cong q(N_A \mu_p)$
Comments: 
1.本質半導體 的濃度 $n_i$ 為對溫度極為敏感的函數 $n_i(T)$,但 N-type 與 $P-type$ 的 $N_D$ 與 $N_A$ 以對溫度無關且 $N_D, N_A >> n_i$。

2. 注意到對於半導體而言 $D_n/D_p \cong 3/1$ 且 $\mu_n/\mu_p \cong 3/1$。此說明了 electron 較 hole 為靈活。

3. 在室溫(300 K)之下,本質矽的 diffusion constant 與 mobility 如下
$\mu_p = 480\; {cm^2}/{v \cdot s}$
$\mu_n = 1350 {cm^2}/{v \cdot s}$
$D_p =12 \; {cm^2/s}$
$D_n = 34 \; {cm^2/s}$

且我們有如下關係
\[\frac{{{D_n}}}{{{\mu _n}}} = \frac{{{D_p}}}{{{\mu _p}}}: = {V_T}
\] 上述關係稱為 Einstein Relationship 且 $V_T$ 稱為 熱電壓 (Thermal voltage)

2010年8月12日 星期四

[數學分析] 淺談 Metric Space 與 點集拓墣

一般而言,若考慮 $x,y \in \mathbb{R}^1$,則此兩點 $x,y$ 間的距離 $d(x,y)$ 可表為
$$
d(x,y):=|x-y|
$$ 若 現在考慮 $x,y \in \mathbb{R}^2$ 則此兩點 $x:=(x_1,x_2),y:=(y_1,y_2)$ 間的距離 $d(x,y)$ 可用 $$
d(x,y): = {\left( {{{\left| {{x_2} - {x_1}} \right|}^2} + {{\left| {{y_2} - {y_1}} \right|}^2}} \right)^{1/2}}
$$ 表示。事實上,我們可將上述距離定義 逐步可以推廣到 $n$ 維空間甚至到更廣泛的空間。

但若我們考慮任意維度 (包含無窮維),則上述定義失效。此時我們需要考慮進一步 距離推廣,我們把此推廣稱作 metric。

Comment:
1. 注意到上述的距離函數 $d$ 並不是唯一,還有許許多多不同的距離函數可以定義只要其滿足 metric function 的公理,讀者可參閱以下定義。

2.  一但有了距離的概念,我們才可以開始定義所謂的極限,進而更進一步討論其他(我們感興趣的)性質。而一個集合 且我們能在其上定義  metric 則稱為此集合形成 Metric Space


====================
Definition: Metric Space
一個集合 $(X,d)$ 被稱作 Metric Space 若下列條件成立:
考慮集合 $X$ 中任意兩點 $p,q$ 並定義兩點 $p,q$的距離函數 (metric) $d: X \times X \to \mathbb{R}$  使得此 距離函數 滿足
1. $d(p,q) \geq 0$
2. 若 $p =q$ 則 $d(p,q) =0$
3. $d(p,q) = d(q,p)$
4. 對任意 $r \in X$,$d(p,q) \le d(p,r) + d(r,q)$
===================

Comments
1. $\mathbb{R}^k$ Euclidean 空間 為 Metric Space 其中 metric 定義為對 ${\bf x,y} \in \mathbb{R}^k$
\[
d({\bf x,y}) := |{\bf x-y}|
\]2. 任意 Subset $Y \subset X$ 亦為 metric space。

下面我們給出一些 Topology 的重要概念

===============================
Definition: Neighborhood, Limit Point, Closed Set, Interior Point, Open Set, Perfect Set, Bounded Set, 
令 $X$ 為一個 Metric Space。下列定義提及的點 points 與集合 sets 為此 Metric Space $X$ 的元素 或者 子集合。

一個點 $p$ 的鄰域 Neighborhood 為一個 集合,我們將其記做 $N_r(p)$ 且定義為
\[
N_r(p) := \{q \in X| d(p,q) <r \}
\]

考慮集合 $E \subset X$,則其中一個點 $p \in E$ 稱作 limit point of $E$ 若下列條件成立:
對任意鄰域 $N_r(p)$,存在點 $q \neq p$ 使得 $q \in E$

集合 $E$ 稱作 closed set 若下列條件成立:
若所有的 limit point of $E$ 都在集合 $E$ 中。 (亦即 $E$ 若包含所有的limit point 我們便稱 $E$ 為 closed set)

一個點 $p$ 稱作 interior point of $E$ 若下列條件成立:
若存在 $r >0$ 使得鄰域  $N_r(p) \subset E$

集合 $E$ 稱作 open set 若下列條件成立:
若任意點 $p \in E$ 都為 interior point of $E$

集合 $E$ 稱作 perfect set 若下列條件成立:
若 $E$ 為 closed 且 $E$ 中所有的點 皆為 limit point of $E$

集合 $E$ 為 bounded 若下列條件成立:
存在一實數 $M$ 與 一點 $q \in X$ 使得 對任意 $p \in E$, $d(p,q) < M$
===============================

接著看個重要的結果,下面的定理體現了數學分析的基本概念,也就是層層剝開定義,逐步求證。
================================
Theorem: 
任意 鄰域 Neighborhood 都為一個 open set。
================================
Proof
給定 $N_r(p) := \{q \in X| d(p,q) <r \}$ 為任意鄰域,欲證 $N_r(p)$ 為 open。

現由 open set 定義,我們需要證明 對任意點 $x \in N_r(p)$ 皆為 interior point of $N_r(p)$
故給定 $x \in N_r(p)$,要證 $x$ 為  interior point of $N_r(p)$

故再由 interior point 定義可知,我們要證明
存在一個 $N_R(x)$ 使得 $N_R(x) \subset N_r(p)$

由於 $x \in N_r(p)$,我們可知 $d(x,p)<r$,故此暗示了存在一個常數 $h$ 使得
\[
d(x,p) = r-h
\] 接著我們要找出 $N_R(x)$ 使得 $N_R(x) \subset N_r(p)$ 成立。

現令任意點 $q \in N_R(x) $ 則 我們由定義可知 $\ d(q,x) < R$,由於 $N_R(x)$ 必須要使 $N_R(x) \subset N_r(p)$ 成立,亦即 $d(q,p) < r$ 必須成立,故我們觀察 $d(p,q)$ 由 Metric 定義可知
 \[d\left( {q,p} \right) \le d\left( {q,x} \right) + d\left( {x,p} \right) < R + r - h\]
現令 $R = h $ 則我們有
\[\begin{array}{l}
d\left( {q,p} \right) \le d\left( {q,x} \right) + d\left( {x,p} \right) < R + r - h = r\\
 \Rightarrow d\left( {q,p} \right) < r \ \ \ \ \square
\end{array}
\]

Comments:
1. 並非任意集合都具備內點,比如僅由單點所構成的集合 e.g., $S:=\{1\}$ 。
2. 空集合為 open set 因其 interior 亦為 open 。

Example:
以下幾個簡單的例子請讀者自行驗證:給定 $z_0 \in \mathbb{C}$
1. 集合 \[
B_r(z_0):= \{z \in \mathbb{C}: |z-z_0| < r\}
\]與
\[
B_r(z_0):= \{z \in \mathbb{C}: |z-z_0| > r\}
\] 為 open

2.  集合 \[
B_r(z_0):= \{z \in \mathbb{C}: |z-z_0| \leq  r\}
\]與
\[
B_r(z_0):= \{z \in \mathbb{C}: |z-z_0| = r\}
\] 為 closed

3. 給定 $z_0 \in \mathbb{C}$,\[
B_r(z_0):= \{z \in \mathbb{C}: |z-z_0| < r\}\bigcup \{z\in \mathbb{C}: |z-z_0|=r, im(z-z_0)>0\}
\]不為 open 亦不為 close


Definition: Compactness
我們說一個集合 $K$ on metric space $(X,d)$ 為 compact 若下列條件成立:
對任意 open covers $G_\alpha$ (;i.e., $G_\alpha \subset X$ 為 open 且 $K \subset \cup_\alpha G_\alpha$) 而言,存在 有限個 subcovers 蓋住 $K$。

FACT: 若集合 $E \subset \mathbb{R}^n$,下列敘述等價:
1. $E$ 為 compact
2. $E$ 為 closed 且 bounded
3. 任意 $E$ 中的 無窮子集 都有 limit point in $E$。