第二章 背景技術介紹
2.1 麥克風陣列訊 號處理
傳統的數位訊號處理技術中,不外乎是藉由對訊號的時域及頻域資料狀 態做分析與處理,來進行不同應用的相關研究與發展。
多麥克風的陣列訊號處理,是將多個麥克風以特定的幾何形狀排列在一 起,並同時接收訊號。因為在空間中有著位置上的差異,每個麥克風對空間 中的同一點聲源接收到的訊號,會有時間延遲與能量衰減等等差異。對多麥 克風所接收到的多訊號進行處理與分析,就能從中獲得有利的空間資訊,並 藉此進行語音品質的純化與提升。
在多麥克風的陣列訊號處理的應用中,研究領域大致上分為兩大類別:
波 束 形 成 理論(Beamformer):
使用多訊號間的空間資 訊,對空間 中不同方位的訊號 進行分離與濾波。這 個技術能將多麥克風訊號以不同權重的相位與增益作疊加,對空間中指定方 位的訊號產生增強或減弱的效果,一般視為一種空間濾波器(Spatial Filter),
或稱之為波束形成器(Beamformer)。
訊 號 到 達 方位估測(Direction of Arrivals Estimation, DOA):
利用陣列感測器間的差 異,對空間 中聲源的個數或方 位進行估測。技術層 面常見的有三種,一種是利用聲音在空間中傳遞時間差來做方位估計的 TDE (Time Delay Estimation),第二種 是利用不同訊號 間特徵向量的分 布差異作互 相投影來做方位估計的 Eigenstructure Method,第三 種則是使用波束 形成器對 指定方向專注(focus)的效果來估測能量以決定聲源方位。
6
無論屬於哪一類,陣 列訊號處理的理 論通常都會先有 以下兩個基本假設,
使得理論推導更為精簡:
1. 窄頻訊號(Narrow Band Signal) 2. 遠場平面波(Far field plane wave)
基於這兩 個假設 ,隨 應用有 了各種 不同的 陣列架 構。不 同的 陣列架 構對 麥克風間訊號的差異也 會有不同的規則,看應用的 訴求而有不同的 功能(不同 角度判定範圍、仰角估測等等)。以下列舉兩種基本常用的陣列結構。
均 勻 線 性 陣列(Uniform Linear Array, ULA):
均勻線性陣列是最基本的陣列結構,其架構圖如圖 2.1 所式。
圖 2.1 均勻線性陣列架構圖
d 代表陣列的麥 克風間距,M 為陣列的 麥克風個數。基於聲源為 遠場平面 波的假設,將能推導陣列對訊號的向量表示。令 s(t)代表訊號來源,n(t)代表 雜訊,則具有 M 個麥克風的均勻線性陣列可以表示為以下形式:
d d
source
r
r : unit vector
reference point
x
1x
2x
Mx
2 r
7
a 被稱為陣列拓樸向量(array manifold vector),代表了由訊號來源到各麥克 風的空間差異造成的時間轉換關係,可以將其表示為:
8 (Eigenstructure Method),常見的方法如 MUSIC 與 ESPRIT。
特 徵 結 構 法 是 拿 各 麥 克 風 擷 取 到 的 訊 號 來 計 算 其 資 料 相 關 矩 陣
2.2.1 Multiple Signals Classification Method (MUSIC)
利用特徵結構估測訊號 到達角度的方法 中,多重訊號分類 演算法 MUSIC (Multip le Signa l Classification)由於其演算 法精簡且估測 效果不錯,在 特徵結構 法中是一種常用的估測方法。
利用 MUSIC 演算法時,有 兩個基本假設必 須被滿足: