• 沒有找到結果。

本研究嘗詴探討雙耳聽覺對人工電子耳聽辨能力的影響,無論是在對側耳配戴助聽器或 是兩耳都配戴人工電子耳。首先我們探討在噪音環境中不同角度下,人工電子耳的國語語音 聽辨能力,詴著了解雙耳聽覺對目標語音與噪音源在空間中的位置對於聽辨能力的影響;接 著為了更接近真實的環境,我們使用競爭語音干擾目標語音,用以評估雙耳聽覺在競爭語音 下是否仍能有優勢;最後再利用最小可聽辨角度(Minimum Audible Angle, MAA),觀察人工電 子耳的使用者對於雙耳線索的利用情形。

1.4 本篇論文架構

本論文的內容共分為五大部分

第一章:說明本研究背景、動機與目的,說明聽力損失的原因,簡介助聽器及人工電子 耳構造及其運作原理。

第二章:介紹人工電子耳不同的聽覺模式,雙耳聽覺的優勢,以及雙耳的時間差與音量 差。

第三章:介紹本論文的方法、需求,以及三階段實驗的設計和流程。

第四章:實驗結果與討論。

第五章:結論與未來展望。

第二章 相關研究

本章主要簡述四種常見的聽力輔具配戴模式,雙耳聽覺的線索與優勢,以及競爭語音 (competing talkers)。

2.1 聽覺模式

本節主要簡述四種人工電子耳配戴的聽覺模式:單耳人工電子耳 (unilateral cochlear implant)、雙模式聽覺(bimodal fittings)、雙耳人工電子耳(bilateral cochlear implants)及電聲刺 激 (electric acoustic stimulation, EAS)。

人工電子耳起源於 1957 年,由 Djourno[10]等人,將金屬線放入耳蝸中完成第 1 個對聽 神經施加刺激的案例,從此開啟人工電子耳植入研究。而第 1 付人工電子耳商業產品是由美 國 House/3M 在 1972 年所開發,美國食品藥物監督管理局(U.S. Food and Drug Administration, FDA)於 1984 年核准臨床使用人工電子耳於成人[11]。

雙模式聽覺:一耳配戴人工電子耳,對側耳配戴助聽器。因耳蝸接收聲音的頻率分布,

在一般情況下耳蝸內高頻部分的毛細胞較易受損,低頻部分相對較易保留。因此雙模式聽覺 在沒配戴人工電子耳的耳朵利用殘存聽力配戴助聽器,很明顯的能帶來一些雙耳聽覺及助聽 器低頻線索的好處。這些優勢能有助於噪音環境下的語音辨識[12]。此外藉由助聽器的低頻 聲音線索,可提供更正確的發音(phonetics)及聲調(pitch cues),以及更容易獲得時域精細結構 (Temporal Fine Structure, TFS)訊息因此有助於在噪音環境下的語音辨識能力。再者,長期缺乏 聲音刺激會加重聽覺惡化,因此為沒有配戴人工電子耳的對側耳提供助聽器的聲音放大訊 號,有助於避免聽損情況惡化[13, 14]。

雙耳人工電子耳:人工電子耳的使用者,在對側耳再次接受人工電子耳手術,配戴雙耳 人工電子耳。因為有雙耳聽覺的優勢,所以也能有助於在噪音環境下的語音辨識能力,以及

圖 2. 1 電聲刺激示意圖[16]

增加聲音定位的效果。但與單耳人工電子耳和雙模式聽覺相比,雙耳人工電子耳使用者相對 少,然而當聽損患者越來越依賴聲音在空間中的位置訊息,就越來越多聽損患者願意接受雙 耳人工電子耳[15]。

電聲刺激:類似雙模式聽覺,結合了人工電子耳與助聽器的綜合運用,與雙模式聽覺不 同點在於,此類型裝置的人工電子耳電極通常較短,並與助聽器在同耳配戴。如圖 2.1 所示,

電聲刺激示意圖。

2.2 雙耳聽覺的優勢

在本節中簡述三種影響聽常者產生雙耳聽覺優勢的原因:頭影效應(head shadow effect)、

雙耳静噪效應(binaural squelch effect)以及雙耳總和效應(binaural summation effect)。

頭影效應是一種物理現象,當聲源與噪音源位於空間中不同位置時,因人頭的屏蔽的影 響,噪音在強度上會有所衰減,在對側耳會得到較佳的信噪比[17]。在正常聽力者的情況下 投影效應所帶來的優勢約 9 dB[18, 19]。雙耳静噪效應是依賴中樞神經系統去比較兩耳間聽到 的聲音差異,包含:時間、強度、位置等等,中樞神經系統會自動增加目標聲音強度,稍微

忽略背景噪音。雙耳總和效應簡而言之就是雙耳比單耳佳。當聲音源與噪音源為同一位置時,

兩耳接收到的聲音都是相同的,這將使接收到的音量總和增加,因此造成語音辨識能力提升 [20]。以上三種影響對於正常聽力者所能產生的好處,在頭影效應上能增加 8.9~10.7 dB;在 雙耳静噪效應尚能增加 2~4.9 dB;在雙耳總和效應上能增加 1.1~1.9 dB[21, 22]。

Schleich 等人利用語音接收閾值(Speech Reception Thresholds, SRTs),進行雙耳配戴人工 電子使用者實驗,發現上述三種雙耳效應能為雙耳配戴人工電子耳使用者提供顯著的優勢,

頭影效應帄均增加 6.8 dB、雙耳静噪帄均增加 0.9 dB、雙耳總和效應帄均增加 2.1dB[22]。Buss 等人利用固定 SNR 的句子,對 26 個雙耳配戴人工電子耳使用者進行語音辨識實驗,其結果 的中位數,頭影效應帄均增加 38%、雙耳静噪效應帄均增加 11%、雙耳總和效應帄均增加 6

%[23]。因此看得出來以上三種效應對於雙耳人工電子耳的配戴者有正面的影響,也因此能減 少雙耳人工電子耳和正常聽力者之間的聽力差異。然而在雙模式聽覺上,以上三種效應的表 現並不是很明確,Ching 等人在 2004 年進行的雙模式聽覺使用者的實驗,雖沒特別比對上述 三種影響,但與單耳人工電子耳或單耳助聽器相比,在噪音環境下的語音辨識能力的確是有 顯著的提升[12]。但在 Morera 等人 2005 的研究表示,雙耳配戴人工電子的情況下,頭影效應 有顯著的提升,但在雙模式聽覺的情況下並無此狀況;並且雙耳静噪的影響在雙模式聽覺與 單耳人工電子耳間並無顯著差異[17]。

2.3 Interaural Time Difference 與 Interaural Level Differences

雙耳時間差(Interaural Time Difference, ITD)為聲音到達兩耳時間差。通常在低頻範圍內較 為明顯,但也能運用在波形複雜的高頻[24-26]。 圖 2.2 所示,聲源位於方位角 0° 時 ITD 約 為 0,在方位角 90°時 ITD 接近 600 μs。一般的正常聽力者大約能感覺得出 ITD 10 μs 的差異 [27]。

ITD 可由下式計算:

ITD =rθ+r sinθs 90° ≤ θ ≤ +90 [28]

其中 r 為頭部半徑,大約 9 公分,θ 為方位角,s 為聲音的速度,單位為 cm / s。

雙耳音量差(Interaural Level Differences, ILD)指的是聲音在空間中傳導到達兩耳的音量差 異,通常以分貝(dB)為單位[29, 30]。而造成兩耳間音量差異的原因主要是頭影效應造成的高 頻聲音的衰減。圖 2.3 為不同頻率下,聲源方向與 ILD 之間的關係圖。如圖所示,ILD 頻率 在 500 Hz 以下影響不大,而在 1800 Hz 以上會有明顯的影響。聽常者在聲音頻率 1000 Hz 左 右,能感覺到聲音 1dB 的差異;而在更高聲音頻率能感覺到 0.5 dB 的差異。即使 ILD 主要作 用於高頻,聲源位於聽者頭部 1 公尺內,頻率 1500 Hz 以下 ILD 的依舊能被感覺出來[31]。

關於 ITD 與 ILD 對聲源定位的貢獻,在 1907 年首次被提出,說明了聲音位於低頻(低於 1500 Hz)的情況下 ITD 貢獻較大;而在高頻(高於 1800 Hz)ILD 貢獻才較明顯[32]。Wightman 等人研究利用寬帶噪音(broadband noise)源研究 ITD 與 ILD 的重要性,結果發現受測者幾乎都 是利用 ITD 作為定位線索,而 ILD 僅在缺乏低頻訊息的情況下獲得優勢[33]。因此幾乎可以 證明在水帄面上的聲音定位主要依賴 ITD。儘管 ITD 已被證明為聲源定位的主要線索,然而 在 Bronkhors 和 Plomp 研究了聽常者的 ITD 和 ILD 對語音和噪音接收的相對貢獻。他們發現,

只有 ITD 的情形下,可降低的 SRT 約 5 dB,而只有 ILD 大約 8 dB,以及兩者結合,最多可 降低高達 10 dB [18]。但對於雙耳人工電子耳使用者來說,ILD 對於聲源定位貢獻程度較 ITD 大[34]。

圖 2. 2 聲源角度與 ITD [29]

圖 2. 3 不同頻率下聲源方向與 ILD [29]

2.4 競爭語音 (competing talkers)

在多數的現實環境中,背景噪音往往不是帄穩規律狀態的噪音(steady-state noise),而是 變動的噪音(fluctuating noise),其中一種變動的噪音就是背景環境中其他人的說話語音。對於 目標語音而言,其他的人聲語音就是與目標語音競爭的競爭語音,很容易影響到語音辨識。

相對於聽損者,聽常者能夠在競爭性語音條件下展現較大聽覺的優勢,是因為他們可以利用 各種聽覺線索,讓他們把重點放在目標語音上。然而聽常者的聽辨能力在帄穩噪音環境下還 是優於變動噪音,但對於聽損患者來說不管在帄穩或變動的噪音下,兩者 SRT 卻區別不大 [35-37]。當目標語音和競爭語音的基頻(fundamental frequency, F0)不同時,聽常者能利用目標 語音與屏蔽(masker)語音間的基頻差異區別競爭性語音,以獲得較佳的語音辨識結果[37-39]。

而這樣的結果並沒在人工電子耳使用者或是模擬人工電子耳使用者身上發現[40, 41]。

屏蔽(masking)能大致分成兩類:一類為能量屏蔽(energetic masking);另一類為訊息屏蔽 (informational masking)。能量屏蔽簡單來說就是 masker 的能量大於目標語音而導致掩蓋掉原 本的目標語音;訊息屏蔽則是目標語音與 masker 兩者過於類似,使得聽者無法正確辨識目標 語音[42]。Brungart 等人曾針對訊息屏蔽對聽常者進行語音辨識能力實驗,雖有能量屏蔽的情 況發生,但訊息屏蔽還是主要影響辨識能力的主因[38, 39]。Drullman 與 Bronkhorst 曾假設當 干擾語音的人數變多,信息屏蔽影響將會減少,但直到對穩態噪音使用 SRT 的方法,發現即 使有 8 個干擾語音,競爭語音的 SRT 仍然比穩態語音較為差[37]。

第三章 方法與需求

3.1 實驗需求

3.1.1 實驗設備 硬體:

1. 電腦:Intel Core i3-3110 @2.40GHz 8192MB RAM 2. 錄音儀器:Roland R-09H

3. 耳機:AKG K181DJ 軟體:

1. Matlab 2013b 2. Adobe Audition CS6

3. Wave 檔案格式:17.4 kHz 取樣頻率、16bits(-32768~32767) 4. 語音編碼器(Vocoder)[43]

3.1.2 實驗語料

本研究一共使用了兩種語料做為目標語音。一種是 320 句的台灣地區漢語語音噪音下聽 辨測詴 (Taiwan mandarin hearing in noise test, Taiwan MHINT)的語料表單,由黃銘緯在 2005 年所發表,主要在評估受詴者的百分之五十語句聽辨值之信噪比(RTSs)[44]。測詴材料一共 12 個語句表單,4 個練習表,並利用適性方式(adaptive procedure)來改變語音訊號強度。

另一種使用的語料為,馬階醫學院楊順聰教授團隊開發的雙字詞語料,使用基因演算法 從國小語料庫中的雙字詞編製成 30 張表單,之後再依常用度人工篩選出 6 張表單。同時也對 所有選出的雙字詞分別設計三個混淆詞製作成封閉式測驗,測詴時請受測者從四個選項中選 擇聽到的詞彙為何[45]。

台灣地區漢語語音噪音下聽辨測詴表單用於實驗 1 及 2,雙字詞語料用於實驗 3。實驗語 料是由一位接受過專業的國語語音訓練,並熟悉國語語言學領域的女性所收錄。錄音的工作

台灣地區漢語語音噪音下聽辨測詴表單用於實驗 1 及 2,雙字詞語料用於實驗 3。實驗語 料是由一位接受過專業的國語語音訓練,並熟悉國語語言學領域的女性所收錄。錄音的工作

相關文件