應用時頻分析於建立運動員肺音訊號比較系統
全文
(2) 摘要 胸部聽診一直以來都是醫生用來診斷病人肺部病症的主要方法,醫生藉 由聽診器聽取肺部的聲音,來判別病人的健康狀況以及所得病症。但自從科 技的進步,數位聽診漸漸取代了傳統聽診,成為新一代主流的技術。數位聽 診具有多工處理,可記錄,以及可數據化演算之優點,使得聽診技術進入一 個新的紀元。透過將肺音訊號影像化,以及使用科學上訊號分析的訊號法來 分析肺音訊號,我們可以從肺音訊號得到比已往更多的訊息。本研究的目的 為透過肺音擷取系統以及時頻分析方法來建立一套可以觀察不同運動種類 運動員之肺音訊號之系統,並透過此系統來分析不同運動種類以及其肺音訊 號之間的特色與關係。 首先使用一般聽診器與數位單指向性麥克風(鐵三角 AT9904)做結合, 製作成 16 個數位聽診器,並在人體背後肺部的位置布置麥克風陣列。透過 USB 音效卡以及 Audio Stream Input Output(ASIO)驅動程式將肺音訊號錄製 至電腦硬碟中並儲存。儲存在電腦中的肺音訊號,透過 MATLAB 以及 Visual Signal 軟體做訊號前處理以及時頻分析。本研究採取了三種時頻分析方法, 分別為短時傅立葉轉換法(Short Time Fourier Transform,STFT) 、Morlet 小 波轉換法(Morlet Wavelet Transform,Morlet WT)以及希爾伯.黃轉換法 (Hilbert Huang Transform,HHT)。三種分析法各有其特色以及優點,但三 種分析法中,本研究認為 HHT 最適合做為不同運動種類運動員之肺音差異 之比較。熵(Entropy)之原理也用來作為呼吸氣流流速模型的參數之一。本研 究透過以上方法來建立一個可以觀察不同運動員肺音特色之系統 關鍵詞:肺音聽診、時頻分析、訊號影像化、運動呼吸能力. i.
(3) Abstract In the diagnosis of the respiratory diseases, auscultation is a main method to diagnose and treat patients. Auscultation is a non-invasive and convenient diagnostic method. With the upgrading of computer hardware, Digital auscultation is gradually replacing traditional auscultation. Auscultation digitizing overcomes the shortcomings that are not sensitive and the subjectivity of the human’s ear. And auscultation also has the advantages that are multi-tasking, recordable and can be analyzed by computer. We can know a lot of information by image-based of lung sound signals. In the digital auscultation analysis, what method I use to analyze the lung signals which microphone recorded will affect the results of the experiment greatly. The purpose of this study is to build a system to observe the lung sounds of the different athletes by combination of lung sound recording system and time-frequency analysis. And find the lung sound characteristics and relationships of different athletes from the results. First, I combine the stethoscopes and unidirectional microphones (Audio-Technica AT9904) as 16 digital stethoscopes, and arrange the digital stethoscope array on the back of human’s body. Through the USB sound cards and Audio Stream Input Output(ASIO) driver, the lung sound signals are recorded and saved in the hard disk. The signal would be processed and analyzed by MATLAB and Visual signal. The research has used three time-frequency analysis methods, they are Short Time Fourier Transform (STFT), Morlet. ii.
(4) Wavelet transform (Morlet WT) and Hilbert Huang transform (HHT). This research considers the result of HHT is the most suitable for lung sound signals analysis. Entropy is also used for respiratory air flow detection. This research build a system to observe the characterizes of lung sound signals from different athletes by the above method. Key Words: Lung sound signal, Time-frequency analysis, Digital acoustic, Hilbert-Huang transform. iii.
(5) 謝誌 首先誠摯的感謝指導教授 陳美勇 老師悉心的教導使我得以一窺時頻 分析與生醫訊號整合技術領域的深奧,不時的討論並指點我正確的方向,使 我在這些年中獲益匪淺。老師對學問的嚴謹更是我輩學習的典範。此外在我 人生中遇到了一些迷惘時,也感謝老師的耐心以及愛心,讓我可以順利的完 成碩士學業,這份恩情學生銘感五內。 感謝口試委員 林啟萬 博士、 丁建均 博士以及陳錫明 博士的協助, 給予了我最佳的建議,使我的研究以及論文更加的豐富及完整。 兩年裡的日子,實驗室裡共同的生活點滴,學術上的討論、言不及義的 閒扯、讓人又愛又怕的宵夜、趕作業的革命情感、因為睡太晚而遮遮掩掩閃 進實驗室........,感謝眾位學長姐、同學、學弟妹的共同砥礪,你們的陪 伴讓兩年的研究生活變得絢麗多彩。特別感謝周承漢學長雖然在軍中,也有 耐心的解答我在研究上的問題。感謝盧建勳、葉傅文、林宗翰、黃可瑋同級 的同學們,我們一向都同進退。 感謝馬偉恭、郭智瑋、林哲琦、黃盈源學長們不厭其煩的指出我研究中 的缺失,且總能在我迷惘時為我解惑,也感謝機電科技研究所同屆全體同學 的幫忙,恭喜我們順利走過這兩年。實驗室的楊東諺、李昀翰、陳希哲、許 哲勝學弟們當然也不能忘記,你們的幫忙及搞笑我銘感在心。 最後,謹以此文獻給我摯愛的雙親,以及親愛的弟弟和妹妹 黃建州 壬辰年.仲夏夜 精密運動控制實驗室. iv.
(6) 目錄 摘要 ...................................................................................................................... i ABSTRACT ........................................................................................................ ii 致謝 .................................................................................................................... iv 目錄 ..................................................................................................................... v 圖目錄 .............................................................................................................. viii 表目錄 ................................................................................................................ xi 第一章. 緒論 ..................................................................................................... 1. 1.1 前言 ................................................................................................... 1 1.2 研究目的與動機 ................................................................................. 4 1.3 文獻回顧 ............................................................................................. 5 1.3.1 肺音診斷與分析系統之電腦化 .............................................. 5 1.3.2 訊號處理 ................................................................................. 8 1.3.3 訊號分析 ................................................................................. 9 1.3.4 呼吸流量估測模型 ................................................................. 10 1.4 本論文之貢獻 ................................................................................... 11 1.5 論文架構 ........................................................................................... 11 第二章. 理論基礎 ............................................................................................. 13. 2.1 呼吸系統與肺音機制 ..................................................................... 13 2.1.1 呼吸系統 ............................................................................ 13 2.1.2 肺音的發生機制 ................................................................ 14 2.2 肺音種類區分 ................................................................................. 15 2.2.1 支氣管音 ................................................................................ 15 2.22 氣管音 ..................................................................................... 16 2.2.3 肺泡音 .................................................................................... 16. v.
(7) 2.2.4 哮喘音 .................................................................................... 17 2.2.5 爆裂音 .................................................................................... 18 2.2.6 喘鳴音 .................................................................................... 18 2.3 呼吸音與病理關係 ......................................................................... 19 2.4 訊號處理與時頻分析技術 ............................................................. 23 2.4.1 傅立葉轉換 ............................................................................ 24 2.4.2 短時傅立葉轉換 .................................................................... 24 2.4.3 小波轉換 ................................................................................ 26 2.5 希爾伯特.黃轉換法 ..................................................................... 31 2.5.1 瞬時頻率 ................................................................................ 32 2.5.2 本質模態函數(IMF)............................................................... 33 2.5.3 經驗模態分析法(EMD) ......................................................... 34 2.7 熵(Entropy) ...................................................................................... 36 第三章. 系統架構 ........................................................................................... 38. 3.1 系統整體架構 .................................................................................. 38 3.2 系統硬體 .......................................................................................... 39 3.2.1 系統硬體之架構 .................................................................... 39 3.2.2 系統之感測器 ........................................................................ 40 3.2.3 麥克風性能參數 .................................................................... 42 3.2.4 資料擷取卡 ............................................................................ 43 3.2.5 系統硬體實體配置情形 ........................................................ 46 3.3 軟體架構 .......................................................................................... 48 3.3.1 肺音訊號儲存 ........................................................................ 49 3.3.2 肺音訊號分析及前處理 ........................................................ 49 第四章. 實驗之設計與配置 ........................................................................... 51. 4.1 整體實驗架構 .................................................................................. 51. vi.
(8) 4.2 模擬肺音分析測試 .......................................................................... 51 4.3 肺音測量流程設計 .......................................................................... 52 4.3.1 肺音擷取與比較流程之設計 ................................................ 53 4.3.2 肺音量測流程與運動方法之設計 ........................................ 54 4.4 真實肺音之前處理與分析 .............................................................. 55 4.4.1 肺音濾波與放大電路 ............................................................ 55 4.4.2 Visual Signal 前處理以及分析 .............................................. 56 4.5 呼氣氣流估測模型 .......................................................................... 56 第五章. 實驗結果與討論 ............................................................................... 58. 5.1 模擬肺音分析測試結果 .................................................................. 58 5.1.1 頻譜分析 ................................................................................ 58 5.1.2 時頻分析 ................................................................................ 60 5.1.3 與模擬肺音之比較 ................................................................ 62 5.2 真實肺音之前處理與分析之結果 .................................................. 65 5.2.1 真實肺音前處理後之結果 .................................................... 65 5.2.2 真實肺音時頻分析之結果 .................................................... 67 第六章. 結論與未來展望 ............................................................................... 74. 6.1 結論 .................................................................................................. 74 6.2 未來展望 .......................................................................................... 74 參考文獻 ........................................................................................................... 76. vii.
(9) 圖目錄 圖 1-1. 體壇的台灣之光..................................................................................... 2. 圖 1-2. 肺音擷取電腦化之系統架構圖 ............................................................ 6. 圖 1-3. 肺音系統之分析介面............................................................................. 6. 圖 1-4. 心肺音分離之硬體系統......................................................................... 7. 圖 1-5. 小波濾波器架構..................................................................................... 8. 圖 1-6. 使用時頻分析與適應性閥值法對肺音中心音去除的結果................ 9. 圖 2-1. 人體呼吸系統....................................................................................... 13. 圖 2-2. 肺音發生機制之示意圖....................................................................... 14. 圖 2-3. 肺音種類列表....................................................................................... 16. 圖 2-4. 支氣管音之波形圖................................................................................. 16. 圖 2-5. 氣管音之波形圖..................................................................................... 17. 圖 2-6. 肺泡音之波形圖..................................................................................... 17. 圖 2-7. 哮喘音之波形圖..................................................................................... 18. 圖 2-8. 細爆裂音之波形圖................................................................................. 19. 圖 2-9. 粗爆裂音之波形圖................................................................................. 19. 圖 2-10 喘鳴音之波形圖..................................................................................... 19 圖 2-11 正常呼吸音量測位置(後背) .................................................................. 20 圖 2-12 正常呼吸音量測位置(胸前) .................................................................. 20 圖 2-13 訊號經過傅立葉轉換後從時域轉換至頻域 ........................................ 24 圖 2-14 訊號經過短時傅立葉轉換之穿函數後得到時頻特徵之表現 ............ 25 圖 2-15 正弦波(sine)與小波(wavelet)的波形比較 ............................................ 26 圖 2-16 傅立葉轉換與小波轉換比較 ................................................................ 26. viii.
(10) 圖 2-17 訊號分析法比較圖................................................................................. 27 圖 2-18 小波函數的尺度縮放與時間平移 ........................................................ 29 圖 2-19 小波轉換後得到高頻的細微訊號以及低通的粗略形狀訊號 ............ 30 圖 2-20 小波轉換訊號實際分解情形 ................................................................ 30 圖 2-21 希爾伯特.黃轉換法流程圖 ................................................................ 31 圖 2-22 經驗模態分析法流程圖......................................................................... 35 圖 2-23 希爾伯特.黃轉換法流程結果示意圖 ................................................ 36 圖 3-1. 系統整體架構示意圖............................................................................. 38. 圖 3-2. 系統硬體架構示意圖............................................................................. 39. 圖 3-3. 感測器實體架構圖................................................................................. 40. 圖 3-4. 鐵三角 AT9904 麥克風.......................................................................... 40. 圖 3-5. 精國醫療器材有限公司之 CK-A603T 聽診器頭. ............................... 41. 圖 3-6. 麥克風指向性之常見規格. ................................................................... 43. 圖 3-7. LEAD 3D Sound 5.1 TIDE PD552 USB 3d sound card. ....................... 44. 圖 3-8. 廣鼎 INTOPIC HB-16 USB Port. .......................................................... 45. 圖 3-9. 聽診器配置示意圖................................................................................. 46. 圖 3-10 聽診器陣列實際配置圖......................................................................... 47 圖 3-11 系統硬體實際配置圖............................................................................. 48 圖 3-12 系統軟體流程圖..................................................................................... 48 圖 4-1. 模擬肺音比較流程圖............................................................................. 52. 圖 4-2. 實驗設計總流程圖................................................................................. 53. 圖 4-3. 肺音量測之流程圖................................................................................. 54. 圖 4-4. 訊號處理流程圖..................................................................................... 55. 圖 4-5. Visual Signal 前處理以及分析圖 .......................................................... 56. ix.
(11) 圖 4-6. 尖峰氣流流速計..................................................................................... 57. 圖 4-7. 呼氣氣流預估模型實驗示意圖 ............................................................ 57. 圖 5-1. 六種肺音之頻譜分析............................................................................. 59. 圖 5-2. 六種肺音之 STFT 圖 ............................................................................. 61. 圖 5-3. 六種肺音之 Morlet 小波圖.................................................................... 61. 圖 5-4. 肺泡音實際與模擬比較圖 .................................................................... 64. 圖 5-5. 支氣管音實際與模擬比較圖 ................................................................ 64. 圖 5-6. 爆裂音實際與模擬比較圖 .................................................................... 64. 圖 5-7. 哮喘音實際與模擬比較圖 .................................................................... 64. 圖 5-8. 前處理過後的哮喘音與模擬肺音比較圖 ............................................ 65. 圖 5-9. 肺音訊號前處理過後之時頻分析結果 ................................................ 66. 圖 5-10 族群(a)肺音 1 ......................................................................................... 68 圖 5-11 族群(a)肺音 2 ......................................................................................... 68 圖 5-12 族群(a)肺音 3 ......................................................................................... 69 圖 5-13 族群(b)肺音 1 ......................................................................................... 69 圖 5-14 族群(b)肺音 2 ......................................................................................... 70 圖 5-15 族群(b)肺音 3 ......................................................................................... 70 圖 5-16 族群(c)肺音 1 ......................................................................................... 71 圖 5-17 族群(c)肺音 2 ......................................................................................... 71 圖 5-18 族群(c)肺音 3 ......................................................................................... 72 圖 5-19 熵(Entropy)與氣流流速(flow)之迴歸線 ............................................... 73 圖 5-20 L 值與氣流流速(flow)之迴歸線 ........................................................... 73. x.
(12) 表目錄 表 2-1. 正常呼吸音之特徵............................................................................... 21. 表 2-2. 異常呼吸音之特徵............................................................................... 22. 表 3-1. 鐵三角 AT9904 麥克風規格表............................................................ 41. 表 3-2. USB 3D sound card 規格表 ................................................................ 44. 表 3-3. INTOPIC HB-16 USB Port 規格表 ....................................................... 45. 表 5-1. 模擬肺音之時頻分析結果比較表 ...................................................... 62. 表 5-2. 氣流估測模型係數............................................................................... 72. xi.
(13) 第一章 緒論 1.1 前言 台灣之光或華人之光陸陸續續在世界的體壇上發光發熱,大家在看到新 聞上台灣之光的優異表現時,一定是熱血沸騰,情緒高昂的。人類的努力導 致科技的進步,但是人類在自身的運動能力上也是毫不怠惰,永遠在挑戰自 己的極限。運動競技除了是休閒活動,在國際上更是宣揚國威、提升國家的 形象與表現的方法之一,只要在運動場上能夠發光發熱,國民也會提升自己 的自信心以及競爭力。醫療檢測技術也隨著科技的日新月異而蓬勃發展,各 式各樣的新技術與傳統醫療方法結合產生新的火花,對醫生及患者找到新的 出路。反過來說,這些醫療檢測技術同時也可以用在探求以及開發人類體能 極限的地方。透過嶄新的醫療檢測技術,可以得知運動員本身的運動適性, 以及運動能力等等,透過了解這些訊息來選拔運動員以及對運動員的訓練方 式做調整,有了科學的加持,運動員絕對是如虎添翼。 呼吸對於運動訓練是十分重要的,良好的呼吸法可以幫助運動競技的成 績更上一層樓。但是在呼吸運動法的學習方面,往往會受到一些先天上的限 制,也就是說每個人的呼吸系統會有些微的不同。例如有的運動員天生的呼 吸系統是適合田徑的,也有些是運動員的呼吸系統是比較適合游泳的,不同 的呼吸系統可能會造成適合運動的不同,運動適性也會影響運動競技的成績。 其實研究運動員本身的運動適性的方法一直在進行著,透過目前的醫療技術, 已經可以從很多的運動方法對此得知一二,但畢竟還是有限的。如何以科學 的方法來找出運動員的最佳適性,是工程領域專家醫療學者與運動學學者需 共同努力突破的研究課題。. -1-.
(14) (a). (b). (c). (d). (e). (f). 圖 1-1 體壇的台灣之光 (a) 陳彥博 2010 年北極點馬拉松賽第三名 (b) 盧 彥勳 台灣第一位打進溫布頓網球錦標賽前 8 強 (c) 景美女中拔河隊 世界 盃拔河金牌 (d) 彭偉群 2009 世界武術南拳、南棍雙料冠軍 (e) 曾雅妮 美 國 LPGA 錦標賽最年輕冠軍得主 (f) 郭泓志 第一位登上美國大聯盟明星賽 的台灣人[1]. -2-.
(15) 胸腔聽診(Chest Auscultation)是呼吸系統診斷中最普遍的方式,它屬於非 侵入式(Non-Invasive)的醫學技術,不用侵入人體也不會有任何風險。當肺部 發生異狀時,即可藉由聽取人體內因為呼吸作用而使得空氣在呼吸道內流動 所製造的聲音,即可得知且診斷肺部異狀以及病症之訊息。 聽診(Auscultation)發展至今可以括分為兩種方式,第一種為直接聽診方 式,醫師對病患直接用耳朵聽診,將耳朵貼在患者的患部。這個方法聽到的 聲音不但非常小聲,而且容易被環境噪音及外界干擾等雜訊所影響,再者醫 生對於異性病患可能會有一些生理上的顧慮,故此種方法已漸漸不再使用, 只有在應急情況下才會採用。另一種方法則是間接聽診,醫師透過聽診器貼 住患者的身體,經過聽診器放大聽者患部的聲音作為醫師診斷依據,這個方 法是目前的診斷主流方式,醫生不但不用把耳朵貼在病人的身體,使活動性 增加,透過聽診器也能使患者胸腔呼吸的聲音更清楚。 聽診法已經發展了一段時間,其設計及製造技術也相當成熟。但此法受 限於人類聽力可聽見的聲音頻率範圍,並且聽診主要依賴的是醫生的聽力以 及主觀的診斷,同樣一個肺音可能每個醫生診斷的結果都不同。故藉由現今 突飛猛進的硬體濾音及數位化分析技術,將其融入肺音診斷,發展一套易辨 識與方便的電腦化肺音輔助診斷系統為目前熱門研究主題之一。 醫療技術不只可以用在幫助病人上面,也可以用在了解人體、探知人體, 並去開發人體的極限。將電腦化肺音輔助診斷系統利用在運動員身上,跟運 用在病人身上並不太相同,運用在病人身上是想得知有無異常肺音,而運用 在運動員身上則是以正常肺音為主,探求出運動員與一般人之肺音差異,甚 至是不同運動種類運動員之正常肺音特色,使其可以成為判斷運動員之運動 適性的因子之一。這也是本研究希望能達到的最終目標. -3-.
(16) 1.2 研究目的與動機 科技日新月異的當下,幾乎一眨眼就有新的技術產生。醫療技術中,聽 診技術以及肺音分析技術在最近也有許多嶄新技術不斷的發表,但是鮮少用 在運動醫學上。而本研究在探討了聽診相關技術以及運動醫學後,將本研究 之動機歸納為下列三項: 一. 時頻分析為嶄新且優秀的技術用於生醫訊號之分析: 時頻分析是近幾年發展之訊號分析技術,有別於頻譜分析,時頻 分析可以同時得知訊號之時間與頻率和振幅之訊息,可以從訊號中 得知更多資訊更利於對訊號做分類或辨識。而在生醫訊號之中,時 頻分析也常常作為分析生醫訊號之工具,像是心電訊號(ECG)或 是肌電訊號(EMG)等等,同樣也有些用在肺音訊號,也有非常好 的效果。怎樣把時頻分析法有效的用在肺音分析裡,將為本研究探 討之課題之一。 二. 肺音訊號之擷取與分析,比起傳統的運動員呼吸能力的檢驗法來得 簡單、便宜: 傳統之運動員呼吸能力檢測方法需要大量的設備,如氣體分析 儀或氣流偵測儀等等,動輒數十萬元;並且要在運動的狀態下測量, 檢測後部分器具也會因為衛生問題而丟棄,非常的浪費和不方便。 肺音訊號本身只需透過聽診方式獲得,而聽診本身是個非侵入式的 檢測方法,工具也只需要聽診器以及錄音用之麥克風,不但節省資 源又方便,更可以省下大把的金錢以及時間,而重點將會集中在後 面的訊號分析之上。只要能透過肺音訊號可以了解運動員的身體能 力,絕對會是在運動醫學上的一大突破。. -4-.
(17) 三. 肺音分析推廣之困難處在於實際肺音之獲得 肺音分析原本的重點在於醫療上的應用與分析,但是要實現必 須先以大量的人體做實驗與分析後才能應用於臨床上。雖然肺音分 析本身是非侵入式的,對人體並沒有危害,但是面對病患還是得先 徵求對方同意。所以肺音分析在實際醫療分析之上無法推廣,而主 要原因是實際肺音難以獲得。相對於病患之肺音,運動員的肺音取 得是十分容易的,只要跟運動員所屬之相關單位合作,便很容易取 得運動員之肺音訊號,本研究也與師大體育系合作,請師大體育系 之學生提供其肺音訊號來加以分析。對肺音分析而言,與運動員合 作不但能輕易獲取肺音資訊,也能推廣肺音分析之好處,實在是一 石二鳥。 基於以上三點動機,本研究的目的旨在建立起一套系統可以以多頻道的 方式擷取運動員之肺音,並以時頻分析之方法將運動員之肺音作分析,並設 計一介面可以將肺音分析之結果展示或比較,最後可以從不同運動運動員之 肺音分析結果觀察出特徵。. 1.3 文獻回顧 1.3.1 肺音診斷與分析系統之電腦化 由於資訊時代的突飛猛進,有許多學者與廠商紛紛投入電腦化肺音診斷 系統相關研究以改善傳統聽診法的缺失。系統發展與改進可以分為三大部分, 肺音擷取、萃取特徵值、人工智慧分類器。H. Polat 與 I. Guler[2]使用電容式 麥克風與聽診器結合,經過放大器與濾波器電路之前處理,經過音效卡將訊 號自類比訊號轉換成數位訊號並輸入電腦,形成一組肺音量測與分析系統, 再經由 Dasy LAB 軟體進行分析,可達儲存與分析之功效。J.E. Earis 與 -5-.
(18) B.M.G. Cheetham[3]對電腦化肺音診斷系統做了下列之整理: (a) 感測器:電容式麥克風、壓電式麥克風 (b) 放大器與濾波器設計: i.. 放大增益:100 倍以上. 圖 1-2 肺音擷取電腦化之系統架構圖[2]. 圖 1-3 肺音系統之分析介面[2]. -6-.
(19) ii.. 高通濾波截止頻率適當範圍:30 Hz 至 150 Hz. iii.. 低通濾波截止頻率適當範圍:1.6 kHz 至 3.2 kHz. iv.. 適當的取樣頻率:4 kHz 至 22.05 kHz。. (c)訊號分析: 放大器、濾波器、快速傅立葉轉換、短時傅立葉轉換、小 波轉換、時間展延分析。 (d)顯示方式: 頻域圖、時域圖、時頻圖。. 圖 1-4 心肺音分離之硬體系統[4]. 圖 1-5 小波濾波器架構[6]. -7-.
(20) 1.3.2 訊號處理 肺音訊號在擷取的過程中,容易受雜訊干擾或者遇到與訊號混疊的問題, 干擾源包括環境噪音與非肺音生理訊號(以心音訊號為主)[4]-[8],J. C. Chien 與 M.C. Huang[4]以獨立成份分析(Independent Component Analysis, ICA)技 術應用於分析胸腔中擷取的聲音訊號。學者們發現,從胸腔所擷取的聲音訊 號有心音及肺音兩種生理訊號互相重疊。在該研究中,學者們使用兩個麥克 風,將其分別放置於左胸以及右胸收集不同的聲音訊號,接著利用快速獨立 成份分析演算法來分離心肺音。為了避免擷取肺音時各種因素造成的干擾, 像是心音以及環境噪音 Z. Moussav 與 D. Flores[5]提出使用小波轉換 (Wavelet Transform)的方式移除心音成分和電子設備以及環境之干擾雜訊, 再使用自我迴歸分析(Autoregressive Analysis)或移動平均法(Moving Average) 重建訊號。肺音訊號可分為穩態之正常肺音與非穩態之異常肺音,在擷取過 程中有可能同時截取到穩態訊號與非穩態訊號,對此, X. Lu 與 M. Bahoura [6]運用小波濾波器將訊號拆解為非穩態訊號的爆裂音與穩態訊號的肺泡音。 M. T. Pourazad, Z. K. Mousavi, G. Thomas[7]等科學家也使用時頻分析中的短 時傅立葉轉換(Short Time Fourier Transform)與適應性閥值演算法(Adaptive Threshold) 來將心音與肺音分離。從圖 1-6 可以看出來時頻分析也可利用在 從肺音中去除心音。Azadeh Yadollahi, Z. K. Moussavi[8]也使用肺音之熵 (Entropy),來找出訊號中之心音位置,以便將心音從肺音訊號中去除。. -8-.
(21) 圖 1-6 使用時頻分析與適應性閥值法對肺音中心音去除的結果[8] 1.3.3 訊號分析 將訊號經過擷取、前處理、並且視覺化後,接下來要考慮的就是要用什 麼樣的方法來對前處理過的肺音訊號做分析。聲音在時域的表現向來都不是 非常的明顯,肺音也一樣,除了呼氣與吸氣的過程比較容易判別外,剩下的 資 訊 常 常 無 法 從 時 域 得 知 。 肺 音 訊 號 的 分 析 方 法 自 從 Murphy RL.[9], Hoevers 和 Loudon [10]使用 Time-Expanded Waveform-Analysis 方法,以定 義的名詞 IDW(Initial Deflection Width)以及 2CD(Two Cycle Duration)來詮釋 crackle 的肺音形狀後,Mori M. [11] 與 Munakata M.[12]更進一步做了頻率 分析來界定 Crackle 的頻率大約在 0.1-1000Hz 內。學者們開始使用頻率分析. -9-.
(22) 的方法來檢視與分析肺音訊號.近年來,時頻分析的新技術出現,於是 Parkhi, A.和 Pawar, M.[13]開始使用短時傅立葉轉換(STFT)等方法[13]-[15]。本研究 除了比較前者實驗在此六種肺音之表現及效果,也實際對其結果使用影像比 對法來測試其相似度,結果連續訊號採用頻率分析法較佳,而非連續訊號則 以時頻分析法之結果較為顯著。 1.3.4 呼吸流量估測模型 由肺音訊號來估測呼吸流量也是一個重要的研究主題。呼吸流量被視為 肺部功能強弱的指標性數值之一,尤其在運動上,有強大的肺活量等同於高 耐力和高效率的運動能力,但是要在運動過程中量測呼吸流量以及內容非常 不方便,而且設備價格高昂,所以從肺音訊號估測呼吸流量對於節省成本具 有很大的幫助。Hossain I.與 Moussavi Z. [16]嘗試以不同的肺音物理量以及 模型來估測呼吸流量,他們的研究顯示出肺音的平均能量值(Average Power) 與呼吸流量的關係比較明顯,並且當氣管變成狹窄時,關係也會隨之改變, 這個現象可以在從有氣喘的兒童量測出來的肺音中發現。Yadollahi A.與 Moussavi Z. [17]將呼吸流量估測模型的焦點放在氣管音(Tracheal Sound),並 且改用熵(Entropy)來當作呼吸流量估測模型的主要參數,此研究假設了三種 模型:改進的線性模型、二階多項式模型與能階模型,其中改進的線性模型 效果估測最佳。使用熵來估測呼吸流量模型除了較平均能量值準確外,也不 需要測量多次呼吸才能推導出模型之關係。Yadollahi A.與 Moussavi Z. [18] 繼續深入的探討熵與呼吸氣流量之關係,並且將熵簡化後得到 L 值。L 值表 示訊號在平均值周圍的範圍,並且在流量變化大的情形下估測得比熵還要準 確。L 值不但能取代熵作為呼吸氣流量模型之主要參數,計算量也較熵來得 低。. - 10 -.
(23) 1.4 本論文之貢獻 肺音數位化與訊號分析之技術一直是生醫電子與醫事檢測技術的重點 研究,但是生醫電子技術要能在臨床上實際應用必須得先經過一連串的臨床 試驗。臨床試驗並不是將病患當作白老鼠,所以必定要多方配合以及溝通後 才能實行,這也是生醫電子技術容易停滯的地方。俗話說,山不轉路轉,本 研究將肺音數位化分析技術應用在運動員之肺音特色擷取,不但可以透過本 研究為運動生理學開啟新的領域,同時也能推廣肺音分析技術之實用性及可 信度。 再者,本研究透過以不同的時頻分析法來分析肺音訊號來比較不同時頻 分析法之優劣,並以多軌道式的聽診設備以及呼吸氣流預測模型,來建立一 套可以運用在運動員身上並觀察其肺音特色之系統,作為肺音訊號分析對於 運動生理學應用領域中更進一步的研究。. 1.5 論文架構 本論文一共分為六章,各章內容依序如下: 第一章 緒論:對研究背景、研究動機與目的做說明。 第二章 理論基礎:介紹呼吸系統、肺音以及其病理相關知識、時頻分 析方法,如短時傅立葉轉換、小波轉換與希爾伯.黃轉換、數位訊號處理還 有熵(Entropy)的概念等基礎理論原理。 第三章 系統架構: 介紹系統硬、軟體設計概念與實驗設備之架構。 第四章 介紹本研究所設計之各項實驗概念以及架構,還有實驗結果之 處理與分析流程設計. - 11 -.
(24) 第五章 實驗結果與討論:對模擬肺音以及實測肺音之結果作分析與討 論。 第六章 結論及未來展望:本章節將對本論文作總結,並且提出本研究 之前瞻性及未來展望。. - 12 -.
(25) 第二章 理論基礎 本章節將講述本研究架構所須之基本原理,包含呼吸系統相關知識,肺 音種類、時頻分析方法、數位訊號處理等基礎理論原理,作為後續章節建構 肺音分析系統之基礎原理。. 2.1 呼吸系統與肺音機制 2.1.1 呼吸系統. 圖 2-1 人體呼吸系統[19] 在進行肺音相關研究之前,必須先瞭解呼吸系統的形成與運作機制,呼 吸系統由呼吸道及肺臟所構成,呼吸道由以下器官所組成分別為:鼻、咽、 喉、氣管、支氣管與肺臟,其中鼻、咽和喉為上呼吸道,氣管、支氣管與肺. - 13 -.
(26) 臟為下呼吸道,如圖 2-1 所示。氣管連接喉部與肺部,位於食道之前,腹側 為軟骨環,背側為橫紋肌。腺泡為肺部之基本單元,包含細支氣管、肺泡囊 與肺泡。氣體吸入肺泡後,透過數以萬計的呼吸膜進入呼吸膜上的微血管中。 肺泡聚集於肺泡管周圍,形成了無數的肺泡間隔,同時增加能進行氣體交換 的有效表面積[19]。 2.1.2 肺音的發生機制 肺音(Lung Sound)是肺部呼吸時所產生的聲音訊號,人體在進行呼吸作 用過程中,透過肺部的收縮與擴張,使因為肺部的擠壓而從口鼻呼出,因肺 部的擴張而從口鼻吸入。這個動作可以使空氣中的氧與二氧化碳能在肺泡中 透過呼吸膜與微血管交換。上述除了造成肺部進行擴張與收縮的動作以外, 還帶動氣流在氣管、支氣管、肺支氣管以及肺泡之流動,而這些氣流也與呼 吸道管壁產生摩擦、振動而發出聲音,這些聲音就稱之為肺音。其發生之機 制如圖 2-2 所示。已經有許多相關研究證實肺音的振幅強度與呼吸道中的氣 體流速相關,而肺音頻率分佈主要與呼吸道的張力有關,而肺音的波形等其 他因素則有些. 圖 2-2 肺音發生機制之示意圖[20]. - 14 -.
(27) 原因,如肺部組織之形狀或者缺陷有關,但是一般研究的方向比較多朝 向頻率強度音質及持續時間做為分析參數來區分肺音種類。. 2.2 肺音種類區分 肺音的頻率範圍大約位於 80Hz 至 2000Hz,並可依呼吸系統是否病變來 分類,其種類主要可分為兩大類,正常肺音(Normal Pulmonary Sound)以及異 常肺音(Adventitious Pulmonary Sound) ,而依照的依據為肺音健康與否,健 康正常的肺所產生的肺音稱為正常肺音,而除了正常肺音以外,擁有呼吸系 統疾病病人的肺音會另外含有較異於正常肺音外的肺音,這些額外的肺音被 稱作異常肺音。正常肺音包含支氣管音(Bronchial Sound)、肺泡音(Vesicular Sound)以及氣管音(Tracheal Sound),是當氣流正常的通過健康的氣管、支氣 管、以及肺部時所發出來的聲音。而當有肺部病症發生時,氣流流過異常的 肺部結構: 如過敏,缺陷等,即會造成異常肺音。常見異常肺音包含哮喘 音(Wheeze)、鼾音(Rhonchus)以及爆裂音(Crackle)等, 如圖 2-3 所示。本研 究主要研究與分析之肺音種類共為六類,包括氣管音、支氣管音、肺泡音、 哮喘音、爆裂音以及喘鳴音,其特性將於後面小節逐一介紹。 2.2.1 支氣管音 支氣管音為正常肺音之一種,而且是肺音量測時較主要且容易聽見的肺 音之一。支氣管音的特色為大聲且頻率高,在吸吐氣之間會有短暫的中斷, 且吐氣期較吸氣期長且大聲。支氣管音的實際量測位置在胸骨附近的附近。 如果肺泡裡充滿液體,像是肺炎病人,則肺部周圍也可以偵測到支氣管音。 支氣管音之波形圖如圖 2-4 所示。. - 15 -.
(28) 圖 2-3 肺音種類列表[20]. 圖 2-4 支氣管音之波形圖 2.2.2 氣管音 氣管音為正常肺音之一,特色為大聲頻率高,且較支氣管音為粗。在時 間軸的呈現上與支氣管音一樣在呼吸器之間也有中斷,且吐氣期較吸氣期長 且大聲,氣管音可於人頸部氣管處量測到。氣管音之波形圖如圖 2-5 所示。 2.2.3 肺泡音 肺泡音為正常肺音之一,特色為柔和且頻率較低。在時間軸的表現上肺. - 16 -.
(29) 圖 2-5 氣管音之波形圖. 圖 2-6 肺泡音之波形圖 泡音在呼氣與吸器之間不會間斷取而代之的是在吸氣期間的尾端會慢慢衰 減。肺泡音是由於肺葉以及支氣管的空氣紊流所產生,可以在肺部周邊量測 到。肺泡音之波形圖如圖 2-6 所示。 2.2.4 哮喘音 哮喘音為異常肺音之一,乃空氣經過狹窄氣管或支氣管所致,哮喘音的 主要特色為尖銳、聲音則大小不一樣,就像是吹口哨、吹風笛或風吹入未關 緊之門縫聲,頻率分佈則有不同定義,根據美國胸腔協會的定義,哮喘音主 要頻率分部在 400 Hz 以上且持續時間達 250 ms;根據電腦化呼吸音分析 (CORSA, Computerized Re-spiratory Sound Analysis)的定義,哮喘音主要分布 頻率為 100 Hz 以上且持續時間達 100 ms 以上代表哮喘音之特徵,屬於高頻 頻段的聲音。哮喘音發生的原因為咽喉或喉頭處的上端氣管部份得之發生呼 吸道阻塞而產生,可以在支氣管周圍量測到。偵測到此特徵狀態,表示受測. - 17 -.
(30) 圖 2-7 哮喘音之波形圖 者可能患有氣喘、支氣管炎、慢性阻塞性相關之肺部疾病,需進一步做檢查, 哮喘音之波形圖如圖 2-7 所示。 2.2.5 爆裂音 爆裂音為異常肺音之一,特色為短暫(20 ms內)、且為具有爆炸性的不連 續聲音,其頻率分佈範圍為200 Hz至2000 Hz。爆裂音主要可分為兩類:第一 類為細爆裂音(Fine Crackle),特色為頻率較高、強度較弱以及持續時間短, 且於吸氣時容易偵測。細爆裂音的發生原因為所吸入的氣體與緊縮的呼吸通 道相碰撞,呼吸通道突然打開,當兩邊的氣體壓力相等時,會產生爆裂音。 第二類為粗爆裂音(Coarse Crackle),特色為頻率較低、強度較強以及持續時 間長,其發生原因為吸氣時,空氣經過過多粘液或者液體阻塞的小呼吸道。 細爆裂音與粗爆裂音之波形圖如圖2-8與圖2-9所示。 2.2.6 喘鳴音 喘鳴音屬於高頻聲音,特點與哮喘音相似,其發生原因為聲帶麻痺以及 上呼吸道阻塞所致,可以於咽喉或上端氣管等大呼吸道量測到,喘鳴音之波 形圖如圖 2-10 所示。. - 18 -.
(31) 圖 2-8 細爆裂音之波形圖. 圖 2-9 粗爆裂音之波形圖. 圖 2-10 喘鳴音之波形圖. 2.3 呼吸音與病理關係 成年人與較大的兒童,在呼吸系統健康無異狀之情形下,可從聽診器聽 取正常呼吸音,氣管音、支氣管音與肺泡音,正常呼吸音之特徵由表 2-1 所 示,其量測位置由圖 2-11 與圖 2-12 示之。呼吸系統上的疾病與缺陷是導致 異常肺音發生的主要原因,藉由發現異常肺音作為診斷病症之依據。異常肺 音可分為不連續音與連續音兩大類,其與疾病對應關係如表 2-2 所示。呼吸. - 19 -.
(32) 音同時也與肺部功能有相關。功能較強,且較有活力的呼吸系統,正常肺音 的音量也會跟著變大,且相較於一般人的肺音會比較平穩不絮亂,這也非常 適合做為是否適合運動的判斷之一。. 圖 2-11 正常呼吸音量測位置(後背)[19]. 圖 2-12 正常呼吸音量測位置(胸前)[19]. - 20 -.
(33) 表 2-1 正常呼吸音之特徵[19] 呼吸音種類. 音調. 振幅. 氣管音. 高. 大. 持續時間. 特質. 吸氣<呼氣 粗糙、空. 位置 氣管與喉嚨。. 洞、管音 的。 支氣管. 中. 中等. 吸氣=呼氣. 肺泡音. 混合. 大支氣管與肺泡較少. 的。. 的地方,後背肩胛骨 之間,特別是右邊。. 肺泡音. 低. 小. 吸氣>呼氣. 沙沙聲. 肺臟周圍,空氣經過 較小的細支氣管與肺 泡處。. - 21 -.
(34) 表 2-2 異常呼吸音之特徵[19] 呼吸音種類. 描述. 機制. 臨床實例. (1)不連續音 細爆裂音. 不連續、高頻、短暫的 吸入的空氣和先前 肺炎、鬱血性心衰 爆裂音,吸氣時可聽得 已關閉的氣道相碰 竭和間質纖維化。 見。. 的結果:在兩邊氣壓 相等的時候,產生了 爆裂音。. 粗爆裂音. 大聲、低頻、氣泡般, 吸入的空氣和企管 肺水腫、肺炎、肺 如潺潺流水聲,吸器與 與大支氣管的分泌 纖 維 化 以 及 急 病 呼氣均有機會聽到。. 物相撞。. 末期咳嗽反射降 低的病人。. 膨脹不全的爆. 聽起來像細爆裂音,但 當部份的氣泡不完 老年人、長期臥床. 裂音. 並不持續,也非病態 全充氣時,會癟掉且 或 剛 從 睡 夢 中 醒 的;在幾次呼吸後消 積滿分泌物。幾次呼 來的人。 失。可在腋窩害肺臟基 吸之後,這些區域會 部聽到。. 重新擴張,便可聽到 爆裂音。. 肋膜磨擦音. 表面的聲音,低頻且粗 因肋膜發炎而失去 肋膜炎,伴隨著呼 糙;如兩塊皮毛互相摩 潤滑而造成;在呼吸 吸時胸痛。 擦,吸器與呼氣時均可 時,兩邊肋膜相互磨 聽到。. 擦;在外側前胸可以 聽到最清楚,因為此 處肺臟移動最大。. - 22 -.
(35) 表 2-2 異常呼吸音之特徵(續)[19] (2)連續音 哮喘音. 高頻音;音樂般的聲 空氣經過狹窄或將 氣道阻塞,如急性 音,聽起來像多音和 近阻塞的氣道中通 氣 喘 或 慢 性 肺 氣 弦;呼氣時較明顯,但 過。器到的通道在關 腫。 呼氣與吸氣均可聽到。 閉和微微打開之間 來回振盪;聽起來像 振動的簧片。. 乾囉音. 低頻、單音、音樂般的 呼吸道阻塞,如簧片 支氣管炎,單一支 鼾音,呼吸時皆可聽 般的機制;音調的頻 氣管被腫瘤阻塞。 到,呼氣時較為明顯。 率與產生聲音的氣 道大小無關。. 喘鳴音. 高調、單音、吸氣時的 源 自 於 喉 嚨 或 氣 小 孩 子 的 哮 吼 鳴叫聲,在頸部比胸部 管,上呼吸道阻塞。 (Croup) 和 急 性 肺 大聲。. 起因於腫大、發炎或 炎、吸入異物,以 異物。. 及有生命危險的 氣道阻塞。. 2.4 訊號處理與時頻分析技術 近三十年來,電腦資訊的技術進步,造成資料型態的數位化,而這些新 的資料型態必須要有新的處理以及分析方法,這一門資訊處裡的技術就稱為 訊號處理(Signal Processing)。在分析數值或者是處理訊號等各種不同情況時, 最重要的工作就是要把訊號以及資料用一種最合適的方法來表示和處理,將. - 23 -.
(36) 訊號分解是一種非常有用且有效的訊號表示方法。 2.4.1 傅立葉轉換 在訊號分解的領域中,傅立葉轉換(Fourier Transform)是最廣為使用的方 法。傅立葉轉換的立論基礎在於:所有波形皆可拆解為正弦波和餘弦波的加 總組合。其概念可由下式表示: f (x ) = a 0 +. ∞. ∑ (a. k. cos kx + bk sin kx ). (2-1). k =1. 其中, a 0 =. 1 2π. 2π. ∫. f (x )dx , a k =. 0. 1. π. 2π. ∫. f (x ) cos(kx )dx , bk =. 0. 1. π. 2π. ∫ f (x)sin(kx)dx 。然而傅立葉 0. 轉換確有在頻域中無法看出時域變化之缺點。. 圖 2-13 訊號經過傅立葉轉換後從時域轉換至頻域[21] 2.4.2 短時傅立葉轉換 如上述所說,傅立葉轉換法的缺點為不能給予訊號頻率隨時間變化的資 訊,則短時傅立葉轉換法則是為了克服這個缺點所產生的方法之一。為了改 善傅立葉轉換的缺點,也就是可以同時描述時間與頻率的訊息,因而發展出 短時傅立葉轉換,短時傅立葉轉換簡單來說就是一次只分析訊號的一小部份。 英國物理學家 Gabor 在 1946 年提出窗函數(window function)的傅立葉轉. - 24 -.
(37) 圖 2-14 訊號經過短時傅立葉轉換之穿函數後得到時頻特徵之表現[21] 換,將局部訊號特性表現在同時包含時間與頻率的雙變數函數,這個窗函數 我們稱它為時間-頻率窗函數(time-frequency window function)。短時傅立葉轉 換之轉換式如下: ∞. X (t , f ) = ∫ ω (t − τ )x(τ )e − j 2πfτ dτ. (2-2). −∞. 其中 f (t ) 為原訊號, g (t ) 為窗函數。簡單來說,一個函數在乘上一段時間的 窗函數. (t),再進行一維的傅立葉轉換,隨著時間軸的推移,形成二維的傅立. 葉展開成果。短時傅立葉轉換法就像分割的傅立葉轉換法一樣,將時間軸以 窗函數切割,然後再將每個時間軸用傅立葉轉換法來呈現,其中窗函數可以 視情況使用不同的形狀。而短時傅立葉轉換法也比傅立葉轉換法更能表現出 不同時間的瞬時頻率,但是相對的計算複雜度也比傅立葉轉換法要高出許多。 對肺音訊號而言,短時傅立葉較適合不連續且較突發的肺音,可以從這些肺 音中得到更多的訊息。短時傅立葉轉換之特點為可以提供關於訊號的特徵訊 號在時域上的呈現,同時也提供頻率的相關資訊。然而,短時傅立葉轉換後 的結果之解析度為固定的,當窗函數大小選定後,頻率窗口的大小也固定了, 所以高低頻的頻率窗口式相同的,因此我們需要一個較彈性的訊號分析法, 來處理需要不同解析度分析之訊號,於是小波轉換就被發展出來了。. - 25 -.
(38) 2.4.3 小波轉換 小波為定義在某個特定時間區內的特殊波形,該波形具有振幅平均值為 零的特性。相較於傅立葉使用正弦波週期波形來當作分解訊號的函數,由圖 2-3 我們可以看見正弦波是連續且規則的,而且不管經過多久波形都是一樣 的;而小波是屬於不規則的函數,但是有對稱的特性。傅立葉轉換是將訊號 用不同頻率的正弦波表示,而小波轉換也是用不同頻率的函數表示,只不過 使用的函數為小波函數。比較傅立葉轉換與小波轉換的不同之處,傅立葉轉. 圖 2-15 正弦波(sine)與小波(wavelet)的波形比較. 圖 2-16 傅立葉轉換與小波轉換比較[21]. - 26 -.
(39) (a). (b). (c). (d). 圖 2-17 訊號分析法比較圖(a)原始訊號(時域),(b)傅立葉轉換(頻域),(c)短時 傅立葉轉換,(d)小波轉換[22] 換是以不同頻率與振幅的正弦波構成一個訊號頻率波型的大約輪廓,而小波轉 換則是用不同大小的小碎波組成一個波型的微型部分。小波轉換是參考短時傅 立葉轉換,將短時傅立葉轉換之窗函數改變為可調式函數-階位(scale),隨著訊 號頻率的高低使得窗函數之頻率或時間窗口變窄或變寬(圖 2-17)。也就是說, 訊號經過連續小波轉換後能在長時間區段看到低頻訊號,也能在短時間區段看 到高頻訊號,相較於短時傅立葉轉換,這是一個十分突出的優點。小波轉換依 訊號的連續以否可分為連續小波轉換與離散小波轉換。 連續小波轉換的基本定義如下式:. - 27 -.
(40) CWTxΨ (a, b ) =. +∞. ∫ f (t ) ψ. * ( a ,b ). (2-3). (t ) dt. −∞. 其中 f (t ) 為原始訊號之函數,ψ (*a ,b ) 為共軛複數的小波函數,其中 a 、 b 分別 表示尺度參數(Scale)與平移參數(Translation)。小波轉換函式基本定義式為: t −b f (t ) ψ , a ≠ 0, a, b ∈ R a a. 1. ψ ( a ,b ) (t ) =. (2-4). 1 表示當跨越不同尺度時,將能量正規化,且須滿足積分為零與有限能量 a. 的特性,積分為零表示可能為一震盪波,有限能量則表示其函數特性為能量 集中,如 Eq.(2-5)與 Eq.(2-6)所示。 +∞. ∫ψ (t )dt = 0. (2-5). −∞. +∞. ∫ | ψ (t ) |. 2. dt < ∞. (2-6). −∞. 小波轉換的基底函數是將小波函數透過放大或縮小 a 值並平移 b 倍後得 到母小波函數(Mother Wavelet Function)。藉由改變尺度參數可以將訊號拆解 至不同的頻帶。而小波轉換的尺度縮放可以由調整縮放因子 a 讓母小波在時 間軸上縮短或伸長,也可以藉由調整平移因子 b 使小波函數可於時間軸上平 移,如圖 2-18 所示。 在離散小波轉換的架構中,可設定解析度與平移的參數使函式為正交的 形式,如 Eq.(2-8)所示: t − bb0 a 0 a ψ ( a ,b ) (t ) = ψ aa 2 a0 0 1. (2-7). - 28 -.
(41) 其中 a 、 b 為整數且 a0 >1, b0 為平移參數。. 圖 2-18 小波函數的尺度縮放與時間平移[21] 在訊號分析中,低頻的部分常常有許多重要的訊息,離散小波轉換能夠 將訊號一層層分解成接近原始訊號的低頻訊號與雜訊的高頻部分。圖 2-18 為一個訊號經過離散小波轉換(Discrete Wavelet Transform)並且作減少取樣 (Down-Sampling)的動作,訊號如同圖 2-19 所示會經過高通濾波器(High-Pass Filter)與低通濾波器(Low-Pass Filter),而訊號經過兩個濾波器則留下高頻與 低頻部分,高頻的部分代表波形的細微變化處(有可能是噪音),低頻代表訊 號的大概形狀,所以在圖 2-18 中 cD 代表的是 Details,而 CA 代表的是 approximations 為濾波後的低通訊號。. - 29 -.
(42) 圖 2-19 小波轉換後得到高頻的細微訊號以及低通的粗略形狀訊號[22] 在從各種來源擷取訊號的時候,每一種設備所收集到的訊號通常都會夾 帶著高頻雜訊或者是環境的干擾,傅立葉轉換在經過雜訊以及訊號還原後, 因為受到三角函數全域的特點,會影響到整個訊號;而離散小波轉換因為其 局部性的特性,能夠萃取原始訊號之時域資訊,也就是說小波轉換能夠將訊 號分解成許多低解析度的組成,如圖 2-20 所示。小波轉換對低頻的訊號有 良好的解析能力,所以適合做肺音上的分析及研究。. 圖 2-20 小波轉換訊號實際分解情形[22] - 30 -.
(43) 2.5 希爾伯特.黃轉換法 希爾伯特.黃轉換法(Hilbert-Huang Transform,後簡稱 HHT)為黃鍔院 士等人[23]於 1998 年在英國皇家學會(The Royal Society)的刊物所提出的。 他 提 出 以 新 的 時 域 訊 號 分 析 法 的 經 驗 模 態 分 析 法 (Empirical Mode Decomposition,後簡稱 EMD),這種分析法對於非穩態與非線性訊號特別有 效。HHT 先利用經驗模態發希法將訊號展開成有限個本質模態函數(Intrinsic Mode Function,後簡稱 IMF)和一均值趨勢分量(Trend),再將這些 IMF 做希 爾 伯 特 轉 換 (Hilbert Transform) , 得 到 這 些 IMF 的 能 量 與 順 時 頻 率 (Instantaneous Frequency)而製成希爾伯特頻譜(Hilbert Spectrum),又依據希 爾伯特頻譜,可以定義邊際頻譜(Marginal Spectrum),此方法可以分析非線 性 或 非 穩 定 的 訊 號 。 HHT 與 其 他 方 法 不 同 之 處 為 他 同 時 擁 有 完 整 性 (Complete)、正交性(Orthogonal)、局部性(Local)與適應性(Adaptive)。HHT 之流程如圖 2-21 所示。以下將對 HHT 的重點:瞬時速率、本質模態函數(IMF) 與經驗模態分析法(EMD)做較詳細的介紹。. 圖 2-21 希爾伯特.黃轉換法流程圖[24]. - 31 -.
(44) 2.5.1 瞬時頻率 在非穩態的訊號中,無法使用傅立葉轉換之三角函數求得該訊號之瞬時 頻率,因為傅立葉轉換需要一個完整的正弦波或餘弦波的振動周期來定義局 部頻率值,也就是說取樣訊號必須大於一個完整的振動週期,這是沒有辦法 顯現出頻率隨著時間改變的非穩態訊號之特質的。因此我們使用希爾伯特轉 換來對訊號做解析,我們對原始訊號 s(t)做希爾伯特轉換得到 ŝ(t)為: sˆ(t) =. 1. π. PV. x(τ ). ∫τ t − τ dτ. (2-8). 其中 PV 指的是柯西主值(Cauchy Principal Value),將原始訊號 s(t)當作實部 (Real Part),而將轉換後的 ŝ(t)當作虛部(Imaginary Part),將此訊號結合成複 數形式 z(t),且求其振幅與相位角,則 z(t)可表示為: z (t ) = s(t ) + jsˆ(t ) = m(t )e jθ (t ). (2-9). sˆ(t ) m(t ) = s 2 (t ) + sˆ 2 (t ) ; θ (t ) = arctan s(t ) . (2-10). 如果 s(t)為無限制條件之時間訊號,則所計算出來的瞬時頻率可能不會是正 確的結果,必須要使訊號之平均值為零且要是局部對稱訊號,這樣所定義之 瞬時頻率才會具有物理意義。於是黃鍔博士提出一個有效的演算法,以下列 例子說明,對於平均值為零的訊號,瞬時頻率的定義才有物理意義。對一個 弦波訊號 s(t),令 s(t) =β+cos(t),此時考慮三種情形, (1). β=0:當弦波訊號平均值為零時,z(t)是一個以座標原點為中 心的單位圓在複數平面上,他的相位角θ(t)則是以座標原點為 中心,逆時針方向呈線性的遞增,其圖形為斜率=1 之直線,瞬 時頻率為一常數. (2). 1<β<0:z(t)仍然是個單位圓,但是圓心從圓點偏移了β單位, θ(t)不再呈線性遞增,瞬時頻率出現震盪。. - 32 -.
(45) (3). β>1:因為β值超過單位圓的半徑,因此 z(t)支圓心在單位圓 之外,相位角則在[-π/2,π/2]之間震盪,瞬時頻率開始出現 負值,與原來的訊號有極大的差別。. 瞬時頻率必須滿足單一性,故上列情形只有(1)是滿足的,而 HHT 則採用” 窄頻寬”的觀念來定義瞬時頻率。 2.5.2 本質模態函數(IMF) 建立本質模態函數是為了滿足希爾伯特轉換(Hilbert Transform)對於瞬 時頻率的限制條件,要使一個函數的瞬時頻率有效的必要條件示函數相對於 局部零均值不是對稱,而且具有同樣數目的零交越點(zero-crossing)與極值。 由於瞬時頻率之限制,每個本質模態函數必須滿足下列兩條件: (1) 局部極大值與局部極小值之合與零交越點(zero crossing)的數目相等 或最多只能差 1。 (2) 在任何時間點,局部極大值所決定的上包絡線以及局部極小值決定 之下包絡線其平均值必須接近為零。 第一個條件是為了使訊號為窄頻寬(Narrow Band),而第二個條件是為了 滿足瞬時頻率不會因為波形沒有對稱而產生多餘的振盪。在理想的狀況之下, IMF 的平均值應該要為零,但是在實際上是不可能辦到的。在 IMF 的設定 中,非穩態的訊號需要一個局部的時間尺度來定義一個局部平均值,所以 IMF 定義局部特徵時間尺度為訊號兩局部極值的時間差,並且使用局部值所 定義之極大值包絡線與由局部極小值所定義之極小值包絡線來強迫訊號能 有局部的對稱。藉由上上兩個條件,每個 IMF 只包含一種模態的振動,不 會參雜其他細微的訊號,而且其振幅與頻率也能夠變動,不會成為一個窄頻 訊號。. - 33 -.
(46) 2.5.3 經驗模態分析法(EMD) 現實中的訊號絕大部分都不會滿足本質模態函數之條件,所以對這些訊 號使用希爾伯特轉換並無法得到正確的瞬時頻率,所以透過經驗模態分析法, 就可以將這些訊號分解成許多的本質模態函數,這麼一來就可以透過希爾伯 特轉換得到確切的瞬時頻率。經驗模態分析法必須不斷重複以下的篩選程序, 來找到原訊號之每一個本質模態函數。 假設訊號 s(t)使用 EMD 取得 IMF 需要按照下列步驟: (1) 找出所有 s(t)之極值點,並利用 cubic spline 將局部極大值及局部極 小值連成上包絡線與下包絡線 (2) 求出上下包絡線之平均值m 1 (t) (3) 原始訊號s(t)與m 1 (t)相減得到分量h 1 (t) (4) 檢查h1(t)是否滿足IMF之條件,若不是則重複k次直到h k (t)滿足IMF 之條件,即將h k (t)令為c 1 (t),則c 1 (t)為第一個IMF分量。 (5) 將s(t)- c 1 (t)=r1(t) (6) 將r1(t)以(1)~(5)之步驟重複執行n次,直到得到剩餘量r n (t)為趨勢函 數無法分解為IMF時結束。則原函數s (t)可表示為 (7) 接著我們將 IMF 群組做希爾伯特轉換來求取瞬時頻率,以觀察訊號 之資訊。 由以上的篩選程序,原始訊號被分成 n 個 IMF 和一個 Trend,可以由 Eq.(2-11) 表示: n. s (t ) =. ∑c. k. (t ) + rn (t ). (2-11). k =1. 以上之步驟若畫成流程圖則如同圖 2-22 所示,被分解過後的訊號成為許多. - 34 -.
(47) 的 IMF 則如圖 2-23 所示。. 圖 2-22 經驗模態分析法流程圖[25] 經驗模態分析法的篩選程序可以當作是另一種濾波器的方法,使用局部的特 徵時間尺度分解出頻率高的 IMF,並且消除低頻的載波,使得訊號成形且越來越 對稱。EMD 與小波轉換之分解法互相比較,小波分解法使用的是固定的母小波 (如:Haar、Morlet 或 Daubechies)來拆解訊號,而 EMD 是使用迭代的篩選程序來 取得訊號的基底函數 IMF,所以 EMD 比小波分解法更具適應性,且更適合非穩 態非線性之訊號。. - 35 -.
(48) 圖 2-23 希爾伯特.黃轉換法流程結果示意圖 2.7 熵(Entropy) 熵(Entropy)原本是熱力學的一個概念,代表動力學裡不能做功的能量總 數。而波茲曼(Ludwig Boltzmann)在 1877 年提出熵的統計學定義,他認為一 個容器內的理想氣體,在微觀狀態下只需考慮:(i)所有粒子的位置階在容器 的體積範圍內;(ii)所有原子的動能總和等於該氣體的總動能值。波茲曼假 設S=k(lnΩ),其中k為波茲曼常數,而Ω是一個自然數,所以熵必定是個正 數,這個定理就叫做波茲曼方程式。1948 年,克勞德‧艾爾伍德‧夏農(Claude Elwood Shannon)將熱力學的熵引進資訊理論,故資訊理論中的熵又被稱作夏 農熵(Shannon Entropy)。資訊熵的定義為一個X值域為{x 1 ,x 2 , …, xn}的隨機. - 36 -.
(49) 變數熵值為: H(X)=E(I(X)). (2-12). 其中,E 代表了期望函數,而 I(X)是 X 的資訊量(又稱為資訊本體)。由於 I(X) 本身是個隨機變數。如果 p 代表了 X 的機率質量函數(probability mass function),則熵的公式可以表示為: n. n. i =1. i =1. H(X)= ∑ p( xi ) I ( xi ) = −∑ p(xi ) log b p(xi ). (2-13). 這個式子因為與熱力學中波茲曼所定義的熵的公式一樣,所以也稱為熵。在 熱力學裡,波茲曼將熵定義為絕對正值,代表在一個有能量的環境中,環境 絕對是趨近於平衡的(有更多的廢熱無法做功,而使環境逐漸趨向平衡),而 我們在 2-13 式看到夏農所定義之熵的公式為負值,這就是所謂的負熵。就 像正值的熵代表穩定的程度,負熵也代表著混亂的程度,所以夏農熵則是用 來代表一個系統的混亂程度,例如說一個系統的分布情形越廣,代表情況內 部越多,則系統較為混亂。. - 37 -.
(50) 第三章 系統架構 本章節將介紹系統整體規劃,並介紹研究中硬體架構,其中包含聽診器 陣列架構、麥克風、音效擷取卡等與軟體架構設計流程。. 3.1 系統整體架構 本研究之系統如圖 3-1 所示,將肺音訊號經由聽診器與麥克風的組合擷 取下來,由 USB 3D Sound Card 將肺音訊號由類比訊號轉為數位訊號,並藉 由 USB Port 將多頻道之肺音數位訊號傳到電腦裡,電腦經由 ASIO 音效卡驅 動程式錄音,最後由 Visual Signal 與 MATLAB 程式將已錄製之肺音做前處 理並分析。. 圖 3-1 系統整體架構示意圖. - 38 -.
(51) 3.2 系統硬體 3.2.1 系統硬體之架構 本研究採用精國醫療器材有限公司之 CK-A603T 聽診頭與鐵三角麥克風 AT9904 以硬橡皮管將其連接。一般的壓電麥克風或電子聽診器價格動輒要 上萬,由於本研究為了實現多頻道之肺音擷取,需要許多聽診器以及麥克風, 所以採用昂貴的電子聽診器及壓電麥克風並不符合經濟效應。再加上一般型 麥克風可以接到音效卡上由電腦錄製音訊,不必採用昂貴的資料擷取卡,可 以說是非常的節省資源。故本實驗採用最簡便的電子聽診器製作法,將麥克 風接上聽診器,並透過 USB 音效擷取卡來擷取肺音訊號,整體架構如圖 3-2 所示。. 圖 3-2. 系統硬體架構示意圖. - 39 -.
(52) 3.2.2 系統硬體之感測器 本研究採用精國醫療器材有限公司之 CK-A603T 聽診頭與鐵三角麥克風 AT9904 以硬橡皮管將其連接,如圖 3-3 所示,由左至右分別為全指向性麥 克風鐵三角 AT9904、橡皮管、精國醫療器材有限公司 CK-A603T 聽診器頭。. 圖 3-3 感測器實體架構圖 鐵三角 AT9904 麥克風如圖 3-4 所示,為對應數位錄音機器的高音質超 小型麥克風,規格表如表 3-1 所示。鐵三角 AT9904 有著高靈敏度以及相對 於市面上販賣的電容麥克風的較廣頻率響應,非常適合作為電子聽診器之收 音頭使用。. 圖 3-4. 鐵三角 AT9904 麥克風[26]. - 40 -.
(53) 表 3-1 鐵三角 AT9904 麥克風規格表[26] Element. Mono Electret Condenser. Polar Pattern. Omnidirectional. Frequency Response. 30~18,000 Hz. Sensitivity. -42 dB (7.9 mV) re 1V at 1 Pa. Impedance. 1,500 Ω. Power Supply. Plug in Power. Dimensions. Ø6.4 mm x 18mm. Weight. 1g. Cable. 1.2 m. Connector. Ø3.5 mm L-type gold-plated 3 pole mini jack. 接著只要將麥克風與精國醫療器材有限公司之 CK-A603T 聽診器頭,如 圖 3-5 所示,使用橡皮管與其做連接,即完成本研究之感測器之設置。其中 橡皮管選擇較硬且厚之橡皮管,除了可以將外界噪音反射,也可以避免橡膠 管太軟造成聽診器之聲音被管壁吸收。. 圖 3-5. 精國醫療器材有限公司之 CK-A603T 聽診器頭. - 41 -.
(54) 3.2.3 麥克風性能參數 麥克風除了外表與功能性外,其效能可以由下列特性來決定,這些特性 分別為靈敏度、指向性與頻率響應。麥克風之靈敏度代表著麥克風能夠收錄 聲音之大小範圍,有如人類的耳朵,能聽到越細小的聲音靈敏度則越高。因 為麥克風是透過電流將訊號傳遞之電腦,於是測定靈敏度之方法乃於一定點 給予麥克風聲源,然後將麥克風於無負載下收音後的輸出電壓量測出後除以 音源之音壓,靈敏度越大,表示輸出電壓越大,如 Eq.(3-1)所示。 S=. V P. (3-1). 其中,S 為靈敏度,V 為電壓(dBV),P 為音壓(Pa)。 麥克風之指向性依其功能所需可以分成下列幾項:全指向式 (Omnidirectional)、雙指向式(Bidirectional)、心型指向式(Cardioid)、超心型 指向式(Hypercardioid)與槍型指向式(Shotgun),如圖 3-6 所示。指向性代表 麥克風所收音的範圍,依照其作用之不同,所需要收音的方向也不同。本研 究所使用之麥克風屬於全指向式(Omnidirectional),麥克風對於各方向之聲 音訊號概括全收,在本研究中,肺音被聽診器放大,在橡皮管理反射,而全 向性的麥克風可以將所有被反射的聲音吸收,加強肺音的錄取。麥克風對不 同頻率的聲音靈敏度,影響輸出訊號發生放大或衰減現象,可以用一條曲線 表示之,稱為頻率響應曲線(Frequency Response Curve) 。理想狀況的頻率響 應曲線為非常直的水平線,且涵蓋所有頻率範圍,此時意味著輸出訊號能完 全呈現出原始信號的特性,但麥克風通常沒有辦法使所有的頻率都能被接收。 本實驗所採取的麥克風雖然沒有理想的頻率響應水平線,但是頻率響應的取 線在肺音的範圍中沒有衰退,是非常適合肺音量測的麥克風。. - 42 -.
(55) 圖 3-6 麥克風指向性之常見規格,(a) 全指向式 (b) 雙指向式 (c) 心型 指向式 (d) 超心型指向式 (e) 槍型指向式. 3.2.4 資料擷取卡 本研究採用 LEAD 3D Sound 5.1 TIDE PD552 USB 3d sound card (如圖 3-7 所示,規格如表 3-2 所示)為資料擷取卡,將麥克風所收錄到的 類比訊號轉換成數位訊號,並傳送到電腦中。由於本研究使用過多頻道的肺 音擷取法來擷取肺音訊號,所以一般個人電腦所配予的 USB 插座不足,故 本研究也採用廣鼎 INTOPIC HB-16 USB Port(如圖 3-7 所示,規格如表 3-3 所示)。. - 43 -.
(56) 圖 3-7 LEAD 3D Sound 5.1 TIDE PD552 USB 3d sound card[27]. 表 3-2 USB 3D sound card 規格表[27] Interface Type Channel Detailed Description. 1. 2.. 3. 4. 5.. - 44 -. USB 6 Real USB plug & play Drive 2CH speakers directly& support 3D positional sound and virtual 5.1 CH sound track Use USB port power directly External power adapter NO NEED Digital class-B power amplifier insider.
(57) 圖 3-8 廣鼎 INTOPIC HB-16 USB Port. 表 3-3 INTOPIC HB-16 USB Port 規格表 Port number Highest speed driver Power Dimension. 7 Ports USB 2.0 High-Speed HUB , 480 Mbits No driver , plug and play Comes with DC power adaptor (L)160X(W)35X(H)20.5mm. - 45 -.
(58) 3.2.5 系統硬體實體配置情形 在介紹完本研究硬體之零件後,將其組合起來則為本研究之實際硬體配 置情形,其中本研究之聽診器陣列配置,參考 R. L. Murphy[29]論文中聽診 器之配置,使用 16 個聽診麥克風位置如圖 3-9 所示,14 個聽診器以肺部形 狀排列,來擷取肺部不同位置之肺音訊號。其中聽診器 8 為氣管音之訊號。 由於氣管音可以聽到清楚的呼氣音與吸氣音,所以可以利用聽診器 8 之訊號 辨別整組訊號之相位,而聽診器 16 則是擷取心音訊號,因為在肺音擷取的 部分,心音是不必要的,所以擷取心音有助於我們在對訊號做前處理時,可 以對於肺音訊號裡的心音訊號做一個過濾的處理,實際配置圖則如圖 3-9 所 示。. 圖 3-9. 聽診器配置示意圖[29]. - 46 -.
(59) (a). (b). 圖 3-10 聽診器陣列實際配置圖,(a)正面(b)背面 綜合以上之說明,本研究之硬體實際架構如圖 3-11 所示,從聽診器終將 肺音訊號給放大,透過 AT9904 麥克風收錄,在經過 USB 3D sound card 將 訊號由類比轉為數位,再透過廣鼎 HB-16 USB PORT 將訊號傳至電腦裡。 整體系統大致來說還算穩定,只是背心可能沒辦法使聽診器貼緊背部, 這時用固定背部之固定帶可以解決此問題。而 USB 裝置太多容易造成電 流不穩,所以 USB PORT 必須額外接上電源,才能讓系統穩定。除了以上 16 個麥克風以外,也有配置一個麥克風錄製環境之聲音,透過這個麥克 風的聲音,增加去掉環境噪音之方便性。. - 47 -.
(60) 圖 3-11 系統硬體實際配置圖. 3.3 軟體架構 本研究所使用軟體流程如圖 3-12 所示,首先肺音訊號經過 ASIO 驅動 程式以 Reaper 錄音軟體錄音並以 wav 格式檔案儲存。儲存後以 MATLAB 與 Visual Signal 做前處理以及時頻分析。. 圖 3-12 系統軟體流程圖. - 48 -.
(61) 3.3.1 肺音訊號儲存 本研究透過 ASIO 驅動程式來達成聽診器陣列的多頻道肺音訊號擷取的 目的,並由 Reaper 錄音軟體將肺音訊號儲存成 wav 檔。ASIO 是 Audio Stream Input Output 的縮寫,為德國 Steinberg 公司所提出的音頻流輸入輸出應用程 序,為音頻 API 標準之一。ASIO 可實現低延遲、高同步、高吞吐率。其 開發目的是為了改善過去 OS 所搭載的驅動無法進行多通道傳輸,而提出 的改善方案。ASIO 可依照機器所能處理的情況下進行多通道、採樣率、位 元資料處理。ASIO 完全擺脫了 Windows 操作系統對硬體的集中控制,它能 實現在音頻處理軟件與硬體之間進行多通道傳輸的同時,將系統對音頻流的 響應時間降至最短。根據 ASIO 規範中定義的細節,音效卡廠商可以為其硬 體產品編寫出高效能的 ASIO 驅動程式,使用音效卡硬體對音頻流的響應時 間降低到十幾毫秒以內。Reaper 錄音程式有支援 ASIO 驅動程式,可以用 ASIO 來達成多頻道擷取音訊之目的。 3.3.2 肺音訊號分析及前處理 本研究透過 Visual Signal 與 MATLAB 來對已儲存之肺音訊號做前處理 及分析,主要以 Visual Signal 為主對肺音訊號做前處理如濾波,正規化以及 去噪之手續,並將前處理後之肺音訊號做時頻分析,而由 MATLAB 程式對 肺音訊號做不同方法或參數之前處理,來與被 Visual Signal 前處理之訊號做 比較。Visual Signal 為臺灣逸奇科技所開發之時頻分析軟體,它透過內附之 視覺化控制元件,來達成多元之訊號分析呈現。Visual Signal 也與中央大學 之訊號分析權威黃鍔博士合作,開發出以 HHT 分析法來分析訊號之程序法, 對本研究來說十分合適。MATLAB 為美國 The MathWorks 所開發的商業數. - 49 -.
(62) 學軟體,除了本身的計算能力外,也附有強大的演算法開發功能,能補足 Visual Signal 所不足的地方。. - 50 -.
(63) 第四章 實驗之設計與配置 本章節將依據第二章理論基礎與第三章之系統結構,設計以本研究之肺 音分析系統所適合的實驗流程,並且以此章所敘述之實驗來驗證本研究之肺 音分析系統具有實質上的效用以及貢獻。本章將以以下小節來說明本研究之 實驗設計及流程,分別為:整體實驗架構、模擬肺音分析測試、肺音量測流 程設計、實際肺音之前處理與分析與呼氣氣流估測模型。. 4.1 整體實驗架構 本研究之系統架構及實驗之設計與配置主要分為四部分,分別為模擬肺 音分析測試、肺音測量流程設計、實際肺音前處理與分析以及呼氣氣流估測 模型。第一部分為模擬肺音分析測試:透過以時頻分析法來分析教學用之模 擬肺音以及實際肺音,來比較不同時頻分析法之特色與優點,並決定何種時 頻分析法為最適合肺音分析之方法。第二部分為肺音測量流程設計,以文獻 所提供內容之整理,設計出能夠測量運動員肺音之實驗流程。第三部分為真 實肺音之前處理與分析:如何將在一般環境下所錄製之肺音,經由前處理之 流程過濾肺音及心音,並且將其正規化後再做時頻分析。第四部份為呼氣氣 流估測模型,透過計算肺音之熵,來推測受測者之呼氣氣流流速,受測者同 時也有做最簡單的呼氣氣流紀錄。. 4.2 模擬肺音分析測試 工欲善其事,必先利其器。在量測實際運動員之肺音之前,必須要先了 解各種時頻方法之特色,並且觀察時頻分析方法對肺音分析的結果。所以本 研究為了比較時頻分析方法之優劣,以及觀察時頻分析方法用於肺音分. - 51 -.
Outline
相關文件
Hofmann, “Collaborative filtering via Gaussian probabilistic latent semantic analysis”, Proceedings of the 26th Annual International ACM SIGIR Conference on Research and
in Proceedings of the 20th International Conference on Very Large Data
and Liu, S.J., “Quantifying Benefits of Knowledge Management System: A Case Study of an Engineering Consulting Firm,” Proceedings of International Symposium on Automation and
Approach and a Boundary Element Method for the Calculation of Sound Fields in the Human Ear Canal, " Journal of the Acoustical Society of America, 118(4), pp. Axelsson,
Godsill, “Detection of abrupt spectral changes using support vector machines: an application to audio signal segmentation,” Proceedings of the IEEE International Conference
D.Wilcox, “A hidden Markov model framework for video segmentation using audio and image features,” in Proceedings of the 1998 IEEE Internation Conference on Acoustics, Speech,
[16] Goto, M., “A Robust Predominant-F0 Estimation Method for Real-time Detection of Melody and Bass Lines in CD Recordings,” Proceedings of the 2000 IEEE International Conference
Harma, “Automatic identification of bird species based on sinusoidal modeling of syllables,” in Proceedings of IEEE International Conference on Acoustics, Speech,