感官分析實驗評估

第三章研究⽅法

3.6 感官分析實驗評估

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

⾏正式品飲。進⾏品飲後，請消費者綜合⽂本閱讀與實際品飲之印象，就 14 個風味感知屬性分別予以 0-5 的評分。在每款品項測試的中間，提供白開⽔飲用，除補充⽔分外，亦沖淡前⼀測試品項留於⼝鼻之氣味。此⼀過程持續重複進⾏，直⾄所有測試品項皆評分完畢。

⼀般⽽⾔，如欲比較自然語⾔處理之電腦模型與⼀般消費者對評論⽂字的風味感知屬性預測能⼒，應該使電腦與消費者同樣皆以品評⽂字作為輸⼊資訊，但考量到⼀般消費者藉由⽂字體會風味，再把感受轉化為量尺分數的過程較為抽象且難以想像，故本研究之品味測試除提供風味感知屬性之說明與情緒板參考外，亦採⽂字閱讀加上實際試飲的⽅式來進⾏，以期稍微彌補⼀般消費者與專家之間風味感知屬性評分能⼒的差距，Ares 等⼈於 2017 年的研究[50]中亦指出，少量的訓練即能⼤幅提升⼀般消費者之感知評估能⼒，本研究亦盼能藉此⼀能⼒之提升，加強電腦模型預測作為比較對象的實用性。

本研究品飲測試之風味感知屬性評分採線上問卷形式進⾏，評分區間數量之選擇參考 Meyner 等⼈ 2015 年研究[51]所歸納，於 Rate-All-That-Apply 感官分析使用之6 點式量尺，以便更好對應代表不適用（Not applicable）之 0 數值的存在。

3.6 感官分析實驗評估

感官分析實驗結果，主要評估⽅法如下：首先將受試者針對6 個研究標的評分的問卷進⾏統計。接著，將6 個測試品項的 Distiller 網站專業品評筆記⽂本輸

‧

測，隨後再將其預測結果與⼀般消費者評測之結果分別與Distiller 網站之專家感官品評分數相減，求取兩組6 個測試品項的 14 個風味屬性測試結果和專家品 U 檢定（Mann-Whitney’s U Test）[55]，以檢驗電腦模型預測與專家品評之餘弦相似度排序分佈是否顯著⾼於於⼀般消費者評測結果與專家評分之餘弦相似

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

度；基於本研究對電腦模型預測能⼒應不遜於⼀般消費者評測之假設，在此定義虛無假設（Null hypothesis，𝐻_-）為電腦模型於六個品項之餘弦相似度排序與

⼀般消費者品評餘弦相似度之排序彼此交錯或低於⼀般消費者，對立假設

（Alternative hypothesis，𝐻_*）則為電腦模型於六個品項之餘弦相似度排序⾼於

⼀般消費者品評之餘弦相似度排序。

另外，除比較電腦模型預測與⼀般消費者評測能⼒的⾼低外，本研究亦欲探究電腦模型透過品評⽂字對風味屬性的感知能⼒和⼀般消費者透過試飲與品評⽂字的風味屬性感知能⼒是否有著相似的模式存在，故將再針對 6 個預測品項之14 個風味屬性之電腦模型預測結果與⼀般消費者評測結果，透過複製⾄最

⼤公倍數的⽅式對齊總樣本數量數量，再透過Python 之 SciPy 套件[56]進⾏斯皮爾曼等級相關係數（Spearman’s rank correlation coefficient）[57]之計算，藉以觀察兩組預測結果數值排序之分佈是否顯著相同，若確有顯著正相關的現象，

則代表電腦對於品味⽂本的感知模式與⼀般消費者對品味⽂本與試飲樣本可能具有相近的感知模式；反之，則代表電腦對於品味⽂本的感知模式和⼀般消費者對品味⽂本與試飲樣本的感知模式可能有所不同。

本研究透過以上標準之檢驗，比較深度學習品評筆記之多類別分類模型與進⾏感官品評測試之⼀般消費者間的感知能⼒差距，若電腦模型之預測結果排序經統計檢定後確實顯著⾼於與消費者平均評測之結果，且電腦預測結果與⼀

般消費者評測結果之排序有顯著之正相關，則我們可假設本研究所產出之模型作為感官分析研究替代⼀般消費者測試的補充⽅法，確實具有⼀定的可靠性。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中基於感知屬性的品味分析：以酒飲網站專業與消費者評論為例 - 政大學術集成 (頁 35-38)

第三章 研究⽅法

3.6 感官分析實驗評估

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

3.6 感官分析實驗評估

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章研究⽅法

立政治大學

立政治大學

立政治大學