第三章 研究⽅法
3.6 感官分析實驗評估
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
⾏正式品飲。進⾏品飲後,請消費者綜合⽂本閱讀與實際品飲之印象,就 14 個風味感知屬性分別予以 0-5 的評分。在每款品項測試的中間,提供白開⽔飲 用,除補充⽔分外,亦沖淡前⼀測試品項留於⼝鼻之氣味。此⼀過程持續重複 進⾏,直⾄所有測試品項皆評分完畢。
⼀般⽽⾔,如欲比較自然語⾔處理之電腦模型與⼀般消費者對評論⽂字的 風味感知屬性預測能⼒,應該使電腦與消費者同樣皆以品評⽂字作為輸⼊資 訊,但考量到⼀般消費者藉由⽂字體會風味,再把感受轉化為量尺分數的過程 較為抽象且難以想像,故本研究之品味測試除提供風味感知屬性之說明與情緒 板參考外,亦採⽂字閱讀加上實際試飲的⽅式來進⾏,以期稍微彌補⼀般消費 者與專家之間風味感知屬性評分能⼒的差距,Ares 等⼈於 2017 年的研究[50]中 亦指出,少量的訓練即能⼤幅提升⼀般消費者之感知評估能⼒,本研究亦盼能 藉此⼀能⼒之提升,加強電腦模型預測作為比較對象的實用性。
本研究品飲測試之風味感知屬性評分採線上問卷形式進⾏,評分區間數量 之選擇參考 Meyner 等⼈ 2015 年研究[51]所歸納,於 Rate-All-That-Apply 感官 分析使用之6 點式量尺,以便更好對應代表不適用(Not applicable)之 0 數值 的存在。
3.6 感官分析實驗評估
感官分析實驗結果,主要評估⽅法如下:首先將受試者針對6 個研究標的評分 的問卷進⾏統計。接著,將6 個測試品項的 Distiller 網站專業品評筆記⽂本輸
‧
測,隨後再將其預測結果與⼀般消費者評測之結果分別與Distiller 網站之專家 感官品評分數相減,求取兩組6 個測試品項的 14 個風味屬性測試結果和專家品 U 檢定(Mann-Whitney’s U Test)[55],以檢驗電腦模型預測與專家品評之餘弦 相似度排序分佈是否顯著⾼於於⼀般消費者評測結果與專家評分之餘弦相似‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
度;基於本研究對電腦模型預測能⼒應不遜於⼀般消費者評測之假設,在此定 義虛無假設(Null hypothesis,𝐻-)為電腦模型於六個品項之餘弦相似度排序與
⼀般消費者品評餘弦相似度之排序彼此交錯或低於⼀般消費者,對立假設
(Alternative hypothesis,𝐻*)則為電腦模型於六個品項之餘弦相似度排序⾼於
⼀般消費者品評之餘弦相似度排序。
另外,除比較電腦模型預測與⼀般消費者評測能⼒的⾼低外,本研究亦欲 探究電腦模型透過品評⽂字對風味屬性的感知能⼒和⼀般消費者透過試飲與品 評⽂字的風味屬性感知能⼒是否有著相似的模式存在,故將再針對 6 個預測品 項之14 個風味屬性之電腦模型預測結果與⼀般消費者評測結果,透過複製⾄最
⼤公倍數的⽅式對齊總樣本數量數量,再透過Python 之 SciPy 套件[56]進⾏斯 皮爾曼等級相關係數(Spearman’s rank correlation coefficient)[57]之計算,藉以 觀察兩組預測結果數值排序之分佈是否顯著相同,若確有顯著正相關的現象,
則代表電腦對於品味⽂本的感知模式與⼀般消費者對品味⽂本與試飲樣本可能 具有相近的感知模式;反之,則代表電腦對於品味⽂本的感知模式和⼀般消費 者對品味⽂本與試飲樣本的感知模式可能有所不同。
本研究透過以上標準之檢驗,比較深度學習品評筆記之多類別分類模型與 進⾏感官品評測試之⼀般消費者間的感知能⼒差距,若電腦模型之預測結果排 序經統計檢定後確實顯著⾼於與消費者平均評測之結果,且電腦預測結果與⼀
般消費者評測結果之排序有顯著之正相關,則我們可假設本研究所產出之模型 作為感官分析研究替代⼀般消費者測試的補充⽅法,確實具有⼀定的可靠性。