• 沒有找到結果。

第二章 相關研究

2.1. 食譜相關學術研究

及食材轉換為 Graph,以 Graph 表示烹調流程及食材流程,提出過濾食譜 Graph 的方法來修剪 Graph,以增進食譜 Graph Matching 的效能。而後再測量食譜間 Graph 之相似度,找出與搜尋標的相似之食譜,改善中式食譜網路搜尋及推薦。

2011 年 10 月,劍橋大學的 Yong-Yeol Ahn 等人於「自然」《Nature》發行的 Scientific Reports 發表研究[2],分析全球使用的 381 種食材以及食材的 1021 種風 味化合物組合。有鑑於食品科學認為食材的搭配關係取決於食材中的風味化合物 (Flavor Compounds), 該實驗將食材和風味 化合物形成 Ingredient-compounds bipartite network。在這個網絡有食材及風味化合物二種不同類型的節點,節點間 的連結代表食材含有風味化合物。此網絡中平均每個食材連接到 51 種風味化合 物。而後將二種節點類型網絡投射成只有食材節點的共同風味化合物網絡,任二 個食材有共同風味化合物,就有一個邊,二個食材間共享的風味化合物越多,邊 的權重越高。利用風味化合物網絡,比對美國著名美食網站 Epicurious.com 和 Allrecipes.com 的 56,498 道食譜,以及南韓食譜網站 Menupan.com 的食譜資料,

分析北美、西歐、南歐、拉丁與東亞這五區料理之常用食材,發現:「西方料理 傾向將共享多項風味化合物的食材搭配在一起,而東方料理搭配食材間共享的風

Chun-Yuen Teng 等人 2012 年分析 Allrecipes.com 的食譜[20],建構二種網絡:

互補網絡(Complement Network)及替代網絡(Substitute Network),以捕捉食材之間 的關係。互補網絡用來發現傾向共同出現的食材,這個網絡隱含食材間搭配的適 食材網絡(Combinations of Ingredient Networks)及營養資訊。由於這個複合網絡已 隱含使用者的喜好、食材搭配及食材取代訊息,故該模組可針對一組相似的食 譜,預測使用者之偏好。在該論文中也說明由回饋意見中萃取使用者建議調整配 方的方法,例如尋找替代性食材時,使用之關鍵字為“replace a with b”、“substitute b for a”及“b instead of a”等,由自然語言文本中探勘研究所需之資料。

2013 年 Kush R. Varshney 選取 1300 年到 1615 年的 25 本中世紀歐洲食譜 [23],研究包含 4,133 道食譜,並以自然語言處理(Natural Language Processing,

簡稱 NLP)之 Lemmatisation 技術解決食材名稱的不一致問題,建立包含 386 種 食材的語料庫,平均每道食譜含 7.74 種食材。而後將中世紀歐洲食譜和二個風 味化合物資料庫比對: Fenaroli's Handbook 及 VCF。實驗結果顯示中世紀歐洲食 譜的食材搭配符合 2004 年 Fenaroli's Handbook 第五版風味化合物資料庫,該資 料庫包含 1,530 種食材及 1,107 種風味化合物,2011 年 Sebastian Ahnert 等人分析 食材搭配的研究正是使用此資料。另一個風味化合物資料庫是 1963 年 Weurman 提出,後由 Toegepast Natuurwetenschappelijk Onderzoek (TNO)持續更新的 VCF,

含三個主要組件: designer、assessor 及 planner,每個組件都有 domain knowledge database 支撐。經由此系統產生的食譜,例如 Caymanian Plantain Dessert,被類 似 Consensual Assessment Technique 的方法評估為線上最具創意的食譜之一。這 個系統可以幫助主廚們探索食物的新遠景,用 data-driven 的方法去計算更多的創 意,這個研究也和 IBM 的 cognitive cooking 計畫相關。

雖然有些網站之部份食譜有標明料理類別,但有更多的食譜未標示屬於何類 料理,利用食譜包含之食材來區分料理類別的學術研究不多。Han Su 等人於 2014 年發表針對 food.com 食譜網站的 226,025 道食譜之研究[18],使用的食材數有 5,073 種,平均每道料理含 8.57 項食材,以食譜所內含食材為特徵值,進行中式、

德式、義式、日式及西班牙六種料理自動分類實驗。由該實驗過程中可探知那些 料理有著共同出現食材,以及各類料理常用食材,並以不同分類方法進行料理自 動分類,實驗結果可應用於食譜推薦之料理類別標示及有助食譜目錄自動分類。

2014 年 Corrado Boscarino 等人基於食材的互換可能性計算替代性食材[6],

使用 Httrack 工具取得荷蘭連鎖超級市場 Albert Heijn 網頁上的食譜,每個食譜轉 為有 7,172 度空間的點,每個空間代表一個食材,這些點形成一個食譜資料庫;

使 用 食 譜 百 科 Cook's Thesaurus 的 替 代 性 食 材 規 則 , 並 將 Latent Dirichlet Allocation (LDA)應用到食譜資料庫中,實驗顯示此方法找出的替代性食材效果 近似人工判斷。

以上的研究有的是著重在食材的風味化合物組成;有些是利用食譜百科或使 用者意見,以找出替代性食材;有些研究料理的自動分類,但未進一步分析料理

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

間相似度;也有研究自動或半自動產生創新食譜,展現計算創意。但就我們所知,

關於各類料理食材組成樣式及特色食材的大量食譜探勘不多,針對不同料理類別 的相似度探勘也較少。故本論文針對大量食譜資料進行分析,找出各類料理特徵 樣式及呈現不同料理間的相似度比較。此外,有鑑於食材名稱的多元化,本論文 除採用自然語言處理技術外,也綜合食譜百科資料及食譜網站之特性,再利用 Connected Component Labeling 技術,提出找出食材名稱同義詞之方法。

類,將不同名稱之相同食材賦予同一食材編號,如 Allrecipes.com 之食譜。此外,

許多食譜網站提供食譜評論(reviews)、評分(ratings)之功能,讓使用者得以回饋

3.1.1. AllRecipes.com

AllRecipes.com 成立於 1997 年,總部設在西雅圖,是目前全世界最大的食 譜網站,食譜數量超過一百萬道。每年會有十億的用戶通過 18 個 AllRecipes.com 的網站,在 23 個國家及地區用 12 種語言分享食譜、交流烹調技巧及樂趣。

Allrecipes.com 支援多語系的功能提供使用者得以母語上傳道地的地方美食。

AllRecipes.com 的食譜除包含食材、作法之外,還有大量的使用者回饋意見。

此外,AllRecipes.com 還提供菜單設計(Menu Planning)的功能,使用者可以規劃 一星期之食譜,系統會根據所選定之食譜計算食材採購清單,以利使用者準備食 片或增加註解,如圖 3-1,並提供標籤(tags)選項包括:[Appetizers、BBQ and grilling、Beef、Beverages、Bread、 Breakfast/Brunch、Cakes、Chicken、Cookies、

Desserts、Family、 Healthy Cooking、Holidays、Italian、Kid-friendly、Lifestyle、

Main Dish、 Meal ideas、Mexican、Other ethnic food、Pasta、Pork、Quick and Easy、

Restaurants、Salad、Seafood、Seasonal cooking、Side-dish、Slow Cooker、 Soups and stews、Vegetarian],每道食譜最可以標示五個標籤。

同一食材經由不同會員輸入網站時,名稱可能不同。例如 masa flour、masa

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

圖 3-1 AllRecipes.com 綱站食譜示意圖 Retrieved August 1, 2015, http://allrecipes.com/recipe

3.1.2. Food.com

Food.com 成立於 1999 年,是第三大食物網站,提供使用者即時分享家庭 料理食譜、料理圖片、料理訣竅及飲食趨勢的交流平台,每月有超過二千萬以上 的使用者造訪,擁有超過五十萬道食譜。

Food.com 首頁除提供以食譜名稱搜尋食譜外,也提供主題連結,如 Popular Now 連結至最受歡迎的主題食譜、Trending 可連結至流行的食譜、Popular Search 連結至最常搜尋的食譜主題;此外,Tool Box 除提供食材辭典、目錄查詢、最新

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

食譜外,還提供度量轉換(Measurement Converter)的貼心服務,如圖 3-2。

圖 3-2 Food.com Measurement Converter 示意圖

Retrieved August 3, 2015, from http://www.food.com/library/calc.zsp

一般食譜網站提供會員建立一道新食譜時,輸入食譜名稱、食譜描述、食 材、烹調步驟、前置處理時間、烹調時間、食譜分量,上傳相關圖片等。有的食 譜網站還可以標示食譜之料理類別(國家、地區)、食譜之屬性(早/午/晚餐、開胃 菜、沙拉、湯品、麵包、主菜、飲料)等資訊。Food.com 的會員在輸入食材時,

系統會即時檢核食材名稱之正確性,例如 purple onion 無法通過檢核;並強制要 求輸入食材使用量(杯、匙、盎司等單位),系統還會自動將英文大寫轉為小寫,

相較於 Yummly.com 及 Allrecipes.com,食材輸入控制較嚴格。圖 3-3 為 Food.com 食譜的示意圖。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

圖 3-3 Food.com 食譜示意圖

Retrieved August 3, 2015, from http://www.food.com

3.1.3 Yummly.com

Yummly.com 成立於 2009 年,Yummly.com 的核心基本上是食譜、烹飪的搜 尋引擎,每月有一千五百萬次使用者造訪,是成長最快的食譜網站,目前已收錄 了超過一百萬道食譜。Yummly.com 的食譜除了一般食譜網站的食材、作法之外,

部份食譜還提供料理營養成分及 1-5 級範圍的口味(包括 Salty, Sweet, Savory, Sour, Bitter, Spicy 六種口味)標示。

一 般 食 譜 網 站 搜 尋 引 擎 基 本 上 是 根 據 食 譜 或 食 材 名 稱 進 行 搜 尋 , Yummly.com 引以自豪的進階搜尋功能,可依據營養成份(Nutrition Facts)、飲食 限制、熱量、價格、料理類別、烹煮時間及技術等條件進行過濾;會員在建立食 譜後,系統會自動算出營養成份、熱量、屬性標示(如歸屬飲料類或主食類)及引 起過敏成份,如圖 3-4;如果想要改變某食譜之食用量,系統平台還能自動重新 計算食材使用量。

Yummly.com 上傳食譜最少需包含一個長度大於五字元之烹調步驟,及輸

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

入二個長度大於二字元之食材名稱,使用者可對該食譜寫下最少一百字元之評論 或給予一至五分的評分。會員認為其他人的評論有助益時,可按下[like]鍵,也 可針對該評論給予[不實/和食譜無關/不適當]三種標記;食譜評論可選擇按[最新/

最有助益]二種排序方式列示。

圖 3-4 Yummly.com 食譜標示示意圖 Retrieved August 3, 2015,

http://www.yummly.com/recipe/Chicago-Chicken-822419?columns=4&position=11%

2F37

3.1.4 Cook's Thesaurus

Cook's Thesaurus 是一個烹飪百科全書的網站,1995 年成立,由 UC Davis 經濟學博士 Lori Alden 創立,涵蓋數以千計的食材成分及廚房工具,內容包括 圖片、描述、同義詞、發音及替代食材,圖 3-5 為 Cook's Thesaurus 綱站食材同 義詞示意圖。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

圖 3-5 Cook's Thesaurus 綱站食材同義詞示意圖 Retrieved August 6, 2015, http://www.foodsubs.com

3.2 資料前處理與同義詞處理

在資料探勘的過程中,為了確保得到高品質的探勘結果,資料前處理是重要 的步驟。檢視我們由網站取回的資料中,少數食譜只包含單一食材。針對這種現 象,Yummly.com 網站就限制新食譜應輸入至少二樣食材。故本實驗將單一食材 的食譜過濾。此外,對於取回之資料,單一食譜內若有食材重複出現,經過資料 前處理後,在該食譜內僅計一次。

分析網站食譜之食材名稱有多元化的情形。不同的食材名稱卻屬於相同的食 材,因此在分析食譜資料前,必須先針對食材的多元化情形做前處理。食材的多 元化有下列幾種情形:

(1) 大小寫: 例如 Parmesan cheese 和 parmesan cheese

(1) 大小寫: 例如 Parmesan cheese 和 parmesan cheese