第四章 實驗
4.5 和最多食材搭配的核心食材
4.4.3 Phi 相關係數為負值之 Ingredient Pairs
Phi 相關係數的值介於-1 及+1 之間,當 Phi 相關係數 < 0 時,表示二食材 的關係為負相關,也就是說此兩食材不常搭配在一起。表 4-30 為 Phi 相關係數 為負值之食材。
表 4-30 Phi 相關係數為負的 ingredient pairs
Food.com Yummly.com Allrecipes.com
cabbage, vanilla extract parmesan cheese, vanilla beans parmesan cheese, powdered sugar broccoli, vanilla extract green onion, vanilla beans chicken broth, powdered sugar vanilla extract, vegetable broth cabbage, powdered sugar frozen pea, vanilla extract
chive, vanilla extract green bell pepper, powdered sugar parmesan cheese, semi-sweet chocolate morsels bananas, parmesan cheese powdered sugar, vegetable broth parsley, powdered sugar
cream of mushroom soup, vanilla extract ground pork, powdered sugar ground beef, powdered sugar red wine vinegar, vanilla extract broccoli, powdered sugar almond extract, garlic frozen pea, vanilla extract cucumber, powdered sugar paprika, vanilla extract green pepper, vanilla extract parmesan cheese, peanut butter red bell pepper, vanilla extract parmesan cheese, powdered sugar pasta, powdered sugar dried oregano, vanilla extract
4.5 和最多食材搭配的核心食材
本論文使 Gephi 圖像視覺化工具來展現各類料理食材網絡之前二十大核心 食材[26] 。食材為節點,食材名稱字體大小及顏色深淺代表 Degree Centrality 高 低,Degree Centrality 越高則字體越大且顏色越深。食材的搭配以邊連結,以邊 的粗細代表權重,搭配次數越多,權重越高。
以 food.com 食譜資料為例,各類料理前二十大核心食材與常用食材大致相 符,亦即食譜中出現頻率高的食材,越有機會和不同種類食材搭配,Degree Centrality 也越高。在法式料理中,milk 為常用食材第 11 名,在核心食材排名為 17,顯示在實驗的法式食譜中,和牛奶搭配的食材有一些限制。在西班牙料理中,
salsa 為常用食材第 9 名,但在核心食材排名為 15;cheddar cheese 在常用食材排 名 13,但在核心食材排名為 20;olive oil 在常用食材排名為 18,但在核心食材 排名為 13;顯示在實驗的西班牙食譜中,cheddar cheese 出現頻率雖較 olive oil 高,但與 olive oil 搭配的食材種類較 cheddar cheese 多。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
(1) 圖 4-33 為中式料理前二十大核心食材。
圖 4-34 Food.com 中式料理核心食材
(2) 圖 4-34 為日式料理前二十大核心食材。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
(3) 圖 4-35 為印度料理前二十大核心食材。
圖 4-36 Food.com 印度料理核心食材
(4) 圖 4-36 為西班牙料理前二十大核心食材。
圖 4-37 Food.com 西班牙料理核心食材
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
(5) 圖 4-37 為法式料理前二十大核心食材。
圖 4-38 Food.com 法式料理核心食材
(6) 圖 4-38 為泰式料理前二十大核心食材。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
(7) 圖 4-39 為義式料理前二十大核心食材。
圖 4-40 Food.com 義式料理核心食材
(7) 圖 4-40 為墨西哥料理前二十大核心食材。
圖 4-41 Food.com 墨西哥料理核心食材
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
4.6 料理自動分類
本實驗採用 Food.com 及 Yummly.com 已標記料理別之食譜,料理別選取義 式、法式、西班牙、印度、中式、泰式、墨西哥及日式料理,因各類料理之食譜 數不均,故本實驗使用 downsizing 及 upsizing 技術,料理資料樣本數各取八百 筆。
(1)以 SVM 分類結果
實驗分別以食材同義詞轉換處理前及處理後資料進行 SVM 分類,以 5-fold 交叉驗證分類器的準確率,實驗結果顯示食材經同義詞處理後,分類準確率略有 提高,如表 4-31。
表 4-31 食材同義詞轉換處理前後分類準確率比較表
Food.com Yummly.com
同義詞處理前分類平均準確率 76.2083% 93.7361%
同義詞處理後分類平均準確率 76.2639% 93.9583%
(2)RandomForest 演算法分類結果
圖 4-41 顯示以 Food.com 的食譜資料進行 RandomForest 演算法分類,平均 準確率為 75.8065%,圖 4-42 之 Confusion Matrix 顯示義式、法式及西班牙料理 較相似,中式及日式料理相似。圖 4-43 顯示 Yummly.com 食譜以 RandomForest 演算法分類,平均準確率為 93.9028%。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
圖 4-42 Food.com 食譜資料以 RandomForest 分類準確率
圖 4-43 Food.com 食譜資料以 RandomForest 分類之 confusion matrix
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
圖 4-44 Yummly.com 食譜資料以 RandomForest 分類準確率
(3) C4.5 演算法分類結果
圖 4-44 顯 示 Food.com 食 譜 以 C4.5 决 策 樹 演 算 法 分 類 平 均 準 確 率 66.0556%。圖 4-45 顯示 Yummly.com 食譜以 C4.5 决策樹演算法分類平均準確率 66.0556%。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
圖 4-46Yummly.com 食譜資料以 C4.5 分類平均準確率