• 沒有找到結果。

應用文字探勘技術萃取設計概念之研究 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "應用文字探勘技術萃取設計概念之研究 - 政大學術集成"

Copied!
71
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊管理學系. 碩士學位論文 指導教授:楊建民博士. 立. 政 治 大. ‧ 國. 學. 應用文字探勘技術萃取設計概念之研究. ‧. sit. y. Nat. A Study of Using Text Mining on. n. al. er. io. Design Concept Extraction. Ch. engchi. i n U. v. 研究生:羅康維 中華民國 101 年 7 月.

(2) 致謝. 這兩年研究所的生活中最首要感謝的是楊建民老師,給了我很多天馬行空的 機會,從興趣中找尋研究的方向,並且協助我慢慢發展形成研究,一路用心指導 直到能夠畢業;感謝季延平老師、邱光輝老師及劉文卿老師在論文提報及口試時 給予指導以及建議,不排斥在這個資管領域中屬於冷門的研究,讓我能夠提升論 文內容及架構上的品質;感謝大學的傅振瑞老師及趙國仁老師,在我畢業多時依 然鼓勵我朝我的目標前進。能夠在求學階段遇到這些貴人老師真的很幸福。. 政 治 大. 再來最要感謝的是我能夠幸運相遇這班研究所的同學們,感謝他們讓我能夠. 立. 在不同的思考模式中相互激盪,在課業繁重中互相勉勵,在筋疲力竭後能同享歡. ‧ 國. 學. 樂,感謝鴻仁、國傑及婉婷,一起同甘共苦的好夥伴,如果沒有你們我今天真的 無法順利畢業,你們的心思細膩、對自己作品的堅持、總是謙虛且能繳交令人滿. ‧. 意的成績及對朋友的付出,總能讓我溫暖在心裡時並提醒自己要多學習,感謝你. y. Nat. sit. 們對我”一個都不能少的”幫助,觸動我的內心,讓我在最艱苦的時候支撐了下去,. n. al. er. io. 能夠在同一時間完成論文,內心無限感慨,由衷感謝,期望未來大家能夠在展翅 各方時能夠再次聚首。. Ch. engchi. i n U. v. 感謝凱莉、佩妮、妞妞、Fifi 和伍迪等碩班夥伴歡樂充實了研究所生活;感 謝鈞華、宜儒、智民、振和、柏均以及其他碩班的學長姊給我的未來有美好的願 景;感謝士楊、婕妤、悅岑能夠在工作之餘能夠認識這樣的優質好友;感謝閔翔、 Jasmine、樹,能夠在我撰寫論文期間,給我設計領域的專業知識,讓我這個門 外漢能從門縫中,了解一絲光芒;感謝大學好友 FunnyBoy 們,每當能夠看到夜 晚的星空就會想到,大學時的甘苦甜,知道你們各自努力,讓我也不敢鬆懈;感 謝家人的鼓勵與支持,感謝媽媽的用心良苦,讓我能毫無顧忌的專心研究;感謝 伊容給了我愉快的四年美好時光,感謝富秝給了我更多時間與研究所同學相處且 能夠專心研究,雖然住在心裡的妳從來沒搬走,不過看在妳給我更多複雜力量轉 I.

(3) 換成前進的動能之下,就不收妳欠繳已久的房租了,期望妳也能順利畢業,度過 妳幸福美好的生活。要感謝的人實在太多,礙於篇幅,實在無法一一詳述,我依 然關心及感謝陪伴我共享喜怒哀樂的人們,往後的一切都好。 最後,謹將這份榮耀獻給所有關心我及我關心的人。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. II. i n U. v.

(4) 摘要. 近年來,設計已成為提高產品附加價值並增進利潤的利器之一,企業在全球 競爭壓力下為了提升競爭力,積極透過設計力開發創新產品。在政府的積極推動 下,許多傳統產業與設計公司媒合。然而如何將產品創新需求,轉換並傳達成設 計概念,成為極其重要且困難的問題。 本研究為有效傳達設計概念,蒐集 2005 年至 2012 年參加德國 iF 國際產品 設計大獎以及 RedDot 設計獎得獎作品,鎖定所有桌椅櫃類的產品描述,應用文. 政 治 大. 字探勘技術將產品描述過濾並找出對應特徵值亦即設計元素,再利用 KNN 技術. 立. 將設計元素分群,試圖從各群中萃取出設計概念。. ‧ 國. 學. 本研究將 260 篇桌椅櫃類產品設計文件中分成 16 群設計概念。分群係以群 內平均相似度大於 0.05 做為門檻以形成設計概念。. ‧. 本研究結果分為 16 群設計概念,分別命名為「特色零件多樣感覺概念」 、 「傳. y. Nat. sit. 統與現代木椅概念」 、 「以系統為主的豪華家具」 、 「波型的時尚概念」 、 「多樣設計. n. al. er. io. 感沙發」 、 「多造型十字腳椅」 、 「仿生化人體工學概念」 、 「親子概念」 、 「舒適躺臥. i n U. v. 概念」 、 「具設計感的室內外用椅」 、 「注重靠背設計概念」 、 「多角度對稱概念」 、 「各. Ch. engchi. 式形狀桌面與沙發概念」、「殼形靠背椅」、「中國傳統」、「強調地點取向的概念」 等概念,需求者可透過需求之設計元素對應出相關設計概念群與設計者進行有效 溝通,更快的了解所想要設計之產品,設計師可以大大縮短在需求階段所消耗的 時間以及力氣。最後本研究亦提出一些未來研究方向。 關鍵字:文字探勘、kNN、設計概念、萃取. III.

(5) 目錄. 第一章 緒論.................................................................................................................. 1 第一節、 研究背景與動機............................................................................ 1 第二章 文獻探討.......................................................................................................... 3 第一節、 設計相關文獻................................................................................ 3 2.1.1. 設計服務業特性............................................................................ 3 2.1.2. 設計概念的發展............................................................................ 4 2.1.3. 設計元素的擷取............................................................................ 5 2.1.4. 輔助設計相關研究........................................................................ 5 第二節、 文字探勘........................................................................................ 7 2.2.1. 文件表示法.................................................................................... 7 2.2.2. 斷詞處理........................................................................................ 8 2.2.3. 檢索模式........................................................................................ 8 第三節、 分群技術...................................................................................... 12 第三章 研究方法與設計............................................................................................ 14 第一節、 研究架構與步驟.......................................................................... 14 第二節、 設計元素萃取.............................................................................. 15 3.2.1. 設計描述文章.............................................................................. 15 3.2.2. 內容擷取...................................................................................... 16 3.2.3. 斷詞處理...................................................................................... 16 3.2.4. 內容過濾...................................................................................... 17 3.2.5. 索引建置...................................................................................... 18 第三節、 設計概念分群.............................................................................. 21 3.3.1. kNN 分群 ..................................................................................... 21 3.3.2. 分群規則...................................................................................... 22 第四章 研究結果........................................................................................................ 24 第一節、 群集結構...................................................................................... 24 第二節、 各階段分群結果.......................................................................... 26 4.2.1. 第一階段分群.............................................................................. 26 4.2.2. 第二階段分群.............................................................................. 27 4.2.3. 第三階段分群.............................................................................. 29 4.2.4. 第四階段分群.............................................................................. 36 4.2.5. 第五階段分群.............................................................................. 46 第五章 結論與未來展望............................................................................................ 52 第一節、 結論與建議.................................................................................. 52. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. IV. i n U. v.

(6) 第二節、 未來展望...................................................................................... 54 參考文獻...................................................................................................................... 55 附錄 A:設計概念英文設計元素表............................................................................. 58. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. V. i n U. v.

(7) 圖目錄. 2-1 文件集向量 ....................................................................................... 7 2-2 布林模式 ......................................................................................... 10 2-3 文件於向量模式表示方式 ............................................................. 10 2-4 kNN 分群模式圖 ............................................................................ 13 3-1 研究架構圖 ..................................................................................... 14 3-2 iF 設計獎線上展覽範例 ................................................................. 16 3-3html 標籤規則範例 .......................................................................... 16 3-4 文件索引示意圖 ............................................................................. 21. 立. 政 治 大. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 圖 圖 圖 圖 圖 圖 圖 圖. Ch. engchi. VI. i n U. v.

(8) 表目錄. 表 3-1 詞性對照表 ...................................................................................... 17 表 4-1 第一階段分群結果 .......................................................................... 26 表 4-2 第二階段分群結果 1 ....................................................................... 27 表 4-3 第 5 群概念分析 .............................................................................. 28 表 4-4 第二階段分群結果 2 ....................................................................... 28 表 4-5 第三階段分群結果 1 ...................................................................... 29 表 4-6 第 11 群概念分析 ........................................................................... 29 表 4-7 第三階段分群結果 2 ...................................................................... 30 表 4-8 第 13 群概念分析 ........................................................................... 31 表 4-9 第三階段分群結果 3 ...................................................................... 31 表 4-10 第 11 群概念分析 ......................................................................... 32 表 4-11 第三階段分群結果 4 .................................................................... 32 表 4-12 第 19 群概念分析 ......................................................................... 33 表 4-13 第一階段分群結果 5 .................................................................... 34 表 4-14 第 24 群概念分析 ......................................................................... 35 表 4-15 第一階段分群結果 6 .................................................................... 35 表 4-16 第一階段分群結果 7 .................................................................... 36 表 4-17 第四階段分群結果 1 .................................................................... 36 表 4-18 第 34 群概念分析 ......................................................................... 37 表 4-19 第四階段分群結果 2 .................................................................... 37 表 4-20 第 37 群概念分析 ......................................................................... 38 表 4-21 第四階段分群結果 3 .................................................................... 39 表 4-22 第 38 群概念分析 ......................................................................... 40 表 4-23 第 39 群概念分析 ......................................................................... 41 表 4-24 第四階段分群結果 4 .................................................................... 42 表 4-25 第四階段分群結果 5 .................................................................... 42 表 4-26 第 47 群概念分析 .......................................................................... 43 表 4-27 第四階段分群結果 6 .................................................................... 43 表 4-28 第四階段分群結果 7 .................................................................... 44 表 4-29 第 58 群概念分析 .......................................................................... 45 表 4-30 第五階段分群結果 1 .................................................................... 46 表 4-31 第 62 群概念分析 .......................................................................... 47 表 4-32 第 64 群概念分析 .......................................................................... 48 表 4-33 第五階段分群結果 2 .................................................................... 48. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. VII. i n U. v.

(9) 表 4-34 第 65 群概念分析 .......................................................................... 49 表 4-35 第五階段分群結果 3 .................................................................... 49 表 4-36 第 66 群概念分析 .......................................................................... 50. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. VIII. i n U. v.

(10) 第一章 緒論. 第一節、. 研究背景與動機. 在當前全球化型態的競爭與挑戰下,利用知識而創造附加價值,提供硬 體與軟體整合性服務,已成為全世界各國發展的重點項目。台灣的製造代工 業在全球製造業擁有重要的地位,但在中國大陸及東南亞國家製造業崛起之. 政 治 大. 時,低廉的勞工及土地,在在危及我國產業競爭力。根據經濟部設計服務業. 立. 發展綱領指出,倘我國能加強設計服務業之發展,在既有產品上加入設計概. ‧ 國. 學. 念,利用美學經濟提高附加價值,將能使我國的產品更具有競爭力。從我國 推動設計產業推動成果來看,2003 年至 2004 年度協助國內企業設計開發 100. ‧. 案,衍生產值效益約新台幣 45 億元。由此可知設計確實能為台灣產業注入. y. Nat. er. io. sit. 新的力量。而如何加強這股力量也成為各家討論的重要議題。 在技術以及顧客需求快速變動的壓力下,企業必須以更短的時間,更低. al. n. v i n 的成本推出品質更好的新產品,而導入設計無非是增加產品生產的時間,除 Ch engchi U 非縮短設計的時間,否則必須在兩者之間做出取捨。. 設計案執行問題點研究中最嚴重之問題點即是設計目標不明確,而客戶 的設計條件與資料提供不足次之,表達出設計概念溝通的重要性(鄧成連, 1999)。而如何運用資訊科技有效傳達顧客產品創新需求,轉換成設計概念輔 助設計流程是相當值得研究的主題。 本研究將針對顧客在提供需求時使用口述或以文字方式表達,而造成設 計師與顧客認知落差問題。如何藉由現有的設計產品分析出設計元素,群聚 成設計概念,再輔以設計需求者根據自己的設計需求對照到相似的設計概念, 1.

(11) 以更加了解設計需求,並利用所要的設計概念與設計師進行溝通,是本研究 所探討的重點。 綜合上述,本研究將以得獎的設計產品做為萃取設計概念的基礎,以期 產品設計描述作為資訊來源,並藉由文字探勘技術,對其資料加以整理分析, 並從中萃取出符合使用者需求之設計概念。 本研究期望達成以下之研究目的: 一、蒐集得獎產品相關描述,透過文字探勘技術分析產品描述中之設計元素,. 政 治 大 二、需求者所需之設計元素對應出相關設計概念群,幫助設計需求者有效傳 立 並將其分群產生多種設計概念。. ‧. ‧ 國. io. sit. y. Nat. n. al. er. 計。. 學. 達需求給設計者,設計者可依設計概念群完成需求者所期望之產品設. Ch. engchi. 2. i n U. v.

(12) 第二章 文獻探討. 第一節、. 設計相關文獻. 2.1.1. 設計服務業特性. Cooper(1997) 提出設計服務產業化的概念,解釋設計即是一種產業,並以 英國為例說明設計本身已發展成產業型態,且主要以市場整合為導向之商品開發。. 政 治 大. 美國工業設計師協會(The Industrial Designers Society of America) 認為,設計是為. 立. 了讓使用者與製造者之間獲得具創造性、最佳化構想與價值的一種專業服務。而. ‧ 國. 學. 根據國際工業設計社團協會(International Council of Societies of Industrial Design) 則認為,設計為一種創造性的活動,主要為建立一個具有多面向特性的對象、流. ‧. 程與服務。. y. Nat. er. io. sit. 張文智、張仲良(1999)指出,設計服務業的主要工作在於提供創新的設計 概念、專業的判斷力與知識,來為客戶解決在產品開發及設計上的各種問題。且. al. n. v i n 在提供服務的同時,客戶必須直接參與、給予意見。在面對不同的客戶與不同的 Ch engchi U 設計需求時,設計師所提供的服務會有所調整,且不同的設計師所提供的服務也 會略有差異,具有高度的可變性。 另一方面,客戶在委託設計前無法事先預估產品的外觀或結果,僅能憑直覺 或經驗來評估設計公司的專業可靠度(張文智、張仲良,1999)。且設計服務業 是經由一連串的設計程序來提供服務,也就是在接受客戶委託設計後,以一系列 的分析、研究、製圖、試驗等工作來完成之 (黃茗富,2004)。並且,在整個服 務流程中,顧客高度參與設計且具相當之重要性,設計師如何引導其意見並與客 戶做有效的溝通,對整個服務流程具極大之影響力,具有「高度顧客互動」的性 3.

(13) 質。 如果能在服務流程之初,顧客能明確了解自己所要需要的設計元素,並能與 設計師溝通明確的設計概念,將對整個設計案的成功與否造成重大的影響,且能 有效減短整個設計時程,讓產品能加快上市時程。因此,如何發展出有用的設計 概念,是當前一個重要議題。 2.1.2. 設計概念的發展. 設計流程會因公司與計畫的不同而有所差異,設計師會產生很多個不同概念,. 政 治 大. 並和工程師合作,依照一系列的評估方式縮減概念範圍。一般性的設計概念發展. 立. 流程由以下數個步驟所形成(Ulrich & Eppinger,1997) 。首先,必須調查顧客需. ‧ 國. 學. 求,需求包括了市場的需求、客戶的需求、技術層面的突破、以及創造需求。再 將需求初步概念化,焦點擺在技術的開發與可行性評估的同時,工業設計師則著. ‧. 重於創造產品形式與利用創意概念來滿足需求或是解決問題。工業設計師為每一. y. Nat. sit. 項概念描繪草圖(Sketch),這是概念發展過程中最快速、經濟、也最能夠將設. n. al. er. io. 計者抽象的想法轉變為具體化的步驟之一。接著,將初步概念提升,將欲繼續發. i n U. v. 展的數個概念,製作草模(Study Model) 。最後,使概念進一步提升與最終概念. Ch. engchi. 選擇,工業設計師通常將草圖與草模轉換成為最終外觀模型(Mock-up)與電腦 模擬外觀圖面(3D Rendering)。外觀模型雖然不具有技術功能,但外觀所給予 的視覺感受以相當接近最終成品。 而設計委託案實際狀況下,由於委託者對於自己的設計需求往往一知半解, 且難以表達,設計師透過委託者的隻字片語來描繪草圖,在概念的發展中往往耗 費相當多的時間。故在設計研究中,對於應用資訊科技輔助設計概念的發展顯得 格外重要。. 4.

(14) 2.1.3. 設計元素的擷取. 設計程序的早期階段,要引導客戶進行腦力激盪以製作特性表,無須考量是 否能達成,也無需考慮特性是否衝突。而其中的產品特性即是客戶期望產品所具 有的特色,也可以說是設計元素;可以想像是形容詞或副詞(Gause & Weinberg, 1989)。而使用辭彙為設計元素研究的多以感性工學為主,探討感性辭彙與產品 的關聯,如馬永川(1998)、張建成(2000)、陳志瑋(2000)、王宗興(2001)等。而在 產品描述文中除了包含感覺字眼外還有描繪產品的造型及材質,在台灣設計波酷. 政 治 大. 網中(http://www.boco.com.tw/)也將屬於台灣的設計元素加以分類,其中造型以及. 立. 材質則是其中重要的分類。. ‧ 國. 學. 本研究中設計元素的擷取則擷取了產品描述文中形容詞以及名詞以代替設 計元素,並在最後分析概念的時候,將設計元素分類為感覺元素、造型元素以及. ‧. 材質元素來最為分析概念的主要依據。. sit. y. Nat. io. er. 2.1.4. 輔助設計相關研究. al. n. v i n 陳兼正(2002)提出了數位化設計環境的可能,且在實際演練中,證明了利用 Ch engchi U. 數位工具在概念產生、視覺化的表現、檢討溝通上能夠建立良好橋梁降低溝通上 的時間成本。鄭宗杰(2003) 以數據的方式來表達設計元素,利用分析電腦機殼. 的各項特徵參數,當作設計元素,以電子商務系統以及形象特徵參數化系統,解 決顧客溝通問題,此法能夠快速幫助原型概念的產生,卻無法真正協助顧客與設 計師發展設計概念;吳志鴻(2002)則自行蒐集文書筆的設計開發為案例訪查相關 業者所得的設計與製造流程資訊,歸納整理出各種設計元素,以虛擬線上的方式, 進行各種設計資料的搜集、分類與整理,進一步建構成網際網路上之簽字筆設計 平台;何昭緯(2006)則是試圖利用品質機能展開法(Quality Function Deployment; 5.

(15) QFD)與感性工學(Kansei Engineering),大量蒐集資料以及市場調查,歸納出 符合檯燈的各種語彙,以當作設計元素,並透過田口方法(Taguchi Method)的 應用將功能需求轉換為感性語彙來進而讓顧客可以用關鍵字來找到所需之功能 需求。以上研究均希望透過資訊系統來輔助概念發展個過程。大體上均從主要設 計產品上的各項數值或市場調查加以計算分析,大多利用電子商務方式以解決遠 距離溝通問題。 在實務上,設計需求者以詞彙文字提供設計需求,或是以問卷方式表達,設 計元素形成時需要花費在調查上相當時力。故本研究試圖更有效找出設計元素進 而形成設計概念之方法。. 立. 政 治 大. 在資訊時代中,人們的生活中充滿著大量的數位資料,大多以文字的方式儲. ‧ 國. 學. 存網頁資料、電子書、資料庫、報告、數位新聞、研究文獻、產品資訊...等。同 樣的在網際網路上也有相當多的設計資訊,如設計產品的描述,這些產品描述文. ‧. 字中含有大量的珍貴資訊,其中包含了設計的理念、設計的方式、產品製造的工. y. Nat. sit. 法、顏色等等相關的設計元素,如果能為了將這些資料萃取出有用的資訊,便可. er. io. 以協助設計概念的發展。. al. n. v i n 資料探勘的相關技術常被用於文字的處理及分析,這種資料探勘技術用來分 Ch engchi U. 析文字資訊就稱為文字探勘(Text Mining)(丁一賢、陳牧言,2005),文字探勘可. 說是資料探勘(Data Mining)的延伸(Fayyad,Simoudis, 1996)。於傳統資料探勘不同 的是,文字探勘所處理的資料通常為半結構化或非結構化等以自然語言撰寫出的 文件。此種技術便可以協助我們從大量的非結構的設計資料中擷取出有用的設計 元素加以應用(Sullivan,2001)。 故本研究將組成產品描述的詞彙,做為設計元素,將大量設計元素分群分析, 萃取出設計概念,加上產品圖片便可提供顧客檢索,讓顧客可以自行建構出符合 需求的多個設計概念,且可運用檢索內容與設計師溝通討論,企圖解決在概念化 6.

(16) 部分需要大量草圖與傳達之問題。. 文字探勘. 第二節、. 根據 Sullivan(2001)定義文字探勘為一種編輯、組織及分析大量文件的方法 和過程,為了可提供特定使用者特定的資訊,以及發現特定資訊的特徵之間的關 聯。文字探勘的技術還包含了不同領域的技術,如資料探勘、資訊檢索、人工智 慧、機器學習、統計…等技術,每個技術都是一個專門的領域,且都有成熟的發 展。而文字探勘是利用這些技術從非結構或半結構化的文字內容中萃取出未知、 隱含的知識。. 立. 2.2.1. 文件表示法. 政 治 大. ‧ 國. 學. 在資訊檢索系統中,文件通常會將文件以最小單位”詞”的集合所組成,因此. ‧. 文件會被做斷字斷詞的處理來得到詞的集合,文件集經訓練後會得到字典檔(所. y. Nat. sit. 有文件集中文字的集合)。而文件通常由向量 d={w1 , w2 ,.., wn }表示,意旨視為特. n. al. er. io. 徵的字詞出現在每篇文件的現象,此種表示法稱為 bag-of-word 或向量空間模型. i n U. v. (Vector Space Medal)。其中wi 表示字典中的字詞在文件中的權重值,其維度為字 典檔字詞的總數 。. Ch. engchi. 文件集可由字詞文件矩陣表示,其中wij 表示字典中第 i 個字詞在第 j 篇文件. 的權重,如圖 2-1 所示:. 圖 2-1 文件集向量 [資料來源: Salton and McGill,1983)] 7.

(17) 2.2.2. 斷詞處理. 英文的斷詞的工作相較於中文斷詞並沒有那麼複雜。由於英文的詞與詞之間 是接存在著空白字源,因此英文文件只需要透過空格符號分隔就能將每個單字斷 開(Nei,1996)。但還是會發生兩種狀況,第一是大部份的文件格式中,標點符號 會緊接在詞之後,無空白間隔;第二則是縮寫詞的狀況,常見的縮寫詞如 “I” 與 “am” 縮寫成 “I’m”,“is” 與 “not” 縮寫成 “isn’t”。因此斷詞的工作必須將標點 符號與其所鄰接的詞分離,並將縮詞拆開。例如句子 “The stock didn’t rise $5.”. 政 治 大. 經斷詞後成為 “The stock did n’t rise $5 .” (王俊弘,2003)。. 立. 而莊怡軒(2011)在研究英文技術文獻中提到,英文文件會遇到的問題,技術. ‧ 國. 學. 名詞與一般詞彙性質不同,不同專業領域有不同的技術名詞,而技術名詞通常含 有知識性及專業知識;非專業領域、不熟悉技術名詞用法的人,如果要認知技術. ‧. 名詞的涵義有其困難性。例如,「adaptation level theory(適應水準理論)」這三個. y. Nat. sit. 英文詞彙,如果閱讀者具有相關的專業背景,就不會把三個詞彙拆開來閱讀。解. n. al. er. io. 決的方法則是建立技術名詞表將專利文句中的技術名詞斷詞。相對設計產品的描. i n U. v. 述文章中也包含了一些製程技術技術名詞,也是必須考量或著迴避的。. Ch. engchi. 2.2.3. 檢索模式. 為了檢索與使用者資訊需求相關的文件,資訊檢索系統需要某些方法來表示 (Represent)文件、資訊需求及它們之間的關係,依照此表示方法,可以設計一排 序演算法(Ranking Algorithm)產生所檢索結果,以決定任一文件與資訊需求是否 相關;不同的表示方法產生不同的資訊檢索模型,而不同的資訊檢索模型有不同 的預測模式,以決定哪些文件相關及哪些文件不相關。至目前為止,過去相關文 獻已提出許多種資訊檢索模型,其中布林模型(Boolean Model)及向量空間模型 8.

(18) (Vector Space Model)為最基本的兩種模型。此兩種模型皆視每一文件由一組索引 詞彙所組成,索引詞彙可用以索引及摘要(Summarize)該文件的內容,就描述文 件內容的功能而言,並非每一索引詞彙都具有相同的重要性,例如,如果一索引 詞出現在每一個文件中,則其變成相對地不重要,因為當使用者以該索引詞查詢 所有文件時,檢索系統無法有效分辨哪一個文件較相關,因此,不同的索引詞應 該有不同的權重(Weight)以表示其在檢索上重要性。依序介紹布林及向量空間模 型如下: (一)布林模式. 政 治 大. 布林模式是 Heap(1978)所提出,是資訊擷取的模式中最簡單的,主要是以集. 立. 合理論(set theory)和布林代數(Boolean algebra)為基礎,布林模式是相當直覺的概. ‧ 國. 學. 念,通常能透過一些關鍵詞與邏輯運算元(Logical operators)所組成的交集、聯集 布林語句,來表示使用者想檢所的資訊需求。此模式中只示檢索文字是否存在於. ‧. 同一文件,索引字權重以 0 和 1 表示,若其值為 1 表示此字詞存在於文件中,反. y. Nat. sit. 之則表示字詞不存在於文件中。因此一個布林表示式的查詢能以分離標準形式. n. al. er. io. (DNF)來呈現。以圖 2-3 為例,一查詢 q= k a ∩ ( k b ∪ ¬ k c ),其 DNF 為q dnf =(1,1,1) ∩. i n U. v. (1,1,0) ∩ (1,0,0),每個元素都是與(k a , k b , k c 有關的二元權重向量,若有一文件dj. Ch. engchi. 其 DNF 為 df=(0,1,0),表示文件含有字詞k b ,但對於 q= k a ∩ ( k b ∪ ¬ k c )查詢式. 來說,dj 會被視為不相關的文件。. 9.

(19) 圖 2-2 布林模式. 政 治 大. [資料來源:吳恩典,2007]. 立. 布林模式的缺點是使用非 0 則 1 的二分法表示文件,只關心字詞是否有出現. ‧ 國. 學. 於文件中,因此只能區分文件是否相關,字詞於文件中出現的頻率並不會影響文. ‧. 件與查詢的相關程度,因此結果較不準確。. n. al. er. io. sit. y. Nat. (二)向量模式. Ch. engchi. i n U. v. 圖 2-3 文件於向量模式表示方式 [資料來源:Salton,1975]. 向量模式(Salton and Lesk,1968)彌補了布林模式中二元權重的不足而發展, 且能做到布林模式所無法做到的部分比對。向量模式中索引的字詞並非以二元方 10.

(20) 式表示,且被用來計算使用者查詢系統每篇文件的相似度,計算後以相似度對文 件做排序,則表示文章和使用者查詢的相關程度,即使文件只有部分符合使用者 查詢,還是會有相似度的值,因此和布林模式相較之下所能擷取的文件集有更大 的彈性。 一篇文件可以文件向量表示,dj =(w1j , w3j , w3j ,…, wtj ),其中wij 為字詞k i 於. 文件dj 中的權重,而查詢可表示為q=(w1q , w2q , w3q ,…, wtq ),同樣wi 為字詞k i 於 查詢 q 中的權重值,t 則表示系統中索引字詞的總數量。因此每一篇文件dj 及使 用者查詢 q 皆會以 t 維向量表示. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 11. i n U. v.

(21) 第三節、. 分群技術. 分群不像分類需要利用已知的資料訓練並指定類別,而是分群是利用文件的 特徵互相比較其相似性,將相似性較高的文件群聚起來,目標是使得群集內每個 文件彼此擁有極高的相似度。事先也並不知道分出來的群集數,屬於非監督式 (Unsupervised Learning)學習。 Jiawei Han and Micheline Kamber(2006)將分群法依其性質分成五大類,分別 是:分隔式分群(Partitioned)、階層式分群(Hierarchical)、密度基礎分群. 政 治 大. (Density-based)、網格式分群(Grid-based)與類神經網路分群(Neural network),其. 立. 中又以分割式演算法中的 k-means 最廣為人知。k-mean 由 J. B. MacQueen 於. ‧ 國. 學. 1967 年所提出,分群前必須先設定群集數量 K,利用反覆式的計算叢集重心來 使各群集重心趨於穩定。但 k-means 缺點在於重心的概念容易受到資料的離散. ‧. 程度影響,且事先設定的群集數量亦未必正確,若資料量龐大易造成整體效率低. y. Nat. sit. 落。然而在分類演算法中 k-最鄰近演算法(k-Nearest Neighbor)在實作上可以不用. n. al. er. io. 事先設定類別,在類別未知的情況下與給予訓練資料,即可視為分群的運用,如. i n U. v. Yang et al.(1999)利用 kNN 於「類別數未知」的新聞事件的偵測追蹤。. Ch. engchi. k-最鄰近演算法(k-Nearest Neighbor)是在 1967 年由學者 T.M. Cover 與 P.E. Hart 所提出的,與其他分群方法比較之下,建置容易、有高學習速度、分群效果 佳且是最直覺簡單的分群演算法之一(Witten & Frank,2000)。kNN 在分群時必須 將所有文件資料轉換成向量空間的數值,再轉換成向量空間模型,再藉由計算新 進文件與其他已分群文件間的相似度,即為向量距離,擷取出與新進文件最相似 的 k 篇已分群文件來判斷新進文件的所屬群集。概念如下,當有新的向量文件進 來後,將會與向量空間內所有文件計算距離,擷取 k 篇最相似文件,將擷取出的 k 篇文件中相同群集內的所有文件與新進文件的相似度加總並除以文件個數,數 12.

(22) 值最高的群集代表與新進文件相似度最高,則將新進文件加入此類別。以圖 2-4 為例,若要判斷新進文件「New」為已分群樣本 Class A 及 Class B,設訓練資料 之屬性為向量空間中的維度,用 kNN 可擷取出與新進文件最相似的 k 篇文件。 也就是圖中最接近 New 的五篇文件而 k 就等於 5,從所擷取出的 5 個以分群文 件中,來判定目標案例到底該視作 Class A 或 Class B。如果 A 與 New 的相似程 度大於 B 的話,那麼我們即可認定新進文件 New 所屬的群集為 Class A。 A2. 立. New. 政 治 大. Class A Class B. ‧ 國. 學. A1. ‧. 圖 2-4 kNN 分群模式圖 [資料來源:本研究整理 ]. y. Nat. sit. 一般而言,KNN 透過大量訓練所產生的向量空間之分群效果不會較其他的. n. al. er. io. 分群方法來的差,但由於需要計算訓練集和測試集所有距離,故在變數樣本很大 時需耗費相當多的時間。. Ch. engchi. 13. i n U. v.

(23) 第三章 研究方法與設計 產品描述的用途即是幫助使用者了解產品的設計概念,因此本研究將蒐集國 際設計獎項之產品描述,設法找出同類產品並從中萃取出設計概念,需求者利用 關鍵字搜尋需求,幫助需求者快速傳達設計概念。 第一節、. 研究架構與步驟. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-1 研究架構圖 [資料來源:本研究整理 ] 圖 3-1 為本研究之研究架構圖,各步驟之過程詳述如下: 14.

(24) 第二節、. 設計元素萃取. 3.2.1. 設計描述文章. 為了取得完整的產品描述,而非一般對於設計產品的評論,故以四大國際設 計獎項為目標,其中有著 50 多年悠久歷史的 iF 設計獎以及 Red Dot 獎是以工 業設計為評選標的而舉辦的國際獎項。iF 設計獎每年定期由德國漢諾威工業設 計論壇舉辦,是全球公認最有影響力的設計大獎之一,以振興工業設計為目的,. 政 治 大 歐洲最具聲望的德國設計協會 立 Design Zentrum Nordrhein Westfalen 所設立。兩個 提倡設計理念的創新,有「工業設計界的奧斯卡獎」之稱,而 Red Dot 獎是由. ‧ 國. 學. 獎項入圍的設計產品都必須有產品的設計理念及設計概念,且在官方網站以線上 展覽的方式可供一般民眾瀏覽得獎的設計作品,故非常適合本研究擷取。. ‧. iF 設計獎線上展覽範例. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 產品名 產品分. 產品圖. 15.

(25) 產品名稱:Café Chair. 產品分類: Chair. 產品描述: The Café Chair is a modern translation of the traditional café chair. This fully wooden chair has a removable, 3D-knitted and semi-transparent back cover that gives the seat a highly individual character while offering exceptional comfort. Café chair 是現代版的傳統咖啡椅,可移動式全木製的椅子,3D 針織技術與半 透明的靠背,讓這張椅子同時具備了高度的舒適以及個性。 圖 3-2 iF 設計獎線上展覽範例 [資料來源: iF 官方網站] 3.2.2. 內容擷取. 立. 政 治 大. 由資料下載模組所擷取之產品描述檔案皆為 html 格式,因此必須分析其標. ‧ 國. 學. 籤內容及規則如圖,已從擷取出我們所真正需要的產品描述文以及產品圖片,依 照線上展覽的網頁格式,透過解析其中內文標籤的內容即可從中擷取出文章及圖. ‧. 片,供後續步驟使用。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-3html 標籤規則範例 [資料來源: iF 官方網站] 最後總共從 iF 擷取了 103 項產品描述,Red Dot 擷取 157 項產品描述,並擷 取產品圖片,提供接下來的處理。 3.2.3. 斷詞處理. 由於本研究處理之產品描述為英文文章,在英文的斷詞的工作相較於中文斷 詞容易許多。由於英文的詞與詞之間是皆存在著空白字源,因此英文文件只需要 16.

(26) 透過空格符號分隔就能將每個單字斷開。為了縮短開發時間則使用自指語言處理 套件 Apache OpenNLP(http://opennlp.sourceforge.net),OpenNLP 是一個開放原始 碼的自然語言處理機構。此機構的主要角色是促進此領域的發展,並且幫助自然 語言處理的研究人員更為容易的開發相關套件,是一個基於機器學習的自然語言 文本處理的開發工具套件。它提供了許多不同的自然語言處理工具,像是句子切 割(sentence detection)、分詞(tokenization)、詞類標記(part-of-speech tagging)、文 法剖析(parsing)、專有名詞辨認(named-entity detection)與指稱詞解析(coreference finder)。工具間可以相互使用,因此不需要花額外時間在電腦程式中轉換資料型. 政 治 大 工作會出現的常見問題加以解決,如句子 “The stock didn’t rise $5.” 經斷詞後成 立 態,而我們主要利用分詞(tokenization)工具模組,此工具模組可以針對英文斷詞. 為 “The stock did n’t rise $5 .”,進一步協助斷詞處理。. ‧ 國. 學. 3.2.4. 內容過濾. ‧ sit. y. Nat. 利用自然語言處理套件 OpenNLP 來標注詞姓,可以篩選掉大部分不重要的. al. er. io. 介係詞和代名詞,只留取名詞、動詞以及形容詞加以使用可以避免之後過大的特. n. 徵詞庫,也利於之後在於相似度分群時不被雜訊干擾。. C表h3-1 詞性對照表 U n i engchi. CC - Coordinating conjunction. v. PDT - Predeterminer. CD - Cardinal number DT - Determiner. POS - Possessive ending. EX - Existential there. PRP - Personal pronoun. FW - Foreign word PRP$ - Possessive pronoun (prolog. IN - Preposition or subordinating conjunction. version PRP-S). JJ - Adjective. RB - Adverb. JJR - Adjective, comparative JJS - Adjective, superlative. RBR - Adverb, comparative. LS - List item marker. RBS - Adverb, superlative. MD - Modal 17.

(27) NN - Noun, singular or mass. RP - Particle. NNS - Noun, plural. SYM - Symbol. NNP - Proper noun, singular NNPS - Proper noun, plural. TO - to. VB - Verb, base form. UH - Interjection. VBD - Verb, past tense WDT - Wh-determiner. VBG - Verb, gerund or present. WP - Wh-pronoun. participle VBN - Verb, past participle. WP$ - Possessive wh-pronoun (prolog. VBP - Verb, non-3rd person singular version WP-S). present. WRB - Wh-adverb 政 治 大. VBZ - Verb, 3rd person singular present. (資料來源:本研究自行整理). 立. ‧ 國. 學. 另外尚有一些技術名詞與一般詞彙性質不同,不同專業領域有不同的技術名 詞,而技術名詞通常含有知識性及專業知識;非專業領域、不熟悉技術名詞用法. ‧. 的人,如果要認知技術名詞的涵義有其困難性(莊怡軒,2011)。例如, 「adaptation. sit. y. Nat. level theory(適應水準理論)」這三個英文詞彙,如果閱讀者具有相關的專業背景,. n. al. er. io. 就不會把三個詞彙拆開來閱讀。解決的方法則是建立技術名詞表。設計產品的描. v. 述文章中也包含了一些製程技術技術名詞,也是必須考量或著迴避的。故在斷詞. Ch. engchi. i n U. 處理後應用停用字表及技術製程表與字詞對應過濾,以減少後續處理及分析的負 載。 3.2.5. 索引建置. 在經過斷詞處理後,為了方便日後概念的萃取,產品文件會被以字詞的向量 d={w1 , w2 ,.., wn }表示,意旨視為特徵的字詞出現在每篇文件的現象,此種表示. 法稱為 bag-of-word 或向量空間模型(Vector Space Medal)。其中wi 表示字典中的. 字詞在文件中的權重值,其維度為字典檔字詞的總數 。. 18.

(28) 透過向量模式(Salton and Lesk,1968)表示之文件其中字詞的權重可以利用 TF-IDF (term frequency and inverse document frequency)來代表,其中 tf 視為單一 文件內部的分布特性,可以用來描述一篇文件對定義之索引項目的包含程度,也 就是字詞在文件中出現的頻率 tf(i, j) = ∑t. wi,j. k=1 wik. .......................................................................... (公式 1). 式 tf(i,j)即字詞 j 在第 i 篇文章所出現的頻率;而 idf 則視為全域資料的分布 特性,用來測量在所有文件中,不同索引項目的重要程度,亦可將此值視為鑑別 性的參考依據。 N. 政 治 大. idf = log � n � ............................................................................ (公式 2). 立. j. ‧ 國. 學. 其中 N 為資料庫中的文件總數,nj 則為包含索引項目wj 的文件數目,由上式. 可以看出當一字詞所出現的文件數量越多,idf 的值會越小,表示此索引字詞的. ‧. 鑑別性很低;反之若 idf 數值越大,表示此索引字詞只出現在少數文件中,因此. sit. y. Nat. 鑑別性較高。而在向量空間模型式中常見的權重計算法則如下:. n. al. er. io. wij = tf(i, j) x idf(j) .................................................................... (公式 3). i n U. v. 透過 TF-IDF 公式所求得之值當作每個詞彙的權重,藉由權重的高低來篩選. Ch. engchi. 出足以代表該文件的關鍵資訊。由於每一個詞彙都算是文件的特徵,因此,選擇 愈多的詞彙當作關鍵資訊,則這些關鍵資訊就愈能代表文件本身,如有 100 篇文 章,其中若字詞『的』出現於所有文章中,表示字詞『的』在文件集中是無鑑別 力的通用字,其 idf 為 0,就算字詞『是』在文件i中出現次數很高,但 tf*idf 後則結果為 0;若字詞『華麗』只出現在1份文件中,其 idf 為 log(100),若詞『華 麗』在文件i中出現次出很高,其 tfidf 權重值也會很大,因此可以判斷此文件 與『華麗』有很高的相關性。本研究將透過「設定權重門檻值」的方式,來擷取 高於門檻值的詞彙以作為關鍵資訊。. 19.

(29) 文件經過 SVM 表示之後,將以倒轉檔索引法建置產品描述文件索引。倒轉 檔索引方法是一種基本且廣泛應用於資訊檢索系統的索引方式,其主要目的是提 供快速的檢索以改善使用者建所資料的速度。倒轉檔主要架構包含文件表 (Documents file)、詞典表(Dictionary)以及倒轉字串表(Inversion list or posting files) 三個資料表(Kowalski,2007) 。文件表主要是記錄每筆文件的關鍵字詞;詞典表 是紀錄經排序後的關鍵字詞,並紀錄其出現的文件總數(DF)及字詞編號(Term ID), 而倒轉字串表則是記錄所有文件的關鍵字詞並關聯至包含其字詞的文件編號。當 使用者以關鍵字詞檢索文件時會由詞典檔找出關鍵字所對應的字詞編號(Term. 政 治 大. ID),接著會透過字詞編號(Term ID)關聯至倒轉字串表找出字詞所出現的所有文 件。. 立. ‧ 國. 學. 研究對於產品描述文件之索引建置步驟如下,其示意圖如圖 3-2 所示: 每篇產品描述文件給予一個唯一編號(Doc ID)。. 2.. 對於斷詞後文件的每個字詞做拜訪,若遇到停用字詞則將此字詞移除。. 3.. 若字詞在索引過的文件中未曾出現過,則在詞庫中加入此字詞,並將字. ‧. 1.. n. 4.. Ch. engchi. er. io. sit. y. Nat. al. 詞關聯至文件,並將 DF 設為 1。. i n U. v. 若字詞於已存在於詞庫之中,則直接將字詞語文件做關聯並將此字詞的 DF 加 1。. 20.

(30) 圖 3-4 文件索引示意圖 [資料來源:吳振和,2011]. 設計概念分群. 第三節、. 立. 政 治 大. ‧ 國. 學. 本研究由於資料的型態,即簡單直覺的需求採取 kNN( K-最鄰近演算法)演. 與未知類別之文件的相似度來將其分群出多種設計概念。. er. io. sit. y. Nat. 3.3.1. kNN 分群. ‧. 算法利用文字探勘挖掘出來的設計元素當作特徵值,進行產品描述的分群,計算. al. n. v i n Ch 本研究由於資料的型態,即簡單直覺的需求採取 e n g c h i U kNN( K-最鄰近演算法)演 算法進行產品描述的分群,計算與已知類別之文件的相似度來判斷未知類別文件 的可能類別。 分群的步驟如下 1.. 將產品描述文章轉換為向量表示。. 2.. 將新進產品描述文章與以產品描述文章集合內之所有文章進行相似度. 的計算,比對門檻值取出前 k 份最相似的產品描述文章。 3.. 將這 k 份產品描述文所屬的所有類別皆列為新進產品描述文的候選 21.

(31) 群。 4.. 將這 k 份產品描述文與新產品描述文進行相似度計算,以將新產品描述. 文歸屬於相似度最高之類別。 而文件的相似度則採用 cosine 相似度來加以計算。. d ∗q. cos�q , dj � = �d �j∗|q| = j. ∑n i=1 dj ×q. n 2 2 �∑n i=1(dj ) ×�∑i=1(q). ........................…………….(公式 4). 其中|dj |和|q j |為文件及查詢向量的長度,|dj |在文件空間中提供了正規化的作用。. 政 治 大. 經由分群過後的產品推薦文章群集,觀察各群集內所組成之詞彙,利用字詞. 立. 權重調整及出現在該群集文章數,判斷字詞重要性,並加以分析該群集字詞之共. ‧ 國. 學. 通性,給定代表群集之概念名稱。. ‧. 產生多組概念後,則可以依照使用者需求,利用倒轉檔索引及布林檢索模式 做檢索,將欲查詢之多個設計需求作為查詢字串,對文件資料庫做檢索,以查詢. y. Nat. io. sit. 字串檢索出該群集內所代表概念之字詞,或檢索多個群集所代表之概念字詞組合. n. al. er. 成符合顧客需求之設計概念。 3.3.2. 分群規則. Ch. engchi. i n U. v. 進行 kNN 分群時,為了得到較佳的分群效果,會以階段的方式向下分群, 本研究則是以平均群內相似度來判斷是否繼續向下分群。如果個群別都已達到指 定之平均群內相似度,則表示以達到足夠相似進行概念分析 平均群內相似度是將每一群集內的文件,兩兩比較後將相似度加總除以比較 次數以獲得各群之群內相似度。 為了比較與父群別相似度的差異,利用加權概念,將各群計算完成之群內相 似度乘上各群所含之文件數佔所有文件數的比例,即可獲得加權平均群內相似 22.

(32) 度。 平均群內相似度 = ∑Ck. ∑d ∈C ∑d ∈C sim(di ,dj ) i k j k 1 Nk ∗(Nk −1)∗ 2. ∗. Nk N. ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯(公式 5). 其中,N為文件總數;Nk 為第Ck 群之文件數量;sim(di , dj )則是Ck 群內某兩. 篇文件之相似度。將每次分群的加權平均群內相似度與其父群別比較計算出成長 率((加權平均群內相似度-父群別群內相似度)/ 父群別群內相似度)來確定每次分 群具有效果。. 另外再進行分群時可能會造成某一群內只含有一篇產品描述,此種情況有可. 政 治 大 無法提升。面對這樣的情況有兩種處理方式,第一,利用質心計算,將只含一篇 立 能是因為門檻值的過度調整產生或著是較特別的產品描述文使得群內相似度的. 描述的群集合併最相似的群集。. ‧ 國. 學. 質心計算(吳文峰,2002)公式為:. ‧. y. 𝑖. Nat. 1 ���⃗ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯(公式 6) ���⃗ 𝐶i = 𝑛 ∑𝑑∈𝐶𝑖 𝑑. sit. io. ��⃗ 其中,𝑑���⃗為文件向量,���⃗ 𝑑 = (𝑑 (1) , 𝑑 (2) , … , 𝑑 ��d �� ),𝑑 (𝑗) 表示第 j 個詞彙在文件 d 中. n. al. er. 的權重,�𝑑���⃗�則為文章長度;ni 為群集Ci 中的文件數。算出質心後各別計算與一篇. Ch. 一群的群集距離,合併最近似的群集。. engchi. i n U. v. 第二,如果經過合併後,調整門檻值還是無法提高分群效果,則捨棄一篇一 群的群集,藉以提高各群別的群內相似度。. 23.

(33) 第四章 研究結果. 第一節、. 群集結構. 為找出合適的群集以代表設計概念,並依照制定的分群規則逐步分群,接著 在將概念中包含之辭彙當作設計元素並加以分類,幫助觀察概念內涵,加以分析 訂定概念名稱。. 政 治 大 結果,故所有分群皆採用 k=15 進行分群動作,再來為了得到第一次分群門檻值, 立 首先,藉由多次測試 k 值找出各階段分群合適之 k 值,但並無明顯影響分群. 計算未分群之 260 篇產品描述文章相似度得到 0.019958,將其四捨五入到小數第. ‧ 國. 學. 三位當作第一次分群門檻值 0.02,並逐步提升 0.01 來進行階段性的分群;當每. ‧. 一群集群內相似度皆大於 0.05 時,則停止階段分群。. n. er. io. sit. y. Nat. al. Ch. engchi. 24. i n U. v.

(34) 由第 0 群 260 篇產品描述經過第一次分群後,總分群結構如下圖:. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-1 總分群結構圖 (群別編號|群內篇數 ). 25.

(35) 各階段分群結果. 第二節、. 4.2.1. 第一階段分群 表 4-1 第一階段分群結果 父群別. 群別. 0. 篇數. 組內相似度. 1. 140. 0.02201. 2. 120. 0.02112. 加權平均相似度. 0.021599. 8.22% 政 治 大 第一階段分群結果如表 4-1,組內相似度由 0.019958 提升至 0.021599、成長 立 成長率. ‧. ‧ 國. 學. 8.22%,但分群後未達概念分析標準,繼續進行第二階段分群。. n. er. io. sit. y. Nat. al. Ch. engchi. 26. i n U. v.

(36) 4.2.2. 第二階段分群 表 4-2 第二階段分群結果 1 父群別. 群別. 1. 篇數. 組內相似度. 3. 63. 0.03123. 4. 13. 0.04351. 5. 5. 0.05859. 6. 6. 0.04441. 7. 28. 0.03694. 8. 25. 加權平均相似度 成長率. 立. 0.0299 治 政 0.034818 大 58.17%. ‧ 國. 學. 第二階段中由父群別 1 向下分群結果 1 如表 4-2,在門檻值提升至 0.05 的情. ‧. 況下,組內相似度由 0.02201 提升至 0.034818、成長 58.17%;群別 6、7、8 未達 概念分析標準,繼續進行下階段分群;群別 5 則符合概念分析規則,其概念分析. n. al. er. io. sit. y. Nat. 如下:. Ch. engchi. 27. i n U. v.

(37) 表 4-3 第 5 群概念分析 第5群. 設計元素. 概念名稱:. 特色零件多樣感覺概念. 感覺元素. 視覺的(0.1478),數位的(0.1326),微妙 的(0.0908),純的(0.0908),笨重的 (0.0663),全方位的(0.0663),快節奏 (0.0663),無憂無慮的(0.0663),光 (0.0663),線性的(0.0663),引人入勝的 (0.0663),古代的(0.0663). 造型元素. 格子(0.1492),物件(0.1362),部分 (0.1326),增援(0.1326),紡織(0.1117), 注射(0.0995) ,結構(0.0908) ,片(0.0844), 形式(0.0829) ,雙(0.0908) ,長的(0.0663),. 材質. 政 治 大. 其他參考元 莫爾(0.1989),效果(0.2356),技術 (0.0785),挑戰(0.1117),知覺(0.1117), 素 觀賞(0.0663),需要(0.0908). 立. ,. ,. ,. ‧. ‧ 國. 學. 產品 圖片. ,. ,. y. Nat. io. sit. 見表 4-3 觀察整體設計元素,造型元素中出現物件、部分、片等等元素,且. n. al. er. 在感覺元素中給人多種感覺,故推斷此概念內之產品,皆強調產品的部分零件的. Ch. i n U. v. 特別。如格子的椅面或仿古的設計等,故以特色零件多樣感覺為此概念名稱。. engchi. 表 4-4 第二階段分群結果 2 父群別. 群別. 2. 篇數 9. 83. 0.02263. 10. 37. 0.02437. 加權平均相似度 成長率. 組內相似度. 0.023167 9.72%. 第二階段中由父群別 2 繼續向下分群的分群結果 1 如表 4-4,在門檻值提升 至 0.04 的情況下,組內相似度由 0.02112 提升至 0.02437、成長 9.72%。但分群 後群別 9、10 未達概念分析標準,繼續進行第三階段分群。. 28.

(38) 4.2.3. 第三階段分群. 表 4-5 第三階段分群結果 1 父群別. 群別 3. 篇數. 組內相似度. 11. 6. 0.11788. 12. 57. 0.03287. 加權平均相似度. 0.040962. 成長率. 31.15%. 第三階段中由父群別 3 向下分群結果 1 如表 4-5,在門檻值提升至 0.06 的情. 政 治 大. 況下,組內相似度由 0.03123 提升至 0.040962、成長 31.15%;群別 12 未達概念. 立. 分析標準,繼續進行下階段分群;群別 11 則符合概念分析規則,其概念分析如. ‧ 國. 學 表 4-6 第 11 群概念分析. ‧. 第 11 群 概念名稱:. 傳統與現代木椅概念. 造型元素. 手工雕刻(0.1331),腿(0.1576),伸臂 (0.1331),面板(0.1331),酒吧(0.1121) 靠背(0.0984),座椅(0.0906). n 材質. sit. io. 設計元素. al. y. 現代(0.1021),聰明(0.0998),傳統 (0.0998),具體(0.0911). Nat. 感覺元素. er. 下:. Ch. engchi. i n U. v. 銑(0.1331),集成材(0.1331),核桃 (0.0998),木材(0.0911). 其他參考元 模塑(0.3326),結構(0.1366),輪廓 素 (0.1331),技術(0.1996),半徑(0.1121), 範圍(0.0847) ,製作(0.1331) ,感覺(0.0998) 產品 圖片 ,. ,. ,. ,. ,. 見表 4-6 觀察整體設計元素,材質元素主要為木材,並提到手工雕刻為木作 椅較獨有製作方式;感覺元素中提到了傳統及現代兩種感覺,說明概念內包含兩 29.

(39) 種元素之產品,故以傳統與現代的木椅代表這個概念。 表 4-7 第三階段分群結果 2 父群別. 群別. 4. 篇數. 13. 組內相似度 8. 0.06412. out 5 加權平均相似度. 0.064124. 成長率. 47.38%. 第三階段中由父群別 4 向下分群結果 2 如表 4-7,在門檻值提升至 0.08 的情 況下,組內相似度由 0.04351 提升至 0.064124、成長 47.38%;去除了 5 篇一篇為. 政 治 大. 一群的群別提升分群效果;群別 13 符合概念分析規則,其概念分析如下:. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 30. i n U. v.

(40) 表 4-8 第 13 群概念分析 第 13 群 概念名稱:. 以系統為主的豪華家具 明顯的,(0.1227),勻稱(0.1195),豪華 (0.1195),自然(0.0746),不同(0.0708), 基本(0.0707). 造型元素. 核心(0.2044),系統(0.1604),棍子 (0.1195),站立(0.1195),奢華(0.1195), 結構(0.1195) ,標記(0.1195) ,心(0.1006), 家具(0.0927),格子(0.0896),強度 (0.0896),部分(0.0882),桌(0.0853), 模組化(0.1635). 設計元素. 感覺元素. 治 政 大 ,木(0.1022), 銀(0.1792),塗層(0.1195). 材質. 立 纖維(0.1006),金屬(0.0853),彈簧(0.1006),. io. n. al. ,. ,. ,. ,. ,. er. ,. y. Nat. ,. sit. 產品 圖片. ‧. ‧ 國. 學. 其他參考元 元素(0.1774),方法(0.1006),材料 素 (0.0827),邏輯(0.0896). Ch. engchi. i n U. v. 見表 4-8 觀察整體設計元素,有桌、椅、櫃、系統會議桌且有多樣的材質組 合是系統的概念,而豪華的感覺權重較高,代表概念感覺,故以系統為主個豪華 家具為概念名稱。 表 4-9 第三階段分群結果 3 父群別. 群別. 6. 14. out 1 加權平均相似度 成長率. 篇數. 組內相似度 5. 0.05153 0.051529 16.02% 31.

(41) 第三階段中由父群別 6 向下分群結果 3 如表 4-9,在門檻值提升至 0.08 的情 況下,組內相似度由 0.04441 提升至 0.051529、成長 16.02%;去除了 1 篇一篇為 一群的群別提升分群效果;群別 14 符合概念分析規則,其概念分析如下: 表 4-10 第 11 群概念分析 第 14 群 概念名稱:. 波型的時尚概念. 設計元素. 感覺元素. 嚴格的(0.1353),新的(0.0908),公眾 (0.0895),時尚(0.0803),主題(0.0803), 非洲(0.0803),人際關係(0.0803),明顯 (0.0803),溝通(0.0803),可用的(0.0777). 造型元素. 波浪(0.3214),海(0.241),部件(0.1428), 行(0.1353) ,坐墊(0.1343) ,四足的(0.11), 黑檀色的(0.0803). 政 治 大. 立 金屬(0.1147),木材(0.11),單板(0.1353),. 材質. ,. ,. y. Nat. ,. ,. io. sit. 產品 圖片. ‧. ‧ 國. 學. 其他參考元 版本(0.1528) 素. n. al. er. 見表 4-10 觀察整體設計元素,造型元素中波浪、海代表了此概念造型主要. Ch. i n U. v. 的依據,黑檀色及獨特的造型為時尚的符號,故將此概念命名為波型的時尚概 念。. engchi. 表 4-11 第三階段分群結果 4 父群別. 群別. 7. 篇數. 組內相似度. 15. 2. 0.11142. 16. 2. 0.76654. 17. 2. 0.52385. 18. 2. 0.0967. 19. 17. 0.05348. 20 加權平均相似度. 3. 0.24791. 成長率. 0.166065 349.58% 32.

(42) 第三階段中由父群別 7 向下分群結果 4 如表 4-11,在門檻值提升至 0.08 的 情況下,組內相似度由 0.03694 提升至 0.166065、成長 349.58%;群別 15、16、 17、18、20 未達概念分析標準,且篇數已經小於五篇沒有繼續分群下去的必要; 群別 19 則符合概念分析規則,其概念分析如下: 表 4-12 第 19 群概念分析 第 19 群 概念名稱:. 多樣設計感沙發 柔軟(0.1041),通用(0.0839),華麗 (0.0761),現代(0.0694),休閒(0.0508), 緊湊型(0.0508),重的(0.0452),優雅 (0.0714),生活(0.0635). 造型元素. 沙發(0.6044) ,組合(0.1269)房間(0.1148) , 設計師(0.113),內飾(0.0925),彈力 (0.0904) ,品種(0.0717) ,覆蓋(0.0717) ,, 泡沫(0.0714),楞角(0.0678),時代 (0.0603),半球(0.0603),靠墊(0.0573), 陪審團(0.0573),座位(0.0563),家具 (0.0545),. 立. 政 治 大. ‧. ‧ 國. 學. 織物(0.089). Nat. 材質. y. 設計元素. 感覺元素. sit. al. n. 產品 圖片. er. io. 其他參考元 應有的(0.0524),可用的(0.0437),效果 素 (0.0535),各種(0.0904),. Ch. engchi. i n U. v. ,. ,. ,. ,. ,. ,. ,. ,. ,. ,. ,. ,. ,. ,. ,. ,. 見表 4-12 觀察整體設計元素,造型元素中不管是組合、彈力、泡沫、靠墊 為此概念中的一些設計重點,而主要皆是設計沙發為主,故有別於一般的沙發, 33.

(43) 稱此概念為多樣設計感的沙發概念。 表 4-13 第一階段分群結果 5 父群別. 群別. 8. 篇數. 組內相似度. 21. 2. 0.67253. 22. 2. 0.09237. 23. 3. 0.08171. 24. 5. 0.10261. 25 加權平均相似度. 13. 0.03393 0.10916. 成長率. 265.03%. 政 治 大 情況下,組內相似度由 0.0299 提升至 0.10916、成長 265.03%;群別 21、22、23 立 第三階段中由父群別 8 向下分群結果 5 如表 4-13,在門檻值提升至 0.07 的. ‧ 國. 學. 未達概念分析標準,且篇數已經小於五篇沒有繼續分群下去的必要;群別 25 未 達概念分析標準,繼續向下分群;群別 24 則符合概念分析規則,其概念分析如. ‧. io. sit. y. Nat. n. al. er. 下:. Ch. engchi. 34. i n U. v.

(44) 表 4-14 第 24 群概念分析 第 24 群 概念名稱:. 多造型十字腳椅 私人(0.1581),自動(0.1247),公共 (0.0927),鬆弛(0.0832),足以(0.0832), 光(0.0832),永恆(0.0832). 造型元素. 十字型(0.0832),拋光(0.0832),罌粟 (0.0832) ,阻燃(0.0832) ,冷注入(0.0832) , 心形(0.0832) ,中央(0.1054)泡沫(0.197), 高原(0.1663),酒廊(0.1534),旋轉 (0.1477) ,區域(0.1385) ,休息室(0.1247) , 家庭(0.0985),面料(0.0927). 設計元素. 感覺元素. 材質. 立. 治 政 聚氨酯(0.1247) 大. 產品 圖片. ,. ,. ,. sit. y. Nat. ,. ‧. ‧ 國. 學. 其他參考元 邀請(0.0832),互聯網(0.0832),恢復 素 (0.3326),名稱(0.1581). io. al. er. 見表 4-14 觀察整體設計元素,造型元素中又多種椅體的獨特造型元素,而. n. 最主要特別的是十字形的椅腳,觀察產品圖片知道,各種特殊造型的椅體皆搭配. Ch. engchi. 十字型的椅腳,故稱此概念為多造型十字腳椅。. i n U. v. 表 4-15 第一階段分群結果 6 父群別. 群別. 9. 篇數. 組內相似度. 26. 21. 0.03615. 27. 13. 0.03782. 28. 28. 0.0363. 29 加權平均相似度. 21. 0.0292. 成長率. 0.034705 53.34%. 第三階段中由父群別 9 向下分群結果 6 如表 4-15,在門檻值提升至 0.06 的 情況下,組內相似度由 0.02263 提升至 0.034705、成長 53.34%;群別 26、27、 35.

(45) 28、29 未達概念分析標準,繼續下向分群。 表 4-16 第一階段分群結果 7 父群別. 群別. 10. 篇數. 組內相似度. 30. 4. 0.03762. 31 加權平均相似度. 33. 0.02728 0.028395. 成長率. 16.52%. 第三階段中由父群別 10 向下分群結果 6 如表 4-16,在門檻值提升至 0.06 的 情況下,組內相似度由 0.02437 提升至 0.028395、成長 16.52%;群別 30、31 未. 政 治 大. 達概念分析標準,繼續下向分群。. 立. 4.2.4. 第四階段分群. ‧ 國. 4. 0.08243. 33. 47. 0.03902. 34 加權平均相似度. 6. 0.09873. io. 0.048353. n. al. 成長率. Ch. 47.12%. engchi. sit. 32. y. 組內相似度. er. 篇數. ‧. 群別. Nat. 12. 學. 父群別. 表 4-17 第四階段分群結果 1. i n U. v. 第四階段中由父群別 12 向下分群結果 6 如表 4-16,在門檻值提升至 0.07 的 情況下,組內相似度由 0.03287 提升至 0.048353、成長 47.12%;群別 32、33 未 達概念分析標準,其中群別 33 繼續下向分群;群別 34 符合概念分析規則,其概 念分析如下:. 36.

(46) 表 4-18 第 34 群概念分析 第 34 群 概念名稱:. 仿生化人體工學概念 具體(0.1367),友好(0.1025),個性 (0.0998) ,塑形感(0.0998) ,智能(0.0887) , 合適的(0.0868). 造型元素. 變色龍(0.1997),網(0.1478),變化 (0.1367),膜(0.1261),磅(0.0998), 機會(0.0998),橫臥(0.0998),改編 (0.0998) ,邀請(0.0998) ,棲息地(0.0998) , 物種(0.0998),優勢(0.0998),反應 (0.0998),動物(0.0998),調整(0.0907), 人體工學(0.0887),重(0.0749). 設計元素. 感覺元素. 立. 材質. 政 治 大. ,. ,. n. al. Ch. ,. ,. er. io. sit. y. Nat. 產品 圖片. ‧. ‧ 國. 學. 其他參考元 用戶(0.1871),經驗(0.1052),任務 素 (0.1025) ,故障(0.0998) ,不同的(0.1367) , 主要(0.0841) ,長期(0.0749) ,環境(0.1266) 維修(0.0998). n U engchi. iv. ,. 表 4-18 觀察整體設計元素,造型元素中提到變色龍、膜、棲息地、動物、 物種抱含了仿生物的概念,推測以此發展人體工學等概念,故以仿生化人體工學 為概念。 表 4-19 第四階段分群結果 2 父群別. 群別. 25. 篇數. 組內相似度. 35. 3. 0.1421. 36. 4. 0.06309. 37 加權平均相似度. 6. 0.04159. 成長率. 0.071398 110.45%. 37.

(47) 第四階段中由父群別 25 向下分群結果 2 如表 4-19,在門檻值提升至 0.08 的 情況下,組內相似度由 0.03393 提升至 0.071398、成長 110.45%;群別 35、36 未達概念分析標準;群別 34 符合概念分析規則,其概念分析如下 表 4-20 第 37 群概念分析 第 37 群 概念名稱:. 親子概念. 感覺元素. 準確(0.0623) ,光速的(0.0623) ,商業(0.0623) , 可清洗(0.0623),擺動(0.0623),先進的概 念(0.0623),新概念(0.0623),特殊(0.0623), 半透明(0.0623) ,前面(0.0524) ,安靜(0.0524) , 深度可調(0.0524),自然(0.0518). 造型元素. 嬰兒(0.1868),托盤(0.1245),底座(0.1245), 郵件(0.1245),咖啡(0.1245),調整(0.1049), 顏色(0.0852),產品(0.0664),夜間(0.0623), 兒童(0.0623),搖桿(0.0623),嬰兒(0.0623), 潛艇(0.0623) ,企業(0.0623) ,再循環(0.0623) , 搖籃(0.0623),擁抱(0.0623),餵養(0.0623), 媽媽(0.0623),閂鎖(0.0623),顧客(0.0623), 父母(0.0623) ,緊固(0.0623) ,複製品(0.0623) , 階段(0.0623),規模(0.0623),機器(0.0623), 解剖(0.0623),場合(0.0623),轉換(0.0623), 年齡(0.0623),阻燃(0.0623),顏料(0.0623), 消費者(0.0623),瓶(0.0623),方便(0.0623), 青年(0.0623),孩子(0.0623),襠(0.0623), 用戶(0.0616),插槽(0.0623),. 立. 政 治 大. ‧. ‧ 國. 學. io. sit. y. Nat. n 材質. er. 設計元素. al. Ch. engchi. i n U. v. 鋁(0.0852),線束(0.0623),用燈芯絨做的 物品(0.0623),回收(0.0738),三維針織 (0.0623),. 其他參考元 提案(0.1245),解毒(0.0623),發展(0.0623), 素 中期(0.0623),聯合(0.0524) 產品 圖片 ,. ,. ,. ,. ,. 表 4-20 觀察整體設計元素,造型元素中大量的提到父母、小孩等元素,且 38.

(48) 也出現小孩椅子所需要具備的元素,目的應該方便家長能餵養小孩等目的,故以 親子為此概念名稱。 表 4-21 第四階段分群結果 3 父群別. 群別. 26. 篇數. 組內相似度. 38. 11. 0.0553. 39. 9. 0.04151. out 1 加權平均相似度. 0.049392. 成長率. 36.62%. 第四階段中由父群別 26 向下分群結果 3 如表 4-21,在門檻值提升至 0.07 的. 治 政 情況下,組內相似度由 0.03615 提升至 0.049392、成長 大 110.45%;去除 1 篇一篇 立 為一群提升分群效果,使群別 38、39 皆符合概念分析規則,其概念分析如下: ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 39. i n U. v.

(49) 表 4-22 第 38 群概念分析 第 38 群 概念名稱:. 舒適躺臥概念 舒適(0.0927),優雅(0.085),以用戶為中心 (0.0731),緩衝(0.0731),剛性(0.0731), 冷靜(0.0731),自給自足(0.0731),創新(0.0708). 造型元素. 區(0.2462),床(0.1096),床墊(0.1096), 3D(0.1096),功能(0.087),組(0.0822),部 分(0.0822),支持(0.0779),象徵(0.0731), 陳列(0.0731) ,寢室(0.0731) ,航空公司(0.0731) , 老練(0.0731),頭(0.0731),趨勢(0.0731), 硬度(0.0731),辦公室(0.0731),首位(0.0731), 解鎖(0.0731),福利(0.0731),扶手椅(0.0696), 家具(0.0661),一維(0.0731),扶手(0.065), 符合人體工程學(0.0779),旋轉(0.0794),軟 墊(0.0649). 設計元素. 感覺元素. 政 治 大. 立. ‧ 國. 學. 材質. 樹脂(0.1096),柚木(0.0731),. ‧. n. al. er. io. sit. y. Nat. 其他參考元 細節(0.1044),對象(0.1001),參數(0.0923), 素 看起來(0.0923),用戶(0.0723),乘客(0.1096), 人(0.0962),標準(0.0822),特性(0.0822), 方法(0.0822),時間(0.0731),功能(0.0731), 首位(0.0731),可調(0.1222),第一(0.0962), 功能(0.0875),接近(0.0731),目標(0.0731) 產品 圖片. Ch. ,. ,. ,. ,. engchi ,. ,. i n U. v. ,. ,. ,. ,. 表 4-22 觀察整體設計元素,造型元素中提到床墊、躺臥等元素以及軟硬、 3D 等達到舒適的元素,給人舒適優雅的感覺,以舒適躺臥為其概念。. 40.

(50) 表 4-23 第 39 群概念分析 第 39 群 概念名稱:. 具設計感的室內外用椅 室外(0.1376) ,室內(0.2071) ,折疊(0.1225) , 耐用(0.0683),高(0.0646),光(0.0613). 造型元素. 太陽(0.2451),扶手椅(0.2333),雲 (0.1225),集合(0.0928),傳統(0.0919), 輕逸(0.0887) ,選擇(0.0839) ,樹(0.0817), 躺椅(0.0817),遊艇(0.0817),起重機 (0.0817),摺紙(0.0817),書(0.0817), 折疊(0.0688),無縫(0.0613). 材質. 紙(0.2064) ,膠水(0.0688) ,不銹鋼(0.0726) ,. 設計元素. 感覺元素. 治 政 大 物件(0.1634),對象(0.1118),使用. 其他參考元 素 (0.0951),夏季(0.0817),冥想(0.0817), 技術(0.0726) ,密度(0.0688) ,架構(0.0726) ,. 學. ,. ,. ,. ,. io. sit. y. ,. ‧. Nat. ,. n. al. ,. er. 產品 圖片. ‧ 國. 立. ,. Ch. engchi. i n U. v. 表 4-23 觀察整體設計元素,造型元素中提到的樹、雲、摺紙、摺疊都是獨 特的造形設計元素,且有一些特別的材質如紙,而這個概念共同點在於用於室內 外,故以具設計感的室內外用椅為概念。. 41.

(51) 表 4-24 第四階段分群結果 4 父群別. 群別. 篇數 組內相似度. 27. 40. 4. 0.12351. 41. 3. 0.08458. 42. 2. 0.07066. 43 加權平均相似度. 4. 0.06223 0.087542. 成長率. 131.45%. 第四階段中由父群別 27 向下分群結果 4 如表 4-24,在門檻值提升至 0.09 的. 政 治 大. 情況下,組內相似度由 0.03782 提升至 0.087542、成長 131.45%;雖將組內相似. 立. 度皆提高超過 0.05 以上但由於篇數不符合概念分析規則,故不分析概念也不繼. ‧ 國. 44. 3. 0.12383. 45. 2. 0.51647. io. 14. 0.03752. 9. 0.07131. 46. al. n. 47 加權平均相似度 成長率. Ch. e n0.091836 gchi. y. 組內相似度. sit. 篇數. er. 群別. Nat. 28. 表 4-25 第四階段分群結果 5. ‧. 父群別. 學. 續進行分群。. i n U. v. 152.98%. 第四階段中由父群別 28 向下分群結果 4 如表 4-25,在門檻值提升至 0.09 的 情況下,組內相似度由 0.0363 提升至 0.091836、成長 152.98%;群別 44、45、 46 不符合概念分析規則,其中群別 46 繼續向下分群;群別 47 符合概念分析規 則,其概念分析如下:. 42.

(52) 表 4-26 第 47 群概念分析 第 47 群 概念名稱:. 注重靠背設計概念 彈性(0.104),永久(0.082),低(0.082), 靈活(0.0811) ,獨特(0.0807) ,綜合(0.0781). 造型元素. 靠背(0.2311) ,樹枝(0.164) ,外殼(0.141), 身體(0.1392),運動(0.1259),配置 (0.1094),泡沫(0.0971),網(0.0971), 動態(0.0921),外觀(0.0874),超薄型 (0.1094),斜面(0.1094),流體(0.1094). 設計元素. 感覺元素. 材質. 政 治 大. 其他參考元 接觸(0.2303),支持(0.1962),個人資料 素 (0.123),整個(0.0749),專利(0.0921). 立. ‧ 國. 學. ,. ,. ,. ,. ,. ,. ‧ y. Nat. ,. n. al. er. io. ,. sit. 產品 圖片. i n U. v. 表 4-23 觀察整體設計元素,造型元素中靠背、外殼、身體有高權重值,且. Ch. engchi. 其他的造型元素皆是描述靠背的樣貌,故以注重靠背設計為概念。 表 4-27 第四階段分群結果 6 父群別. 群別. 29. 篇數. 組內相似度. 48. 2. 0.08601. 49. 16. 0.03733. 50 加權平均相似度. 3. 0.05611. 成長率. 0.044648 52.91%. 第四階段中由父群別 29 向下分群結果 6 如表 4-27,在門檻值提升至 0.09 的 情況下,組內相似度由 0.0292 提升至 0.044648、成長 52.91%;群別 48、50 由於 43.

(53) 篇數不符合概念分析規則,故不分析概念;群別 49 則繼續向下分群。 表 4-28 第四階段分群結果 7 父群別. 群別. 31. 51. 2. 0.2684. 52. 2. 0.12268. 53. 3. 0.49272. 54. 2. 0.10626. 55. 3. 0.19808. 56. 4. 0.115. 57. 4. 0.07658. 58. 5. 0.06365. 59. 2. 60 61. 篇數 組內相似度. 立. 治 政 0.05504 大 3 0.03662 3. 0.08747. 0.140424. 成長率. 414.81%. ‧. ‧ 國. 學. 加權平均相似度. y. Nat. io. sit. 第四階段中由父群別 29 向下分群結果 7 如表 4-28,在門檻值提升至 0.09 的. n. al. er. 情況下,組內相似度由 0.02728 提升至 0.140424、成長 414.81%;群別 51、52、. i n U. v. 53、54、55、56、57、59、60、61 由於篇數不符合概念分析規則,故不分析概. Ch. engchi. 念;群別 58 符合概念分析規則,其概念分析如下:. 44.

(54) 表 4-29 第 58 群概念分析 第 58 群 概念名稱:. 多角度對稱概念 健康(0.0855),迷人(0.0855),慷慨 (0.1084),隱私(0.0855),觀賞(0.0855), 一般(0.0855),對面(0.0855),暗示 (0.0855),自主的(0.0855),意氣風發 (0.0855). 造型元素. 中心(0.216),扶手椅(0.2035),體積 (0.1282),井(0.0855),工作(0.0855) 鏡(0.0855) ,地板(0.0855) ,支點(0.0855), 向後(0.0855),一半(0.0855),鏡像 (0.0855),認知(0.0855),並列(0.0855), 座位(0.0799),一對(0.072),軸(0.072), 網狀物(0.072),旋轉(0.171),可調 (0.0953) ,多角度(0.0855) ,傾斜(0.0855) ,. 設計元素. 感覺元素. 立. 政 治 大. ‧ 國. 學. 材質. ‧. n. al. er. io. sit. y. Nat. 其他參考元 懸念(0.171) ,變異(0.1013) ,保險(0.0855) , 素 合作夥伴(0.0855),護士(0.0855),證書 (0.0855),時刻(0.0855),度(0.072), 對話(0.072),變化(0.072),矛盾(0.072), 生命(0.0855) ,數(0.0901) ,上鎖(0.0855), 全球(0.0855),. 產品 圖片 ,. Ch. engchi. ,. ,. i n U. v. ,. 表 4-23 觀察整體設計元素,造型元素多有一半、一對、鏡面、中心等辭彙, 想必強調其對稱性或其製造工法,推測多種角度或是傾斜面等等加以反射成型, 故以多角度對稱為概念。. 45.

數據

圖  2-1 文件集向量
圖  2-4 kNN 分群模式圖  [資料來源:本研究整理  ]  一般而言,KNN 透過大量訓練所產生的向量空間之分群效果不會較其他的 分群方法來的差,但由於需要計算訓練集和測試集所有距離,故在變數樣本很大 時需耗費相當多的時間。  New  Class A Class B A1 A2

參考文獻

相關文件

八、 應檢人參加技術士技能檢定學科或術科採筆試非測驗題職類,測試使用計算器,除

In the past researches, all kinds of the clustering algorithms are proposed for dealing with high dimensional data in large data sets.. Nevertheless, almost all of

Menou, M.著(2002)。《在國家資訊通訊技術政策中的資訊素養:遺漏的層 面,資訊文化》 (Information Literacy in National Information and Communications Technology (ICT)

德霖技術學院 德霖技術學院 德霖技術學院..

張庭瑄 華夏技術學院 數位媒體設計系 廖怡安 華夏技術學院 化妝品應用系 胡智發 華夏技術學院 資訊工程系 李志明 華夏技術學院 電子工程系 李柏叡 德霖技術學院

Lessons-learned file (LLF) is commonly adopted to retain previous knowledge and experiences for future use in many construction organizations.. Current practice in capturing LLF

本研究考量 Wal-mart 於 2005 年方嘗試要求百大供應商需應用 RFID 技術 於商品上(最終消費商品且非全面應用此技術,另 Wal-mart

本研究主要以 But-for 崩塌竣工時程分析技術為基礎進行理論推導,確認此延遲分析技術 計算邏輯之問題與完整性,之後提出修正之計算邏輯,使