語文創作

第二章、人工智慧發展與著作權法適用之研究

一、語文創作

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

其二，若承認人工智慧得為事實上創作主體，又是否得為法律上創作、權利主體。針對人工智慧作為法律主體之論爭將於本文第三章討論，而上開著作權主體問題之具體分析將會在本文第四章進行論述，合先敘明。因此，本章第二個重點，即是整理各國（包含歐盟）現有著作權法中有關創作主體、權利主體之規定，試圖分析目前現有法規是否仍能妥善處理人工智慧創作所衍生出之權利主體問題。

貳、人工智慧創作之近期案例

一、語文創作

（一）相關技術：GPT-2 語言模型

在 2019 年 2 月，非營利研究機構 OpenAI 利用神經網路架構中

“Transformer 模型”之技術以及自我注意力機制(self-attention)，公布了新研發之 GPT-2 語言模型，並以模型中 15 億個參數(parameter)、800 萬個網頁、總共 40GB 的文本資料進行訓練。而該語言模型之目的極為簡單：透過任何文本中前段所提供的所有單字，去預測並產生下一個單字。而上開龐大的文本資料集在語言上之多樣性，也使得上開 GPT-2 語言模型得以自然地適應各種文本的差異，而不會像過往的語言模型有著跨文本（如從寫詩轉換領域至寫劇本）便無法產生有意義語句的情形²⁶。

依據 OpenAI 之說法，GPT-2 語言模型顯示了其具備廣泛的功能性，包括產生超越先前人工智慧技術的語句撰寫之能力，透過使用者輸入之內容進而使其

26 Alec Radford, et al., Better Language Models and Their Implications(2019), available at https://openai.com/blog/better-language-models/ (Last visited:2020.6.4).

此外，2020 年 5 月起 OpenAI 宣布已研發 GPT-3 語言模型，並將於同年 6、7 月逐步公開測試，GPT-3 語言模型具有 1750 億個參數，整體表現比起 GPT-2 更為優異，然本文完稿前並未有 足夠資訊與使用案例參考，因此乃以 GPT-2 作為本文案例。See generally Tom B Brown, et al., Language models are few-shot learners(2020), available at arXiv preprint arXiv:2005.14165 (Last visited:2020.8.27).

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

產生後續語句。此外，其所開發出 GPT-2 語言模型之表現比起利用特定領域

（如維基百科，新聞或書籍）訓練的其他語言模型更為優異，並且無需再利用這些特定領域中訓練資料。在回答問題，理解文義，將文本摘要以及翻譯之類的目標上，GPT-2 能夠使用原始資料來進行學習，而無需使用特定目標的訓練資料，並且達到了令人驚訝的程度。

在人工智慧工程師 Adam King 所建立的“Talk to Transformer”網頁中，便利用了全尺寸（15 億個參數）的 GPT-2 語言模型。網頁使用者可以提供任何種類文本之語句（從新聞、食譜到詩作等等），Talk to Transformer 都能隨機撰寫出在某程度上符合該段語句文義的後續發展，藉此讓使用者能夠了解 GPT-2 語言模型撰寫文本的程度。

舉例而言，筆者於 Talk to Transformer 網頁中輸入了 “U.S. president Trump just declared that” 之後，該語言模型隨即產生了幾可亂真的後續語句 “North Korea is a ‘big, big problem.’ Trump made the comments in an interview that aired on Fox News on Tuesday. The president said North Korea's actions ‘shouldn't be taken lightly.’ ‘I feel it's very hard for the United States to do anything other than be very strong, very determined and very headed in the right direction,’ he said. [Trump also says he would be willing to meet Kim Jong Un]”²⁷。可以注意到，其語句之通順程度似已足夠與人類相較。

基於 GPT-2 全尺寸語言模型在模擬文本上所展現出的擬真性，OpenAI 特別指出了其除了運用在寫作輔助、即時翻譯以及語言識別外，更有可能被惡意運用於偽裝成網路使用者或產生誤導性新聞、網路釣魚文章、製作虛假、垃圾訊

27 筆者最初於 2020 年 4 月 25 日在該網站嘗試輸入一部分英文食譜、劇本、論文、詩作及新聞之內容，在數次嘗試中儘管產生之文本內容有些怪異且不一定符合常識，但大部分皆能夠產生 符合文法與一定連貫性之語句。See Adam King, Talk to Transformer, available at

https://talktotransformer.com/ (Last visited:2020.6.30).

惟筆者於 2020 年 6 月 30 日發現 Talk to Transformer 網頁因資金不足而不再營運，特此說明。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

息等不當目的²⁸。因此 OpenAI 在公布 GPT-2 語言模型後，並未一次性地釋出全尺寸之模型，而係透過實際觀察使用情況，循序漸進釋放出完整之程式碼²⁹。

而學者針對利用 GPT-2 語言模型使用情形的研究報告中，其與人類文本的接近性需要特別提及。康乃爾大學之學者 Sarah Kreps 利用 GPT-2 語言模型，產生出虛假之新聞內容提供不知情之受試者閱讀，並於揭露事實後採訪受試者。

其研究發現，雖然許多受試者認為這些文章之內容可能屬於「假新聞」，但是卻沒有任何讀者試圖指出「這些文章並非由人類撰寫。」³⁰。Kreps 另外也針對 500 人進行一般報紙文章與 GPT-2 語言模型產出文章進行可信度之測試，其亦發現有 72%的人認為 GPT-2 語言模型所產出之文章可信³¹。因此，雖然其新聞之可信性尚待更廣泛的研究，但單就此點觀之，似乎透露出至少在自然語言的使用上，GPT-2 語言模型與人類寫作程度已能夠相互比較之外，更有可能混淆一般讀者，使其信賴作者之人類身分以及內容之真實性。

（二）運用 GPT-2 之創作

除了上述 GPT-2 語言模型在產生新聞報導等運用上，亦可看見部分人士已有利用其技術投入相關語文創作之嘗試。在 2019 年，Nick Walton 利用上開全尺寸（15 億個參數）的 GPT-2 語言模型，最初提供了 30MB 資料量的小說文本作為訓練資料且花費了 12 到 16 個小時進行模型訓練³²，設計了一款文字冒險遊戲“AI Dungeon”³³。使用者可以透過輸入各式語句描述角色在遊戲文本中之

28 See Radford, et al., supra note 26.

29 Id.

30 Irene Solaiman, et al., Release strategies and the social impacts of language models, RELEASE STRATEGIES AND THE SOCIAL IMPACTS OF LANGUAGE MODELS, Appendix E: Perceived Credibility of GPT-2 Synthesized News Articles, 4 (2019).

31 Sarah Kreps & R.Miles McCain, How AI Is Making Fake News Look Real, Foreign Affairs(2019), available at https://www.foreignaffairs.com/articles/2019-08-02/not-your-fathers-bots (Last

visited:2020.6.9).

32 Jason Boog, How the Creator of AI Dungeon 2 Used GPT-2 To Create Neverending Adventure Games(2019), available at https://towardsdatascience.com/the-creator-of-ai-dungeon-2-shares-gpt-2-finetuning-advice-e5800df407c9 (Last visited:2020.4.21).

33 https://aidungeon.io/ (Last visited:2020.4.21)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

行動或者設定故事之場景，不受到開發人員設計之限制自由地撰寫部分故事情節；而 AI Dungeon 將會基於使用者所輸入之語句，透過預測隨機產生後續情節發展，其人工智慧設計之概念，正係出自於桌上型遊戲中主持人之角色。

AI Dungeon 所具備之情節發展能力，目前距離撰寫完整的故事情節尚有一段距離，雖然能夠在每一次對話回合撰寫一定份量的情節，但依然需仰賴使用者輸入語句以決定故事的大致走向。不過，在某些情況 AI Dungeon 有時仍會遺忘前段文本中所發生之情節，或者產生部分與先前故事內容、現實情況相悖，

甚而天外飛來一筆的發展。

為了適度呈現 AI Dungeon 如何具體與使用者進行故事創作，筆者在此以其預設之末日生存情節作為故事開頭，並節錄了以下互動過程（網底文字為 AI Dungeon 自動生成）：

You meet the leader who knows something about your past.

You walk into the kitchen where a man with short dark hair sits at a table eating his lunch. His eyes scan you as soon as he sees you, but he doesn't say anything. The man looks like he could kill you right then and there, so you don't bother him.

You seat in front of him.

You sit down in front of the man. He stares at you for a moment before speaking. "I'm sorry about your friend."

You slap on the table and say "No, you're not sorry."

You quickly grab a large knife from the table and hold it up. "This isn't about me, this is about everyone else." "Yes, I know, but...

You say "How much did you know?"

The man takes a deep breath and sighs. "I didn't really know too much about him. I just knew he was good at what he did, and that's all I needed to hear.

You say "OK. let's never talk about that again. Truce?"

The man nods and smiles. "Deal." You go back to your camp and

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

spend the rest of the day thinking about how fucked up everything is.³⁴ 在上開例子中，至少可以觀察到使用者輸入角色之行動或發言，AI Dungeon 除了理解使用者輸入之內容外，亦於後續回應產生足夠長度、用詞適當、語意通順並且能夠順利發展情節之文本，而這些經由 AI Dungeon 自主預測所產生之內容，自然不屬於使用者原先所創作之範圍。

綜上所述，應可認為利用 GPT-2 語言模型作為創作媒介的 AI Dungeon，在創作上所代表的意義十分重大。其允許了不熟悉英語文法、寫作之使用者透過輸入簡單的句子，產生意料之外的故事情節與細節描寫，進而得以與 AI Dungeon「共同」、「接力」地撰寫故事內容。並且可以認為，不熟悉英語的使用者實際上無法透過自己的英語寫作能力，獨力撰寫出 AI Dungeon 所負責生成之部分故事內容。那麼如何認定創作者即可能產生爭議，而筆者認為或許難以斷定人類使用者為 AI Dungeon 創作之著作人（或唯一之著作人）。

在文檔中人工智慧法律主體之論爭─以人工智慧創作為例 - 政大學術集成 (頁 23-27)

第二章、 人工智慧發展與著作權法適用之研究

一、 語文創作

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二章、人工智慧發展與著作權法適用之研究

一、語文創作

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學