“
2023年7月,世界人工智能大會(huì)在上海如期舉辦,關(guān)于機(jī)器人、人工智能的新一輪話題熱度又直線上升。AIGC(AI-Generated Content,人工智能生成物,此類型AI亦稱為生成式AI)自2022年開始迎來了高速發(fā)展,不僅與金融、傳媒、娛樂、醫(yī)療、工業(yè)等各行業(yè)進(jìn)行結(jié)合,以低成本、高效率的方式滿足海量個(gè)性化需求,與此同時(shí)也孕育著行業(yè)業(yè)態(tài)的新模式。而對(duì)AIGC的規(guī)制,美國版權(quán)局于今年3月發(fā)布了關(guān)于包含AI生成內(nèi)容之作品版權(quán)登記的政策聲明(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence),我國也相應(yīng)出臺(tái)了《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》與《生成式人工智能服務(wù)管理暫行辦法》。
本專題將結(jié)合國際上的規(guī)制現(xiàn)狀,國內(nèi)的政策解讀,對(duì)人工智能生成物是否能夠獲得版權(quán)保護(hù),如何避免人工智能生成物侵權(quán),以及人工智能所涉及的倫理問題等展開一些列探討與實(shí)務(wù)操作指引。
”
一、生成式AI的工作原理
根據(jù)《中國AIGC產(chǎn)業(yè)全景報(bào)告》的定義,AIGC全稱為AI-Generated Content,指基于預(yù)訓(xùn)練大模型、生成式對(duì)抗網(wǎng)絡(luò)(GAN)等人工智能技術(shù),通過已有數(shù)據(jù)尋找規(guī)律,并通過釋放泛化能力生成相關(guān)內(nèi)容的技術(shù)。在我們闡釋AIGC可能涉及的法律爭議之前,先來看看預(yù)訓(xùn)練大模型和生成式對(duì)抗網(wǎng)絡(luò)的含義。
預(yù)訓(xùn)練大模型(LLM),包含了“預(yù)訓(xùn)練”-“指令微調(diào)”兩個(gè)步驟。第一步在大規(guī)模無標(biāo)注數(shù)據(jù)(如互聯(lián)網(wǎng)文本)上進(jìn)行模型預(yù)訓(xùn)練,學(xué)習(xí)通用的語言模式;第二步在給定自然語言處理任務(wù)的小規(guī)模有標(biāo)注數(shù)據(jù)上進(jìn)行模型微調(diào),快速提升模型完成這些任務(wù)的能力,最終形成可部署應(yīng)用的模型?!?】
生成式對(duì)抗網(wǎng)絡(luò),則是由生成器和判別器組成的深度學(xué)習(xí)模型。生成器主要用以生成和真實(shí)數(shù)據(jù)近似的數(shù)據(jù),而判別器主要用于區(qū)分生成器生成的數(shù)據(jù)和真實(shí)數(shù)據(jù)。生成器和判別器共同構(gòu)成了一個(gè)動(dòng)態(tài)的“博弈過程”。
我們以時(shí)下熱門的圖像生成式AI及文本生成式AI詳細(xì)解釋。
圖像生成式AI是指基于給定文本描述,生成圖像的AI系統(tǒng)(Text-To-Image,又稱T2I)。這受益于計(jì)算機(jī)視覺行業(yè)的進(jìn)展與深度生成網(wǎng)絡(luò)研究的突飛猛進(jìn)。目前擴(kuò)散模型(Diffusion Model)因操作簡便、生成圖像精度高而成為最流行的生成模型。這一類的典型代表有Stable Diffusion、Midjourney。早期的模型是通過對(duì)圖像元素添加關(guān)鍵詞,再讓指令詞與圖像信息進(jìn)行匹配,以此達(dá)到用戶輸入文本,AI輸出對(duì)應(yīng)元素拼貼的效果。而擴(kuò)散模型則在此基礎(chǔ)上改良,通過對(duì)圖片添加噪聲(noise),再以計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)的正向加噪、反向去噪聲過程生成質(zhì)量更高和創(chuàng)造性更強(qiáng)的圖像。通過大量的學(xué)習(xí)訓(xùn)練,AI就能從足夠多的素材中學(xué)習(xí)并生成最接近人類真實(shí)世界中的數(shù)據(jù)。
我們再來看文本生成式AI。時(shí)下最火的產(chǎn)品莫過于ChatGPT4。
開頭我們說過預(yù)訓(xùn)練大模型(LLM)包含了“預(yù)訓(xùn)練”和“微調(diào)”的的兩段式練習(xí),其實(shí)GPT在前兩代的時(shí)候并沒有展現(xiàn)出優(yōu)于其他模型的性能,而到GPT3的時(shí)候,突破性地在兩段式的基礎(chǔ)上加入了in-context 學(xué)習(xí)方式,通過給模型做示范,讓模型感知應(yīng)該輸出什么,而不是直接標(biāo)記最優(yōu)答案。GPT3通過引導(dǎo)式的學(xué)習(xí)方式,在超大模型上展現(xiàn)出了驚人的效果:只需要給出一個(gè)或者幾個(gè)示范樣例,模型就能照貓畫虎地給出正確答案。而GPT4在底層技術(shù)原理上并沒有超越第三代,而是改變了訓(xùn)練策略,通過人工篩選,不斷判斷輸出的哪些句子是好的,哪些是低質(zhì)量的,這樣就可以訓(xùn)練得到一個(gè) reward 模型。通過 reward 模型來模擬人類打分的過程,自動(dòng)對(duì)問題的不同回答打分,模型再根據(jù)打分調(diào)整參數(shù)。即用問題、回答和分值作為數(shù)據(jù),用強(qiáng)化學(xué)習(xí)的方式訓(xùn)練模型。這就是Chat GPT可以模擬情景對(duì)話、給出多元化答案,并在和人類的對(duì)話中可以不斷修正結(jié)果的原理。
通過對(duì)上述生成式AI工作原理的闡述,我們不難發(fā)現(xiàn),AI的學(xué)習(xí)離不開海量的數(shù)據(jù)源,而數(shù)據(jù)來源真實(shí)性直接影響了AI輸出結(jié)果的準(zhǔn)確性,而數(shù)據(jù)源的合法性則可能直接導(dǎo)致對(duì)版權(quán)、隱私和倫理的爭議。而對(duì)于AI輸出的結(jié)果是否能成為法律保護(hù)的對(duì)象,又是否可能侵害他人的權(quán)利,也成為AIGC法律合規(guī)的焦點(diǎn)。
//////
二、人工智能生成物是否能夠獲得《著作權(quán)法》保護(hù)
今年3月美國版權(quán)局推出了關(guān)于生成式AI作品版權(quán)的政策聲明。在這份聲明中,對(duì)“生成式AI的生成的材料”和“由人類創(chuàng)作的(human-authored)和人工智能生成材料(AI-generated material)組成的作品”進(jìn)行了區(qū)分。
首先該份聲明依然堅(jiān)持了一項(xiàng)基本原則——版權(quán)法只能保護(hù)“人”的智力創(chuàng)造。因此,由計(jì)算機(jī)算法自主創(chuàng)建的生成物是無法被認(rèn)定為“作品”的。而在今年2月,一份由人類作者創(chuàng)作文本、Midjourney生成圖像的圖畫小說(Zarya of the Dawn),卻得到了美國版權(quán)局的認(rèn)可,被認(rèn)為構(gòu)成版權(quán)法保護(hù)的作品,獲得了有限的保護(hù)。對(duì)此,美國版權(quán)局進(jìn)一步解釋,該圖畫小說中人類創(chuàng)作的文本屬于人類的智力成果,符合版權(quán)法保護(hù)的標(biāo)準(zhǔn),可以單獨(dú)登記成為作品;而Midjourney生成的圖像,僅僅是基于計(jì)算機(jī)算法得出的材料,無法獨(dú)立獲得保護(hù),但不影響整個(gè)圖畫小說成為一個(gè)完整的作品。
那么對(duì)于由人類使用生成式AI進(jìn)行多次調(diào)整、修改后的作品是否能夠保護(hù)呢?
在此問題上,該份聲明舉例了人類使用Photoshop編輯圖像的例子。視覺藝術(shù)家利用圖像編輯軟件修改圖片,計(jì)算機(jī)僅僅是一種輔助工具,它不影響人類對(duì)作品表達(dá)的創(chuàng)作性控制,因而不會(huì)影響圖片藝術(shù)家的“作者”身份。相反,對(duì)于由機(jī)器自動(dòng)運(yùn)行,沒有人類作者的任何創(chuàng)意或干預(yù)而產(chǎn)生的作品則無法獲得保護(hù)。而關(guān)于在人工智能訓(xùn)練中使用受版權(quán)保護(hù)的作品在法律上應(yīng)當(dāng)如何規(guī)制等問題,美國版權(quán)局后續(xù)也將向社會(huì)公眾征求意見。
因此我們看到了一個(gè)有意思的現(xiàn)象,美國版權(quán)局沒有一刀切地認(rèn)為只要是AI生成的作品就不是“作品”,而是需要進(jìn)行個(gè)案分析。雖然如何判定人類在作品中的智力貢獻(xiàn),以及是否能夠在單件作品中獨(dú)立區(qū)分開人類創(chuàng)作部分和AI創(chuàng)作的部分,是一件在實(shí)際操作中并不容易的事情。但至少,該份聲明明確了,版權(quán)法依然應(yīng)當(dāng)以人為本,也奠定了生成式AI應(yīng)當(dāng)服務(wù)于人類,成為人類工具的基調(diào)。
而英國在作品的創(chuàng)造性問題方面,則一直主張“額頭流汗”原則,即只要作品中存在作者的勞動(dòng)即可,而無論此項(xiàng)勞動(dòng)的多少。英國《1988年版權(quán)、設(shè)計(jì)與專利法》明確認(rèn)可文學(xué)、戲劇、音樂或藝術(shù)作品如果是由計(jì)算機(jī)產(chǎn)生的,那么這一作品的作者應(yīng)當(dāng)是對(duì)該作品的創(chuàng)作進(jìn)行必要安排的人,此類由計(jì)算機(jī)生成作品的著作權(quán)保護(hù)期限系自作品創(chuàng)作完成當(dāng)年的最后一天起五十年,同時(shí)對(duì)于此類作品不適用著作人格權(quán)。【2】
目前,我國現(xiàn)行出臺(tái)文件均沒有對(duì)AI生成物是否符合《著作權(quán)》法意義上的作品給出結(jié)論性評(píng)價(jià)。而在國內(nèi)現(xiàn)有的案例中,對(duì)于AI生成的作品是否是“作品”也形成了完全相反的觀點(diǎn)。
讓我們先回歸法條,我國《著作權(quán)法》中所稱的作品,“是指文學(xué)、藝術(shù)和科學(xué)領(lǐng)域內(nèi)具有獨(dú)創(chuàng)性并能以一定形式表現(xiàn)的智力成果”,所以作品具有兩個(gè)實(shí)質(zhì)構(gòu)成要件:“獨(dú)創(chuàng)性”和內(nèi)容屬于“智力成果”。
那么這里的“智力成果”是否必須為人類的智力成果呢?
我們從(2019)粵0305民初14010號(hào)“Dreamwrite”案件中可以看出一些判斷方向。深圳南山區(qū)法院認(rèn)可了由Dreamwriter軟件自動(dòng)撰寫完成的文章可以被認(rèn)定“作品”,但其在說理部分強(qiáng)調(diào)了“Dreamwriter軟件的自動(dòng)運(yùn)行并非無緣無故或具有自我意識(shí),其自動(dòng)運(yùn)行的方式體現(xiàn)了原告的選擇,也是由Dreamwriter軟件這一技術(shù)本身的特性所決定……從涉案文章的生成過程來分析,該文章的表現(xiàn)形式是由原告主創(chuàng)團(tuán)隊(duì)相關(guān)人員個(gè)性化的安排與選擇所決定的,其表現(xiàn)形式并非唯一,具有一定的獨(dú)創(chuàng)性。其觀點(diǎn)是,人工智能生成內(nèi)容基于人工智能的控制人或研發(fā)人員設(shè)置一定的技術(shù)、算法而得,其在一定程度上仍屬于人類的智力成果。但同時(shí)可見,我國法院在判斷AI生成物是否是作品的過程中,仍不可排除地需要甄別“人”在作品中的地位和作用。
然而隨著深度學(xué)習(xí)技術(shù)和大數(shù)據(jù)等網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,人工智能早已擺脫了遵循既定算法和程序的計(jì)算機(jī)輔助工具的地位,能夠獨(dú)立自主創(chuàng)作。這種自主創(chuàng)作的方式將可能使人對(duì)作品的控制性創(chuàng)造作用越來越小。因而,筆者認(rèn)為,美國版權(quán)局的甄別方法或?qū)ξ覈鳤I生成物的保護(hù)具有一定的借鑒和參考意義。
當(dāng)然,我國《著作權(quán)法》雖暫無定論,卻不妨礙生成式AI的提供者通過與用戶訂立協(xié)議的形式約定生成物的著作權(quán)歸屬。
//////
三、人類如何擁抱生成式AI
生成式AI給人類帶來的沖擊感毫無疑問是強(qiáng)烈的,甚至對(duì)一些職業(yè)造成了現(xiàn)實(shí)的威脅,比如游戲制圖、影視美術(shù)、工業(yè)設(shè)計(jì)等領(lǐng)域,AI看上去稍加訓(xùn)練便可以替代,想象力甚至超越人類。但通過上文對(duì)AI原理的分析,我們也可以清醒地認(rèn)識(shí)到,AI雖然具備了深度學(xué)習(xí)的能力,但仍在模擬人類進(jìn)行思考,也需要通過人類來甄別一些信息。比如文本生成型AI,當(dāng)我們需要一個(gè)專業(yè)領(lǐng)域的 LLM 時(shí),用于預(yù)訓(xùn)練模型中的知識(shí)庫就顯得尤為重要。由于大多數(shù)預(yù)訓(xùn)練模型都是在通用訓(xùn)練語料上進(jìn)行學(xué)習(xí)的,對(duì)于一些類似金融、法律等特殊領(lǐng)域中的概念和名詞,AI都無法具備很好的理解。所以需要在訓(xùn)練語料中加入一些領(lǐng)域數(shù)據(jù),以幫助模型在指定領(lǐng)域內(nèi)獲得更好的效果。這就給了專業(yè)領(lǐng)域的人才以新的合作機(jī)遇,而未來,訓(xùn)練完成的AI將可能有針對(duì)性地適配在各個(gè)專業(yè)領(lǐng)域內(nèi),成為能提高人類效率的良好工具。
而圖片生成式AI的新賽道則展露的更早,美國早已出現(xiàn)了售賣提示詞的網(wǎng)站。在AI的世界里,提示詞(Prompt)就是和AI溝通語言的橋梁,通過準(zhǔn)確的使用關(guān)鍵詞,才能讓AI生成出自己想要的、具有穩(wěn)定風(fēng)格的作品。而那些能讓AI做人類想要讓他們?nèi)プ龅氖虑榈膶<冶环Q為提示詞工程師(Prompt Engineer)。
//////
四、我國“提示詞”保護(hù)的思路的構(gòu)想
目前國內(nèi)外,已有很多使用大模型進(jìn)行生產(chǎn)創(chuàng)作的實(shí)踐應(yīng)用,涉及到軟件開發(fā)、文本處理、圖像生成等多個(gè)領(lǐng)域,而“如何寫出好的提示詞”正在成為各個(gè)領(lǐng)域熱論的議題。接踵而來的,即是優(yōu)秀的提示詞如何能夠保護(hù)?
我們首先來分析其是否能夠通過《著作權(quán)法》進(jìn)行保護(hù)?
一些由詞組、短句堆砌而成的較為簡單的提示詞,由于其本身不能聯(lián)系成為一個(gè)語義連貫,具有獨(dú)創(chuàng)性意義的作品,因而不屬于著作權(quán)法保護(hù)的對(duì)象。而如將古詩詞“橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同”作為提示詞,亦無法獲得保護(hù),因?yàn)樵撟髌芬褜儆诠蓄I(lǐng)域,同樣不符合保護(hù)條件。由此來看,提示詞想要獲得《著作權(quán)法》保護(hù),則可能需要進(jìn)行非常詳細(xì)的描述,同時(shí)又要具備獨(dú)創(chuàng)性的特征。
如果要求提示詞工程師一定要達(dá)成上述條件,其智力成果才能獲得保護(hù),確實(shí)是有些強(qiáng)人所難,更有些強(qiáng)AI所難,因?yàn)锳I的本質(zhì)系一系列計(jì)算機(jī)程序的組合,其善于接受的指令通常應(yīng)當(dāng)是簡潔、簡短、明確的詞語或短句,并不需要過多的修飾或完整連貫的意思表示。但一段好的提示詞的確需要工程師進(jìn)行反復(fù)的推敲、實(shí)驗(yàn)、修改,同時(shí)也需要工程師具有一定的計(jì)算機(jī)軟件編程知識(shí)或至少應(yīng)當(dāng)初步了解其所被提示的AI的基本工作或運(yùn)作原理,要付出非常極大的努力,不可否認(rèn)一段優(yōu)秀的提示詞應(yīng)當(dāng)被認(rèn)定是智力成果。
那么在提示詞本身的基本表達(dá)不能被著作權(quán)保護(hù)的情況下,是否有更好的保護(hù)方式呢?
筆者認(rèn)為,在沒有新的法律法規(guī)制定和頒布之前,我們可以在現(xiàn)有知識(shí)產(chǎn)權(quán)法律法規(guī)框架體系中尋找適合的方式,首先,提示詞的排列組合方式可以被定義為一種方法,而方法是可以通過發(fā)明專利進(jìn)行保護(hù)的,簡單以繪畫類AI舉例,當(dāng)我們需要使用提示詞通過繪畫類AI生產(chǎn)作品時(shí),提示詞通常至少會(huì)包含需要繪畫的物品、物品的色調(diào)、整體繪畫的風(fēng)格,如包含人物肖像,亦需要人物肖像的特征,人物的情緒定義等,對(duì)于這么多關(guān)鍵信息,我們采用不同的排列方式將會(huì)得到AI生成的不同表達(dá)的作品,例如先體定義總體風(fēng)格并嵌套色調(diào)、先定義情緒再嵌套肖像特征與先定義色調(diào)、肖像特征最后定義風(fēng)格和情緒將獲得不同的作品,這種方式即方法如具有一定的新穎性和創(chuàng)造性,是可以嘗試申請(qǐng)發(fā)明專利并獲得發(fā)明專利的保護(hù)的。當(dāng)然,通過發(fā)明專利保護(hù)的劣勢也非常明顯,即一件發(fā)明專利的審查期限至少需要12個(gè)月左右,甚至更久,對(duì)于提示詞規(guī)則的生命周期而言,保護(hù)是否會(huì)滯后可能是需要進(jìn)一步考量問題;其次,我們來看提示詞的本質(zhì),即一些具有明確含義的字、詞、短語或短句(下文我們稱之為“提示詞元素”),其中明確的含義一般是指沒有歧義,只有準(zhǔn)確表達(dá),讓AI準(zhǔn)確領(lǐng)悟提示人的意圖,才能更有效的創(chuàng)作AI生成物(作品),從這一特性我們可以基本斷言有效且優(yōu)秀的提示詞元素是有限的,例如可以有效提示肖像的提示詞元素是這幾個(gè)、有效提示情緒的是那幾個(gè)、有效提示風(fēng)格的是這一系列、有效提示運(yùn)動(dòng)狀態(tài)是那一系列。這樣大家是否想到,或者已經(jīng)有非常多的企業(yè)已經(jīng)在做的一個(gè)工作就是收集并匯總各個(gè)領(lǐng)域有效且優(yōu)秀的提示詞元素,并將其分類梳理為數(shù)據(jù)庫,而“數(shù)據(jù)庫”是我國著作權(quán)法明確保護(hù)得作品客體。所以,即便實(shí)際應(yīng)用的某一段提示詞不構(gòu)成著作權(quán)法意義上的作品而不能獲得保護(hù),但可以考慮對(duì)提示詞的分類組合的數(shù)據(jù)庫進(jìn)行確權(quán)和保護(hù),而其關(guān)鍵點(diǎn)可能在于提示詞的分類即數(shù)據(jù)庫的字段設(shè)置,具體我們將另外行文分析。
AIGC可以說是一項(xiàng)最接近普通人的AI運(yùn)用,它使得AI不再那么高不可攀,只要一臺(tái)聯(lián)網(wǎng)的終端,人人都可以通過向AI發(fā)出指令的方式進(jìn)行創(chuàng)作,并得到AI創(chuàng)作物(AIGC)。AIGC讓人們體會(huì)到了AI的強(qiáng)大、便捷和效率,即便是在當(dāng)下生成式AI實(shí)際應(yīng)用發(fā)展的初期,其已經(jīng)能為個(gè)人、企業(yè)解決非常多棘手的、繁雜的問題,其迅速熱門也就不足為奇。由此接踵而來的當(dāng)然是各種法律問題,無論是AI服務(wù)的提供者、AI服務(wù)的運(yùn)用者、AI生成的作品的閱讀者都會(huì)想要了解自己在提供服務(wù)、使用服務(wù)、瀏覽作品時(shí)應(yīng)當(dāng)符合的法律規(guī)范,筆者的系列文章意在通過探討分析我國以及世界相關(guān)法律法規(guī)并結(jié)合自身通過分析得出一些粗淺結(jié)論讓大家更好的了解AI相關(guān)法律問題,并希望能拓展大家的視野,為大家在AI領(lǐng)域的運(yùn)用提供靈感。
下一篇文章,我們將著重探討我國對(duì)于生成式AI的態(tài)度以及相關(guān)管理規(guī)定的解讀,AI生成物如何避免侵權(quán)等問題。
//////
注釋:
【1】 《大規(guī)模預(yù)訓(xùn)練模型》,《中國計(jì)算機(jī)學(xué)會(huì)通訊》2021年5月第5期,P8
【2】 [ 唐蕾.人工智能生成物的著作權(quán)保護(hù)比較法研究——以元宇宙背景為視角[J].電子知識(shí)產(chǎn)權(quán),2023,No.376(03):81-90.]
參考文獻(xiàn):
【1】《大規(guī)模預(yù)訓(xùn)練模型》,《中國計(jì)算機(jī)學(xué)會(huì)通訊》2021年5月第5期
【2】《一文讀懂ChatGPT模型原理》,JioNLP團(tuán)隊(duì),知乎
【3】ChatGPT的工作原理:機(jī)器人背后的模型,36氪,百度
本文內(nèi)容轉(zhuǎn)自公眾號(hào)“知產(chǎn)前沿”,2023年7月22日發(fā)布《趙婧等 | 生成式人工智能法律法規(guī)梳理與實(shí)務(wù)指引(一)——AI生成物的保護(hù)》
本文作者:
本文內(nèi)容僅代表作者個(gè)人觀點(diǎn),依據(jù)作者個(gè)人對(duì)法律、案例以及結(jié)合自身經(jīng)驗(yàn)而形成,不對(duì)其準(zhǔn)確性做完全的保證,不代表申浩律師事務(wù)所的法律意見或?qū)Ψ傻慕庾x。
聯(lián)系客服