本文以內容生成的視角出發(fā),討論了信息、數(shù)字內容和人的關系,以及內容在媒體、游戲和社交等領域的發(fā)展邏輯、呈現(xiàn)方式以及未來的形態(tài)。
當我們以整體的方式來看到整個內容生產和消費時,會有 4 個不同的內容生成的階段。
在第 1 階段中,內容是由大規(guī)模的專業(yè)創(chuàng)意團隊來產生(PGC),這些產品大多數(shù)都是針對單人的體驗,當產品中增加同時參與內容交互的用戶時,這些體驗實際上并沒有改變。比如大部分的專業(yè)新聞媒體、流媒體、非沙盒類游戲等內容。
社區(qū)、自媒體、沙盒游戲等 UGC 內容則屬于第 2 階段,而更廣泛意義上的社交媒體、社交網(wǎng)絡和社區(qū)會同時橫跨1和2階段。
第 3 階段中,ABC 技術(AI, Big Data, Cloud)將協(xié)助人們更有效率地生成數(shù)字內容,這部分內容將會是天然的動態(tài)生成,也因此能夠同時適應多人交互的動態(tài)體驗。
第 4 階段則是完全由 AI 自動生成大量且豐富的內容,從而支持 Metaverse 中用戶的內容消耗需求。
從真實世界和虛擬世界的發(fā)展光譜來看,第 123 階段都屬于數(shù)字化的真實世界,而第 4 階段則完全屬于原生的虛擬世界。
在這基礎上,我們進一步討論了技術對于幾個主要的內容領域(媒體、游戲、社區(qū)、社交等)的改變與影響,以及內容是如何從外部和內部實現(xiàn)智能生成。
技術將在虛擬世界中為人們帶來新的社交關系,也會帶來新的生產關系。自動化生成的內容體量正在加速爆發(fā),我們當前所處的 UGC 和 PUGC 時代很快將會過去,人類會和 AI 將會共同創(chuàng)造更加動態(tài)、豐富且個性化的內容。
一、信息、數(shù)字內容和人
1. 內容=信息+載體
人生來就會和世界產生關系。以人為觀測對象來看,在這個世界中能夠與人產生關系的則是人和物體,人和人之間會交流,為了獲取對方信息,從而產生了語言;而人為了獲取物體的信息,則誕生了工具,通過使用工具的方式來獲取物體的信息,從而使用物體完成各種目的,甚至將物體打造成工具本身。
信息本身的存在,并不會依賴于信息的傳播方式、路徑和對象,信息本身只和信息載體有關。也就是說,在我們從真實世界獲取信息時,我們僅僅是通過某種合理的方式,獲取了原本就存在的信息。
在獲取、傳遞與接受信息的過程中,為了提高信息獲取的效率,我們使用了各種載體。語言是一種虛擬的載體,聲音是一種虛擬的載體,工具是一種實體的載體,物體是一種實體的載體。當然,虛擬的載體如果想要更加穩(wěn)定、持續(xù)、有效地傳播的話,一定需要實體的載體。
這個過程發(fā)生后,信息形態(tài)會發(fā)生改變,因為載體發(fā)生了變化。
嚴格來說,文字也是一種工具。同時,人們?yōu)榱俗屨Z言以及背后的思想等信息,被穩(wěn)定且有效地傳播下去,出現(xiàn)了筆、紙、樂器、樂譜等工具,作為不同信息的載體,幫助信息在人之中留存和傳播。
信息有了載體,就會成為內容。
內容的本質是信息,人是信息、物體是信息、人和人交流的語言是信息、人們拍攝的視頻也是信息、人們每天買的東西也是信息。但嚴格來說,有了載體后的信息,就成為了內容。
同時,文字、圖像、音樂、人、物體等等都是內容。在信息技術出現(xiàn)前,人們無法將人和其可以產生的信息,比如說的話,穿的衣服等,直接作為內容進行傳播,如果想要和某人交流,只能前往拜訪,或等對方出現(xiàn)。
對于文字、圖像這一類本身就已經(jīng)是作為信息載體的內容,就可以再次通過其他工具進行內容集成,比如人們使用紙張、雕刻等方式進行多次傳播等。
2. 信息的形式
對于信息本身來說,處于底層的是邏輯類信息,能夠讓人以合理的方式認識并理解其他信息。
如果我們只有語言、文字、圖像、形狀、溫度等信息和內容,我們確實能直接獲取它們的信息,每個人也會有自己的理解方式對其進行描述。但如果不存在相似或者相同的邏輯部分,我們則無法和其他人對其進行交流。
邏輯類的信息往往不是處于物體表象層面的信息,而是在人們在理解和認知過程中的途徑和方式。
我們日常使用的語言則屬于自然語言,它是一種有窮語言。不同語言單位的發(fā)音,雖然各不相同,但語言的構成基礎音位是有限的,通常只有 40 個左右。同時,由于詞是通過有限個基礎音位構成的,所以構成任何一種自然語言文字的詞匯也是有限的。從而,對應的句子也是有限。
而在數(shù)學、邏輯和計算機科學中,形式語言則是通過精確的數(shù)學或機器可處理的公式來定義的語言。在形式語言的理論中,它是一個字母表上的某些有限長字符串的集合,一個形式語言可以包含無限多個字符串。
我們已經(jīng)知道,純粹的數(shù)學和邏輯語言無法在系統(tǒng)內描述系統(tǒng)本身,同時通過邏輯語言所表示的信息無法完整地表示不同語境下的信息內容。
除了使用不同系統(tǒng)內的邏輯,人們也通過類比、聯(lián)想等其他方式,快速地理解和認知其他信息。
在這個過程中,處于表層的文字、圖像、聲音信息,則最直接的獲取方式。除此之外,還有嗅覺、觸覺等形式的信息,來幫助我們對信息和內容的認知和理解。
技術的發(fā)展,使得我們可以將這些處于表層的信息進行通過更加穩(wěn)定且有效的方式進行傳播。從紙張到電報,再到網(wǎng)絡屏幕上的文字和圖像,我們不斷地將真實世界中物體的信息進行數(shù)字化處理,從而成為數(shù)字化的內容。
與此同時,真實物理世界中的人,他的信息和內容通過數(shù)據(jù)的方式上傳到網(wǎng)絡,成為數(shù)字化的內容。
由于技術的原因,我們暫時只能將一部分的信息數(shù)據(jù)化,比如基本信息(姓名、年齡、出生地等)、肖像信息(照片、視頻等)、偏好信息(瀏覽視頻的類型、標簽等)、行為信息(游戲中的走位)等,從而近似地還原人在虛擬世界中的形象。
3. 信息和數(shù)字內容的關系
之前我們提到,內容就是具備了載體的信息。討巧的地方在于,我們在真實世界中,了解人、物體和事情,也都是通過碎片化的信息進行認知的。
只不過在知識的學習、工作等這種場景下,為了提高信息接受的效率,我們都會將這些碎片化信息進行集成,形成系統(tǒng)化的信息。
網(wǎng)絡上的信息都是有載體的信息,所以廣義地看,他們都是內容。因此,在網(wǎng)絡中,人們和信息以及內容存在的關系,就變成了:
人 — 數(shù)字內容 — 數(shù)字內容 — 人
這是一個簡單的模型,不同的人將真實世界中的內容,轉換成了虛擬世界中的內容,這也代表了不同的人在網(wǎng)絡上的信息載體,可以是語音,可以是文字,也可以是圖片或視頻。
同時,由于數(shù)字信息可以被多次編輯與修改的特點,人們又會將虛擬世界中的信息進行再次加工,成為新的內容。
當然,不是所有信息都可以被修改,比如一些涉及真實性、保密性和唯一性的信息,就無法被修改,或者說需要權限。
人 — 數(shù)字內容 — 數(shù)字內容* — 數(shù)字內容 — 人
我們將被修改和編輯后的信息,稱為“數(shù)字內容*”。這些內容是在數(shù)字內容 1 或者 2 的基礎上進行修改的,人們同樣會和這些內容發(fā)生交互。這些內容是來源于真實世界的信息,所以歸類到數(shù)字化的真實世界中。
在真實世界中,當人們想要交流信息時,會有這么幾種情況:
一種是大家會聚集在一起,針對某個話題進行討論、發(fā)表見解,并且會記錄下來,以便有其他人可以更完整地了解他們討論的內容;
另一種情況是,其中某個人見解更多,大家都想來聽他分享,然后因此聚集起來,同時將其內容以紙的方式進行留存;
還有一種情況是,這個人有一些大家都想要獲取的特性,但無法同時讓每個人都獲得,所以會通過內容的方式,將其傳播出去。
內容天生就存在時效性,數(shù)字技術僅僅是賦予了時效性的可選擇性。人們可以主動地選擇將一部分內容設置為長時間存在,或將另一部分內容設置為閱后即焚。這也為內容的傳播形式提供了記錄的可能。
4. 數(shù)字內容的形式
從內容的生產角度來看,真實世界和虛擬世界的信息都可以被人或者機器進行提取和傳輸。
使用機器提取真實世界的信息,指的是給機器設定規(guī)則,在一定場景下,自動地按照規(guī)則去記錄識別并記錄文字、圖像、音樂等信息,并以內容的形式在虛擬世界中儲存與傳播。
而對于人來說,人可以使用終端來將真實世界的信息進行數(shù)字化,其實也隱含了一點:以自身的視角來進行這個過程。
這又回到了人身上,人看世界的方式是什么,就可以通過數(shù)字化的方式獲取什么信息。
根據(jù)美國哈佛商學院有關研究人員的分析表明,人的大腦每天通過五種感官接受外部信息,其比例分別為:味覺 1%、觸覺 1.5%、嗅覺 3.5%、聽覺 11%,以及視覺 83%。
從可行性的角度來說,味覺和嗅覺都需要特殊的分子才能感知,觸覺則需要對應工具對應實時控制才能感知到。而視覺和聽覺這兩種方式對于傳播和感知的要求是最低的,僅需要屏幕和發(fā)生器即可。
因此,文字輸入、拍照圖片、視頻錄制和音頻采樣成為了數(shù)字內容的最主要形式。當然我們也非常希望能在未來看到能夠將觸覺、嗅覺和味覺進行數(shù)字化傳播的方式,從而增加內容的形式,讓人能夠更加沉浸地感知到虛擬世界。
而對于在原生的虛擬世界中產生的內容,它們有著同樣的形式,但承載的信息的來源卻不同。
5. 數(shù)字內容和人的關系
當我們明確了數(shù)字內容的形式后,我們可以接著討論數(shù)字內容出現(xiàn)后,人和數(shù)字內容的關系,從而理解內容行業(yè)的產生與變遷。
最早,由于工具和載體的不先進,以及不同社會發(fā)展階段所對應的組織形式的不同,導致信息的生產最初僅來源于少數(shù)的人,然后人們再使用非數(shù)字化的載體進行信息的傳播,這會花費非常多的時間,信息無法做到快速、及時且穩(wěn)定的被更多的人接受。
這種用來擴大并延伸信息傳送的工具,就是媒介,它是使雙方發(fā)生關系的各種中介,如文字、聲音、圖形和圖像、動畫和視頻;在英文語境中,媒介稱為medium,指的是用來傳播的內容,或者說信息的物質載體。
而媒體則是承載媒介的載體,如報紙、廣播、電視、電影、游戲、網(wǎng)站、博客、微博、微信等,其中基于模擬媒質的稱為傳統(tǒng)媒體,基于數(shù)字媒質的稱為數(shù)字媒體。媒體對應的英文則是 medium 的復數(shù) media, 從詞義上理解,media 是所有媒介的集合,而不僅僅是大眾媒介的集合。
與此同時,媒質指的就是媒體的材質,如石碑、紙張、磁盤、光盤、磁帶、半導體存儲器、生物存儲器等,其中也可以分為模擬媒質和數(shù)字媒質。
事實上,媒體的形式,決定了媒介的傳播方式。信息技術出現(xiàn)前,媒體多是以印刷類的實體物體為主;而計算機和互聯(lián)網(wǎng)的出現(xiàn),則誕生了電子類媒體。由于技術的發(fā)展和普及程度,這種媒體形式一開始是中心化的,具備信息優(yōu)勢的人,會以自己為中心,通過網(wǎng)絡進行傳播,從而聚集對應的受眾和用戶。
當技術的突破使得人們能將更多的信息,以更有效的方式轉換成內容,再進行數(shù)字化處理,網(wǎng)絡世界中的信息體量會出現(xiàn)一次次的爆發(fā)增長,其增長的節(jié)奏則是通過人們對于信息和內容的供需變化來體現(xiàn)的。
最初當網(wǎng)站出現(xiàn)時,人們對于內容的質量要求并不高(或者說,人們對于高質量圖像、視頻等的實時交互需求尚未出現(xiàn)),所以相比起在個人主頁上發(fā)布自己對于某一個領域的信息,以中心化的方式進行信息整合與發(fā)布,會更有效率,且會有利可圖。
隨著媒體站點出現(xiàn)了集中式的爆發(fā),內容的供給也相應地大幅增加。為了讓人們能夠更加快速地找到目標信息,在門戶和網(wǎng)頁內容的基礎上,搜索引擎誕生了,這也極大的提高了人們獲取信息的效率。
這段時間也稱為內容的 1.0 時代。數(shù)字內容和人的關系是由內容的體量來驅動的,因此會受到很多外部因素的干擾,特別是過量的信息也使得內容對于人的持續(xù)吸引力不斷減弱,從而削弱數(shù)字內容和人的關系。
上面我們提到,人本身的信息可以被數(shù)字化,隨著圖文形式的信息變得不斷飽和,人們的需求從獲取信息變成交流。這和人們在真實世界中發(fā)生的過程是一致的:認識了世界后,就希望交流。
因此,在門戶網(wǎng)站和搜索引擎出現(xiàn)后,社交網(wǎng)絡的出現(xiàn)將人們連接了起來。人們通過網(wǎng)絡上各種的賬號,將自己的信息變成了數(shù)字化的內容。這些內容不僅包含了用戶的基本信息,也包含了人們與真實世界所發(fā)生的交互內容。
互聯(lián)網(wǎng)將人與人之間的信息交互變得更加的快速,人們也逐漸把真實世界中的社交關系搬到了數(shù)字世界中。
這里需要明確的一點是,我們在真實世界中的社交中,想要獲取的是人本身的屬性,以及人所產生的信息和內容。
社交網(wǎng)絡將一部分人的屬性和其內容進行了數(shù)字化,讓我們可以更快速和高效的方式獲取這部分信息,而其他部分的屬性則無法被數(shù)字化。
同時,社交網(wǎng)絡由于其社交的屬性,將不同的人們基于他們身邊的一層層關系所聯(lián)系起來,所以社交網(wǎng)絡本身對真實世界中的人脈關系具有高度依賴性。
社交網(wǎng)絡關注的重點,不在純粹的內容身上,也不在純粹的人身上,在依附于人脈關系所產生的內容上。這些內容具備這種特性,使得人們將通過數(shù)字化的交互轉換為在真實世界中的交互。
與社交網(wǎng)絡同時期誕生的還有社交媒體,這兩類形式組成了內容 2.0 時代的兩條不同發(fā)展思路。
相同點在于,人們將關注點從內容本身轉移到人身上,具體來說,是和人相關的內容被強調出來。不同點則是,社交網(wǎng)絡的路徑是“先有人再有內容”,而社交媒體的路徑是“先有內容再有人”。
由于數(shù)字內容本身就具有媒體的屬性,而網(wǎng)絡又將人之間的距離變得非常近,所以社交媒體和社交網(wǎng)絡之間都具備彼此的一些屬性。
同時,社交媒體的重心是在媒體式的中心化內容,而不是建立在人脈關系上的去中心化內容。因此,社交媒體其實是將真實世界中人根據(jù)影響力分層,由高到低地建立媒體內容,并持續(xù)地通過人進行數(shù)字內容的增加。
而社交網(wǎng)絡則是以更加平等的方式從每個人身上獲取數(shù)字內容。在這個過程中,會有人因為自己產出的內容而被更多人關注,從而脫穎而出,并具有了媒體的屬性。
在這個過程中,無論是社交媒體、社交網(wǎng)絡還是自媒體,一開始都會盡可能地將各種不同領域、不同形式的內容放在同一個體系存在,從而更好地吸引用戶。
隨著人和內容形成的組織不斷擴大,內容的質量就會下降。當用戶對壞內容的忍耐程度大于其從內容中獲得價值時,他就會離開并尋找其他內容的聚集地。
對于社交媒體來說,應對這種情況的方式其實一種 trade-off 策略。由于它關注的是整個社交媒體的生命力,而不是單純的內容吸引力,所以它的策略會傾向于頭部用戶產出的媒體屬性內容和尾部用戶產出的媒體屬性內容,這也是兩種比較極端的內容質量。
中間這部分用戶則會有一部分向更加垂直的內容聚集地轉移,成為社區(qū)。
因此,社區(qū)和社交媒體的相同點是,都是以內容為核心導向的場所。當然社區(qū)也可以由非常多的不同領域內容組成,但社區(qū)和社交媒體的區(qū)別在于:社區(qū)的標志是平等,不會因為用戶影響力的大小從而影響到內容的分發(fā)。
用戶自己對不同主題、不同人的內容進行選擇,并在平等的交流關系下,基于內容產生多對多的網(wǎng)狀式交互。
不同的地方在于,社交媒體加入了自媒體后,中心化和去中心化的傳播會共存。但在發(fā)展初期,中心化的傳播影響力會占據(jù)社交媒體中更主要的位置,而社區(qū)的傳播則更加扁平。
當越來越多的人有了媒體的屬性時,自媒體就從社交網(wǎng)絡中誕生了。
事實上,從自媒體的定義來看,它是指大眾化的傳播者借助網(wǎng)絡手段,向不特定的大多數(shù)人或者特定的單個人傳遞信息和內容。因此,只要給用戶提供了內容傳播的工具,用戶就能在任何地方成為自媒體。
所以問題在于,為什么自媒體會優(yōu)先誕生在社交網(wǎng)絡?其實這個問題也非常好回答。在不同的用戶和內容之間,平等的關系更利于自媒體的出現(xiàn)。如果事先存在有影響力的權威媒體,個人對于內容的發(fā)布會天然受到現(xiàn)有媒體的壓制,從而無法快速地形成規(guī)?;膫鞑ァ?/p>
雖然在初期用戶會選擇使用社交媒體來發(fā)布內容,嘗試利用已有的用戶體量來幫助自己建立一個內心里,但事實證明,總的來說有三種方式能夠幫助自媒體進行傳播:
在社交媒體中,基于已有的關系鏈或其他因素,在社交媒體中的自媒體能夠接觸頭部或權威媒體的影響力快速成長。
在社區(qū)中,通過對某一個領域或話題的持續(xù)貢獻,從而成為社區(qū)內的自媒體。
在社交網(wǎng)絡中,使用更加廣泛的方式,持續(xù)地將關系鏈傳播和延伸。
從整體來看,任意一種方式都能夠給自媒體帶來成長。相對來說,社交媒體上的自媒體,更多是依賴于整體的用戶體量。而自媒體內容的出現(xiàn)使得用戶能夠通過自媒體的內容,和自媒體建立一定程度的社交關系,這種關系比基于任意一個用戶的內容所建立的關系要強,但又比基于頭部媒體或 KOL 的內容所建立的關系要弱。
具有更加平等的內容交互的社區(qū),事實上已經(jīng)對用戶和內容進行了限制,因此自媒體對于社區(qū)來說更多的是已有關系的重疊,而不是帶來新的交互方式。
同時,社交網(wǎng)絡中的關系鏈,也為自媒體誕生的信息增加了信任度,從而讓自媒體內容獲得更有效和快速的傳播。正因如此,社交網(wǎng)絡+自媒體的組合,也帶有了社交媒體的一些屬性。
隨著內容不斷的增加,其包含的維度領域越來越多。用戶對于某一類內容的需求和對內容獲取的時效需求也日益上升,也進一步推動了內容的細分化。
與此同時,原有的用戶組織結構也相應的被進一步細分化和碎片化,并誕生了更小形式的圈子和社群。社群往往以人為核心,核心人物如果不再付出,社群的生命力就會日漸消亡。
當內容的密集程度以及和人的交互頻次變得更高時(實時或近似于實時),媒體的形式就會發(fā)生改變。
人們如果和來源于真實世界中的信息進行深度交互,則會是直播這樣的形式,而如果是和來源于虛擬世界中的信息進行深度交互,則會是游戲這種形式。
相比起媒體、社區(qū)、社交網(wǎng)絡里的內容,游戲的內容會給用戶帶來更高的信息密度、更深的信息交互、更頻繁的交互次數(shù)。當然,游戲這種內容也需要更多的投入、花費更長的時間才能生產,這一點和影視、動畫會更相似。
這種創(chuàng)意類的內容,不僅需要人們以某種方式將真實世界進行數(shù)字化,更需要人們在虛擬世界中創(chuàng)造原生的內容,再將其二者結合形成全新的數(shù)字內容。
數(shù)字化的內容無論是在信息體量、編輯性等層面,都遠超來源于真實世界的內容,它們不僅僅是圖文或視頻流,而是可以實時地進行動態(tài)可交互的內容,這必然會對人們的生產能力提出了更高的要求。
站在內容的角度來說,文字、圖片、長短視頻等不同媒介的形式,決定了內容的呈現(xiàn)方式,也就在媒體、社區(qū)等產品形式中,影響了用戶和內容之間的關系和交互方式。
現(xiàn)階段的各種媒體、社區(qū)、社交網(wǎng)絡上的內容,每天都產生巨量的內容,以至于基于社交關系鏈傳播的信息也已經(jīng)無法確保是自己想看的內容,從而人們開始使用機器去分析用戶的偏好,并更加高效地讓信息去找人。
創(chuàng)意內容和游戲內容都具有結構化的數(shù)據(jù),長遠來看,這也為人們使用機器來生成內容提供了基礎。而在更近的未來,機器將會協(xié)同用戶產生更加動態(tài)和豐富的內容。
二、內容生成的發(fā)展邏輯
1. 內容生成的不同階段
云和 AI 技術的發(fā)展,讓社交和娛樂方式發(fā)生了一個微妙但重要的轉變:從以事件為中心而展開的傳統(tǒng)互動,轉向到以人為中心的自發(fā)互動。
隨著用戶生成內容(UGC)的激增以及 AI 技術逐漸成為創(chuàng)意實現(xiàn)的工具和過程本身,我們在使用新方法創(chuàng)建內容時,也會解鎖新型的媒體、社交、社區(qū)和游戲等體驗。
如果將內容的體量、內容的生產方式和內容的主要表現(xiàn)形式同時考慮,我們能得到這樣的一個結構:
事實上,目前我們處于上述第 1 和第 2 階段。當前娛樂行業(yè)中的大部分電視、電影、音樂和游戲,都是由大規(guī)模的專業(yè)創(chuàng)意團隊所創(chuàng)建的。這些產品大多數(shù)都是針對單人的體驗而開發(fā)的,這意味著:當我們在產品中增加同時參與內容交互的用戶時,這些體驗實際上并沒有改變。
正如上文所說,當前市場中大部分的專業(yè)新聞媒體、流媒體、非沙盒類游戲等內容都屬于第 1 階段,自媒體、沙盒游戲等內容則屬于第 2 階段,而更廣泛意義上的社交媒體、社交網(wǎng)絡和社區(qū)則會同時橫跨 1 和 2 階段。
當然,ABC 技術(AI, Big Data, Cloud)已經(jīng)被逐漸地應用到行業(yè)中,在一定的規(guī)則和約束下,協(xié)助人們更有效率地生成數(shù)字內容,這也是第 3 階段所描述的內容生成。
在 AI 、云計算和大數(shù)據(jù)的支持下,這部分內容將會是天然的動態(tài)生成,也因此能夠同時適應多人的動態(tài)體驗。
第 4 部分則是完全由 AI 自動生成大量且豐富的內容,從而支持 Metaverse 中用戶的內容消耗需求。
《GTA 5》的開發(fā)周期長達 5 年,總共資金投入預計為 2.66 億美元,有超過 1000 名開發(fā)人員參與到制作中。而元宇宙的容量可能會是《GTA 5》的數(shù)百萬倍以上,并且還是多人實時動態(tài)交互的。因此,元宇宙的誕生和持續(xù)運行,必須使用 AI 來進行內容的生成。
從真實世界和虛擬世界的發(fā)展光譜來看,第 123 階段都屬于數(shù)字化的真實世界,而第 4 階段則完全屬于原生的虛擬世界。
2. 與 AI 一起共同創(chuàng)造
我們知道,無論是媒體還是社區(qū),都依賴于用戶所產出的數(shù)字化內容。
為了將這部分內容更快速且有差異化的方式進行生成,計算機視覺技術使得我們能快速的將真實世界的信息,通過照片和視頻的方式傳輸?shù)綌?shù)字世界中,并在計算機圖像技術的幫助下,我們能在任何一塊屏幕上看到這些內容。
在階段 1 和 2 制作,只有少數(shù)的人是內容的生產者(相對來說)。但 AI 能夠讓內容的生成變得更加的民主化,進一步降低內容創(chuàng)造的門檻,將其變得更加簡單。
有了 AI 工具的協(xié)助,更多的人會成為創(chuàng)意工作者。我們能以輕量化和模塊化的方式,將具體的指令、圖像和邏輯處理方式,轉換為可投入生產的資產,從而極大地減輕了編碼、繪圖、動畫等工作的負擔。
我們知道,邏輯是決策的依據(jù),語言、動作和聽力是這種依據(jù)的傳遞對象;而文字、圖像和音樂則是媒介,我們可以通過數(shù)字化的方式將其呈現(xiàn)在屏幕上。因此,機器能生成的數(shù)字內容分為邏輯(RL/SL/USL)、語言(NLG+TTS)、動作(MG+CG)等。
OpenAI 在今年發(fā)布的 GPT-3 支持多模態(tài)的人機交互,并非常動態(tài)地進行學習,能生成遠超 GPT-2 表現(xiàn)的文字。而 TTS、NLG、MG 等則是讓機器能夠生成對應的媒介。
與此同時,AI 能通過理解游戲或電影劇本的信息,快速學習劇本內容,在給定的限制條件下,生成合理的劇情線以及對應 NPC 的對話與翻譯。
事實上,與通用人工智能不同的點在于,雖然看起來游戲或電影的內容非常宏大,但事實上劇本可能就幾百頁,其包含的信息量是可以接受的。
Morpheus Cloud - Storyline/Dialogue Generation
在給定知識框架下的,AI 變得能逐漸地理解創(chuàng)作者的意圖,不僅能控制 NPC 對用戶交互的不同反應,也能從而與用戶一起創(chuàng)造個性化的遭遇和動態(tài)的劇情內容。
除此之外,如果把劇情或者敘事看成廣義的內容,那么人們可以在 AI 的協(xié)助下,可以將現(xiàn)有的圖文和視頻內容升級成實時交互的內容。無論是物體還是虛擬形象,內容中的一切也將逐漸實現(xiàn)“萬物可交互”。
傳統(tǒng)的數(shù)字化內容的確包含人的數(shù)字化,從而我們可以使用數(shù)字化的形象,并在虛擬世界進行內容的交互。
當 AI 打造的智能體能主動參與虛擬世界的變化和與真實世界的交互中時,它就成了“虛擬人”。
由于虛擬人本身就是數(shù)字內容,所以當具有一定智能的“虛擬人”出現(xiàn)后,由于他們能自主地產生并改變一定程度的數(shù)字內容。這時,媒體的生產關系和人們對于內容的供需關系就會發(fā)生變化。
在 AI 的協(xié)助下,這些由“虛擬人”所產生的內容,能比真人媒體從業(yè)者更具時效性和規(guī)模性。因此,首先變化的會是社交媒體的形式和內容。其次,社交媒體的內容變化將會帶來用戶組織結構的變化,從而影響社交關系鏈的變化。
在這個基礎上,當真實世界中的我們建立了社交關系,很可能是因為某個“虛擬人”在和另外一個“虛擬人”互動時,提起真實世界的雙方,從而誕生新的社交場景和新的社交網(wǎng)絡。
當然,會同步改變的還有社區(qū)的形態(tài)。AI 學習的數(shù)據(jù)不僅是結構化的,也是嚴格平等的。
因此對于“虛擬人”來說,社區(qū)的話題、內容和領域是完全可以被他們所掌握和生成的。我們可以大膽設想,當真人在一個由虛擬人組成的社區(qū)中,會和虛擬人產生的內容發(fā)生怎么樣的交互?假如這些內容是來源于游戲,我們是否可以直接進入到游戲中和社區(qū)中的虛擬用戶進行對戰(zhàn)和游玩?這是否帶來了新的游戲入口和場景?...
事實上,AI 除了需要在邏輯端進行決策的生成,更需要將這一類更高級的指令傳遞給圖像,讓圖像根據(jù)人的交互運動起來。
深度學習可以在讓 AI 控制的角色運動變得更加連貫和順暢,人們可以在其運動的過程中通過調整各種參數(shù),使其表現(xiàn)出不同的效果。
Morpheus Cloud - walkAI
另外,人們同樣在嘗試使用 AI 來生成數(shù)字化的音樂和藝術。OpenAI 發(fā)布的音樂生成系統(tǒng) Jukebox 是個神經(jīng)網(wǎng)絡系統(tǒng)。通過不同流派、藝術家和歌詞作為輸入,Jukebox 能夠輸出從零開始創(chuàng)作的新音樂樣本。對于藝術來說,人們通常把使用 GAN 技術生成的藝術統(tǒng)稱為 GAN 主義藝術(GANism)。
在 2018 年,Adobe 舉辦的發(fā)布會,真實地展示了如何將 AI 運用在藝術與設計中。無論是 Fast Mask 實現(xiàn)的智能摳圖,還是能夠將靜態(tài)圖片生成動態(tài)視頻的 Moving Stills,還是各種藝術字體的自動生成等等,無不讓現(xiàn)在的設計師和藝術家們瞠目結舌。
Adobe - Moving Stills
三、消費科技如何改變內容生成?
1. 打造更具交互性的媒體內容
當前媒體幾乎已經(jīng)都有了數(shù)字化的產品,傳統(tǒng)的紙質媒體也有了電子版,同時它們也開拓了新媒體的傳播方式,通過數(shù)字化的創(chuàng)作將文字、圖片、長短視頻等方式融入到了內容中。
對于具有獨立站點的媒體來說,選擇當下用戶聚集的平臺幾乎是必須的選擇。無論是自媒體還是社交媒體,作為媒體的核心命題是:如何用更少的投入和花費,換取大的傳播影響力?
而任何一個帶有媒體屬性的平臺都會考慮接下來的一個問題:如何幫助創(chuàng)作者在保持內容差異化的同時,提高內容產出效率?
事實上,在圖文時代,平臺基本都會提供富文本編輯器;而在(短)視頻時代,平臺工具屬性的強弱決定了用戶能使用其產生內容的豐富程度和效率。
而視頻的核心就在于視覺效果,因此計算機視覺技術在這個領域能夠充分的發(fā)揮出潛力,讓各式各樣的視覺效果以更簡單和有效的方式加在錄制的視頻上或直播中。
工具為平臺積累了初期用戶,再通過將其內容沉淀下來,通過算法或其他機制進行分發(fā)與推送,這樣一個同時帶有媒體屬性的內容產品就出現(xiàn)了。
這樣的內容產品,究竟是要走向社交媒體還是社區(qū),得根據(jù)內容和交互是偏向用戶還是內容本身,才能進行判斷。如果是用戶,則是社交媒體屬性;而如果是內容,就是社區(qū)導向。
對于媒介來說,視頻之后就是實時互動的沉浸體驗,或者內容的交互對象變成了虛擬世界的智能體。由于在數(shù)字內容中,游戲的交互性和沉浸性是最強的,因此前者的方式更多可能是實時的游戲社區(qū),或者將游戲化的交互方式帶入媒體產品。
而后者則由于虛擬人本身就是數(shù)字內容,當具有一定智能的“虛擬人”出現(xiàn)后,由于他們能自主地產生并改變一定程度的數(shù)字內容,媒體的生產關系和人們對于內容的供需關系就會發(fā)生變化,這也就帶來了新的交互關系。
同時,我們也能看到,從傳統(tǒng)的電視內容和新聞媒體,到現(xiàn)在的短視頻和作為媒體的內容,其創(chuàng)作門檻和傳播機制,變得越來越自動化和輕量化。這正是技術的功勞,它讓內容生成和分發(fā)變得更加智能,從而釋放了用戶的內容創(chuàng)造力,讓每個人都能夠以非常便捷且高效的方式創(chuàng)作實時互動的內容。
在交互性上來說,YouTube 的交互更像是把傳統(tǒng)電視的遙控器搬到了屏幕中。
雖然 UGC 給 YouTube 帶來了非常多的內容體量,但用戶和內容的交互還是基于傳統(tǒng)的“搜索+推薦”的邏輯。
作為長視頻的標桿,YouTube 是一個幾乎不用交網(wǎng)費的視頻網(wǎng)站,因為其最大優(yōu)勢其實是 Google Peering 為 YouTube 提供的免費帶寬。從專業(yè)的媒體記者到大街上的任意一個人,只要想通過網(wǎng)絡以視頻的方式創(chuàng)作并分享內容,無論視頻有多長,YouTube 都給你提供高清、高碼率、高通達的技術服務。
因此,YouTube 對內容創(chuàng)作者是純粹的后付費,它也幾乎不會出現(xiàn)國內視頻網(wǎng)站那樣,越過和創(chuàng)作者的分成計劃,直接為高價值的內容生產者支付高額簽約費。
而在中國是否能用 YouTube 的邏輯去重現(xiàn)呢?答案其實非常明顯。在中國,帶寬、云計算和其他數(shù)據(jù)成本無法以最直接的方式被企業(yè)所降低,因此要么限制內容的時長,要么需要使用其他方式進行商業(yè)化。
我們也能看到很多做視頻導向的媒體和社區(qū),一開始都會講一個燒錢積累用戶,然后對用戶進行商業(yè)化變現(xiàn)的故事。但并不是所有企業(yè)都能把這個故事實現(xiàn),因為這不僅僅和技術相關,更多會和用戶和內容本身的交互相關。
對于 TikTok 來說,短視頻的確為其在帶寬成本上降低了很大一部分,同時也把實時的交互融入了用戶的觀看體驗中,而不是像圖文一樣,將用戶和內容的交互限制在評論中。用戶可以隨意滾動與瀏覽視頻,并快速且簡單地對他們喜歡的視頻進行交互。
事實上,TikTok 從根本上改變了我們對內容的思考方式,內容將不再是我們被動接受的東西。簡單且沉浸的交互方式配合極強的推薦算法,能夠讓我們不間斷地在不同人創(chuàng)造的內容世界中體驗。一旦不喜歡,就可以快速抽離,系統(tǒng)也會重新推薦內容。
如果不把 TikTok 看成一個媒體或者社區(qū),而將其看成一種游戲化的入口,不僅通向各種數(shù)字化的真實世界,也通向了原生的虛擬世界。長視頻和短視頻是不同類別內容的不同互動形式,只不過短視頻能夠以更快的刷新頻次,主動地與用戶進行交互。
我們也能看到,當用戶在生產這一類的視頻內容時,會使用各種圖像和視覺技術,快速的實現(xiàn)內容的差異化。這些技術或者說視覺效果,在協(xié)助單個內容的生成時,也帶有了社交屬性,大家都可以使用這樣的效果來分享不同的內容。
也就是說,在生成內容時,技術能在內容和用戶之間創(chuàng)造更多的交互方式,進一步增加內容的多樣性。同時,技術能讓用戶和內容的交互變得更加的動態(tài),不斷地創(chuàng)造玩家喜歡的內容。
討巧的點在于,無論是長視頻還是短視頻,用戶也許無法在某一個視頻內容中體驗到動態(tài)的內容生成,但可以在同樣的主題、音樂和滾動播放中,不斷地感受到不同內容的動態(tài)出現(xiàn)。
讓用戶在內容的外部感受到動態(tài)交互,其實就是推薦算法等技術所實現(xiàn)的。
如果用戶希望在內容的內部進行更深層的動態(tài)交互,那么我們需要技術去理解內容的邏輯,而不僅僅是在視覺和圖像層面將內容變得不一樣。
這就需要更多的 AI 技術來實現(xiàn):邏輯端的決策生成以及邏輯和圖像動作之間的動態(tài)交互。
當內容生成的邏輯被實現(xiàn),我們可以認為,這種邏輯和決策能夠支持用戶和任何一個視頻甚至實時的直播內容進行個性化且動態(tài)的交互,通過自動地生成內容、延伸內容的深度,不斷地給用戶帶來更加沉浸的內容體驗。
有趣的是,具有高度動態(tài)且個性化交互的內容,我們稱之為:游戲。
2. 不斷游戲化的內容和社交關系
在這個時代里,隨著真實世界的不斷數(shù)字化以及原生虛擬世界的靠近,人們的娛樂方式逐漸從線下轉移到線上的泛娛樂產品。作為現(xiàn)代大眾最重要的娛樂方式之一,游戲已然成為繼文字、圖片、視頻之后,新的大眾傳播媒介。
數(shù)字技術使得游戲從一種真實世界中的物理媒體,逐漸演變?yōu)榫哂谢有缘臄?shù)字化內容。作為內容的游戲,有著高密度的內容以及自由的交互,讓玩家在不同的機制和玩法中,愉快地交出了自己的時間。
作為游戲的內容,或者說“游戲化的內容”,指的是將游戲機制和玩法,運用到其他領域來引導用戶和內容進行更加深度的互動。
和其他媒體相比,游戲會使用最先進的技術來吸引觀眾和玩家,并且給予玩家遠超文字、圖片、視頻的沉浸式交互體驗。
事實上,游戲幾乎可以包含所有的數(shù)字內容交互方式,同時我們可以將視頻看成無法交互的游戲片段,把圖片看成游戲中靜態(tài)的某一幀,把文字看成游戲劇本或者某一個描述。雖然這樣的描述會帶有些許電影的元素,但數(shù)字化的游戲和電影在往同樣的方向發(fā)展。
與電影所展現(xiàn)的導演或編劇的意志不同的是,游戲誕生第一天起,它就所代表了個性化交互與體驗。不斷突破的技術,在讓游戲本身變得越來越沉浸和自由的同時,也將游戲所包含的互動方式和社交潛力,帶給了其他行業(yè)。
隨著 Fortnite,Roblox,王者榮耀等游戲的出現(xiàn),下一代的游戲,不僅僅是作為內容的游戲,而將更多成為社交關系的新載體。
用戶在游戲中能進行個性化的創(chuàng)造,制作自己的劇情、角色等體驗并分享給其他人。在虛擬世界中兩個完全不相識的人,將在共同體驗游戲內容的同時,進行社交與其他行為,這也為下一代的消費提供了源源不斷的新場景。
值得我們注意的是,在不斷走向完全由 AI 驅動的 Metaverse 的過程中,下一代的游戲和內容將由 AI 和人共同驅動。同時,我們的社交方式會因為 AI 所生成的內容而改變。
在獲得更多的內容供給時,我們會轉向自己的需求。
如果在真實世界中一樣,我們每天的遭遇并不是提前設定好的,都是基于一些獨立而隨機的事件來驅動我們的探索,在以游戲為代表的虛擬世界中,我們可以與朋友一起自由地探索虛擬的內容。
過去我們在各種社交軟件上認識了新朋友后,我們會邀請他們一起玩游戲從而增進關系;但現(xiàn)在,更多的情況是,我們在游戲中直接認識新朋友,并在一起體驗的過程中進行社交。
游戲內的社交會發(fā)生的非常自然,用戶不再需要去強迫自己接受社交。每個人都有屬于自己的角色和狀態(tài),同時游戲本身也會為用戶提供各式各樣的場景和話題,這也為用戶提供了現(xiàn)成的社交環(huán)境。
用戶之間為了實現(xiàn)各自的目標,需要與其他玩家和虛擬人物建立聯(lián)系并互動。
與此同時,AI 除了能協(xié)助我們實現(xiàn)場景和劇情的個性化生成,為我們提供社交的必要環(huán)境和動力,也能打造數(shù)字世界中的虛擬人,為我們帶來新的社交關系與對應的場景。
事實上,除了頂級明星外,大部分明星的粉絲數(shù)量甚至不如游戲、漫畫等虛擬內容中的角色的多。
以強化學習為代表的 AI 技術,在可預見的未來里,能夠使用游戲中玩家的行為數(shù)據(jù)來進行訓練和迭代,從而能夠在限定的泛娛樂領域中打造真正智能的虛擬角色,帶來新的社交體驗。
寫在最后
正如 a16z 的 Jon Lai 所說:
“關于元宇宙的最令人興奮的部分,不是我們如何從技術上構建它,而是它具有改變我們彼此社交方式與社會形態(tài)的潛力”。
技術將在虛擬世界中為人們帶來新的社交關系,也會帶來新的生產關系。自動化生成的內容體量正在加速爆發(fā),我們當前所處的 UGC 和 PGC 時代很快將會過去,人類會和 AI 將會共同創(chuàng)造更加動態(tài)、豐富且個性化的內容。
今天我們認為的媒體、游戲、社交等概念,將會在不遠的未來被新的概念所替代,虛擬世界中的社交互動將具備更類似于現(xiàn)實世界中的隨機性和偶然性。
Fortnite - Travis Scott
如果有這樣的一個問題:元宇宙最有可能發(fā)生在哪一個領域?
從當下的角度來看,也許是游戲領域;在技術的支持下,當游戲化的動態(tài)交互內容在各行業(yè)涌現(xiàn)時,我們會發(fā)現(xiàn),其實是整個社會在共同向元宇宙發(fā)展。
事實上,我們也可以將“社會”看成一個由人和生活組成的內容產品,這也是一個永遠會被普遍需要的產品。當技術進步能夠滿足新的需求時,產品當然也需要迭代和更新。
我們在渴望被連接的同時,也在不斷地嘗試超越連接本身。
本文來自微信公眾號:rct studio