本資料來源于公司公告,相關(guān)新聞,機(jī)構(gòu)公開研究報(bào)告以及社交媒體網(wǎng)絡(luò)等,對(duì)文中提到的行業(yè)及個(gè)股不構(gòu)成投資建議,圖文如有侵權(quán)或違反信批請(qǐng)后臺(tái)留言聯(lián)系刪除。專家表示下一代大模型正在研發(fā)中,原計(jì)劃是近期發(fā)布,但在準(zhǔn)確率方面遇到了一些阻力,沒有達(dá)到標(biāo)準(zhǔn),所以重新開始返工,包括重新標(biāo)注和再次訓(xùn)練。同時(shí)在多模態(tài)和視頻圖像方面也遇到了一些困難,原計(jì)劃是年底發(fā)布,但現(xiàn)在看可能會(huì)延至明年年初。具體問題在于如何理解圖像,目前在這方面遇到了一些問題。因?yàn)樵械膱D像理解是基于已有的圖像素材和標(biāo)庫,但目前要做的是理解更廣泛范圍的圖像。比如Bing上的圖像大部分都有標(biāo)簽,是基本可以理解的,但對(duì)于些抽象的圖片,如摳圖和實(shí)時(shí)路面信息等,這些邊緣Case在Bing上的圖片庫就無法支撐,因?yàn)樗鼈儍H包含原始圖像,沒有進(jìn)行大量的摳圖和其他標(biāo)注,所以當(dāng)前面臨的問題是這些原始圖像無法滿足GPT模型的要求,準(zhǔn)確率無法達(dá)到標(biāo)準(zhǔn)。原本計(jì)劃是使用一種特殊的算法模型進(jìn)行語義理解,但實(shí)際上沒有達(dá)到要求,所以研發(fā)部分重新推翻了理論,重新進(jìn)行摳圖標(biāo)注與市面上一些圖像模型,如difusion相比,OpenAl主要是希望找到圖像之間的內(nèi)在關(guān)聯(lián),而不僅僅是通過標(biāo)簽的形式。因此,除了標(biāo)注還需要進(jìn)行二次訓(xùn)練,所以整體時(shí)間延長(zhǎng)了。相應(yīng)工作更偏向工程和算法邏輯方面,因此不確定是否能按原計(jì)劃進(jìn)行發(fā)布,目前看來可能會(huì)延期。2、在模型研發(fā)方面,微軟針對(duì)通用大模型及行業(yè)相關(guān)模型的發(fā)展策略微軟之前與行業(yè)結(jié)合較少,許多公司沒有充分利用微軟的GPT能力。然而隨著微軟云服務(wù)的加 入,許多科技公司和傳統(tǒng)公司都開始接入微軟的云上GPT。一些代表性的企業(yè)也已經(jīng)接入了微軟的服務(wù),在這種情況下,據(jù)專家了解,微軟已經(jīng)選出了大約20多家企業(yè),將首先與他們整合數(shù)據(jù),然后一起探索算法上的突破。除此之外還是延續(xù)之前的研發(fā)思路進(jìn)行研發(fā)工作3、微軟之前單獨(dú)為OpenAI建立了算力的供給,目前相應(yīng)算力供給的增長(zhǎng)情況微軟目前給Open Al的算力供給基本保持不變,之前供給的算力目前來看是足夠支撐當(dāng)前的研發(fā)情況。然而目前的算力并不足以支撐GPT5的強(qiáng)化訓(xùn)練和后續(xù)的上線運(yùn)行,因此微軟正在準(zhǔn)備組裝一個(gè)超級(jí)計(jì)算平臺(tái),以進(jìn)一步滿足未來的需求。目前大約有8萬個(gè)A100芯片,但到今年年底預(yù)計(jì)就不夠用了。所以計(jì)劃擴(kuò)展供給額外提供3萬個(gè)英偉達(dá)芯片的算力,對(duì)應(yīng)年底可能會(huì)達(dá)到11萬個(gè)A100芯片實(shí)際上OpenAl的需求是增加10萬個(gè)芯片,但由于合作中涉及到許多資源和成本,所以最終的判斷是先增加3萬個(gè),這是基于微軟現(xiàn)有算力的實(shí)際使用情況和未來的增長(zhǎng)預(yù)測(cè)。之所以O(shè)penAl希望更多,是因?yàn)樗麄冋J(rèn)為可以在更多領(lǐng)域進(jìn)行嘗試,擴(kuò)大范圍,包括提升整體的運(yùn)算速度。但實(shí)際上,微軟的科學(xué)家判斷提升可能并不會(huì)太多。因此最終與他們商定的是先提供3萬塊。5、GPT5相對(duì)于GPT4具體的更新(參數(shù)數(shù)據(jù)量能力更新等)GPT4的參數(shù)量大約是1.9萬億,模型層數(shù)是100多層。GPT5目前正在開發(fā)中,參數(shù)量預(yù)計(jì)將達(dá)到10萬億級(jí)別,層數(shù)將超過1000層,大概是1300多層。目前在視頻數(shù)據(jù)量方面仍然比較有限,因?yàn)槭褂玫氖墙?jīng)過壓縮的視頻進(jìn)行訓(xùn)練,所以整體上相對(duì)較小。同時(shí)正在不斷增加數(shù)據(jù)量,當(dāng)前大約使用了5800億個(gè)視頻作為訓(xùn)練數(shù)據(jù),大約110萬億兆左右。6、谷歌和Meta做多模態(tài)是否相比OpenAI會(huì)更有優(yōu)勢(shì),比如其視頻語料庫相對(duì)充足谷歌和Meta在處理視頻方面具有一定的優(yōu)勢(shì)。目前微軟通過Bing上的視頻和與許多合作供應(yīng)商合作來獲取視頻資源,雖然視頻數(shù)量還不如META和谷歌,但在整體起跑線上,差距并不絕對(duì)明顯。因?yàn)樵陂_發(fā)新一代算法時(shí),大家都需要對(duì)現(xiàn)有的積累進(jìn)行大量改造。因此,在可用的視頻范圍和數(shù)量方面,與頭部差距大約是10倍左右。因此不會(huì)有質(zhì)的差異,但谷歌和Meta確實(shí)會(huì)有一定的競(jìng)爭(zhēng)優(yōu)勢(shì)7、目前微軟或者OpenAI的視頻生成路徑,是直接生成視頻還是通過圖片拼接的方式現(xiàn)在大家基本上都是通過逐幀生成視頻,原理差別不大,目前主流的技術(shù)都是如此。所以在中短期內(nèi),視頻可能會(huì)比較短,但OpenAI已經(jīng)成功生成了大約15分鐘長(zhǎng)的動(dòng)畫片,特別是科幻動(dòng)畫片,可以看作是目前的主要應(yīng)用領(lǐng)域。目前主要的瓶頸在于視頻生成的合理性,因?yàn)樯傻囊曨l越長(zhǎng),越容易出現(xiàn)不合理的情況。其次受限于目前的算力,不可能同時(shí)支持大量視頻的生成,但在技術(shù)上并不存在算法瓶頸,也就是生成成視頻的算法技術(shù)問題。因此理論上生成視頻更話用于短視頻生成,因?yàn)闀r(shí)間較短,但實(shí)際上它也可以用于生成長(zhǎng)視頻和電影等。同時(shí)現(xiàn)在有很多的方式可以規(guī)避生成視頻的跑偏與中斷,比如通過擬合和現(xiàn)有的視頻素材,包括比較強(qiáng)的糾偏等,當(dāng)前主要問題還是算力方面的支撐不夠。8、目前生成多長(zhǎng)的視頻可能效果會(huì)好一些,時(shí)長(zhǎng)到達(dá)多長(zhǎng)以后可能效果可能會(huì)弱一些目前生成兩分鐘內(nèi)的視頻是沒有問題的,比如合理性等都沒有太大的問題,準(zhǔn)確率可以達(dá)到95%以上。但是隨著生成時(shí)間的延長(zhǎng),比如一兩個(gè)小時(shí)的視頻,其中包含錯(cuò)誤信息的概率就大大增 加,大約占到20%~30%左右,這些錯(cuò)誤信息很可能是與現(xiàn)實(shí)邏輯不符合的情況。因此,目前更推薦生成兩分鐘以內(nèi)的視頻。在內(nèi)容素材方面,目前更容易生成動(dòng)畫、簡(jiǎn)單場(chǎng)景的機(jī)械運(yùn)動(dòng)以及已有素材的組合。比如可以剪輯一個(gè)新聞的片子,即使是已有素材的視頻形式的組合,過程中不僅僅是簡(jiǎn)單的疊加或是拼湊幾張圖片,而是會(huì)加入一些中轉(zhuǎn)效果、穿插以及從庫中選擇其他視頻片段進(jìn)行拼接等。然而對(duì)于一些復(fù)雜的場(chǎng)景,比如生成真人動(dòng)作電影,目前難度非常大。
9、多模態(tài)模型后續(xù)的發(fā)展方向,是否需要在模型底層邏輯或結(jié)構(gòu)上進(jìn)行調(diào)整針對(duì)實(shí)現(xiàn)識(shí)別和生成視頻的問題,有幾個(gè)方向可以進(jìn)行工程化或者對(duì)模型結(jié)構(gòu)進(jìn)行調(diào)整首先在算法層面,不能僅僅依賴現(xiàn)有算法生成視頻的邏輯,因?yàn)槟壳笆忻嫔系囊曨l生成算法實(shí)際上并沒有真正理解視頻元素的含義。OpenAl的目標(biāo)是讓大模型能夠理解視頻的內(nèi)在含義,例如能夠理解場(chǎng)景、角色、物體等,并理解它們之間的延續(xù)性和影響。需要攻克的重點(diǎn)是讓算法能夠理解視頻的語義,目前在這方面已經(jīng)有了很多思路,但目前市面上還沒有很好的方法能夠真正理解視頻的意義。所以現(xiàn)有的視頻生成方法雖然可用,但并不理想。需要講行算法底層邏輯的融合和創(chuàng)新,從而能夠理解視頻的語義,并按照特定的語境語義生成深層次的視頻。另外在工程方面,OpenAl對(duì)性能要求也更高。前面提到的很多模型生成視頻時(shí),實(shí)際上并沒有深入理解語義的情況,這就導(dǎo)致算力需求并不高,因?yàn)槔斫獾牟簧钊?。但是一旦增加了更多元素并深入理解后,算力需求就?huì)呈指數(shù)級(jí)增長(zhǎng)。因此,如果想要邁向下一步的突破,需要千倍甚至更多的算力支持。10、目前模型性格的落地或者商業(yè)化進(jìn)展與預(yù)期對(duì)比如何目前微軟在Windows的Bing、Copilot以及第三方云應(yīng)用中取得了重大的成果。特別是在第三方公司使用微軟的云服務(wù)表現(xiàn)超出了預(yù)期。本來公司期望是相應(yīng)公司能夠集成GPT在Word、Windows等產(chǎn)品中,使得用戶在這些場(chǎng)景下能夠更好地使用。但實(shí)際情況是相反的,他們自己集成的GPT的調(diào)用量反而超過了微軟已有的Word和其他微軟產(chǎn)品的組合調(diào)用量。因此對(duì)于GPT的需求在這些公司中比個(gè)人用戶更強(qiáng)烈。主要行業(yè)以科技行業(yè)為主,比如客服機(jī)器人、語音對(duì)話平臺(tái)和陪聊等,這些行業(yè)的調(diào)用量最高。但在整個(gè)Microsoft Ofice和Windows的使用中,模型的調(diào)用次數(shù)略低于預(yù)估B端是結(jié)合不同行業(yè)的應(yīng)用場(chǎng)景,比如一些公司和客服機(jī)構(gòu)需要處理大量的對(duì)話信息,因此他們需要更多陪聊的能力,通常會(huì)產(chǎn)生很多輪次的對(duì)話,其中對(duì)話是多輪且無法預(yù)測(cè)的。在接入GPT后,可以讓GPT與客戶進(jìn)行互動(dòng),相比普通消費(fèi)者直接使用微軟的文檔或使用Bing解決問題,B端場(chǎng)號(hào)客戶的需求更加強(qiáng)烈同時(shí)于C端用戶,他們需求還是更多被傳統(tǒng)的方式所滿足比如搜索引擎等。因此不同的需求強(qiáng)度和場(chǎng)景限制導(dǎo)致B端的整體調(diào)用量大于C端。12、如何看待在B端和C端的商業(yè)化進(jìn)程實(shí)際上公司最初并沒有考慮在C端進(jìn)行太多的變現(xiàn),而是以B端為主要變現(xiàn)方式。比如Ofice產(chǎn)品是一個(gè)典型的代表,其主要以B端的商業(yè)化為主,盡管看到Ofice在C端很暢銷,但C端用戶的收入并不如B端的十分之一。原因在于C端用戶大部分還是使用盜版,而B端客戶只要是稍大一點(diǎn)的公司,都會(huì)購買正版。除此之外,微軟還有許多與政府的合作項(xiàng)目和定制企業(yè)項(xiàng)目,特別是像律師事務(wù)所和專業(yè)領(lǐng)域的公司它們特別需要工具進(jìn)行迭代,所以他們非常愿意為微軟的工具付費(fèi)。他們有很強(qiáng)的付費(fèi)意愿,而且愿意支付高價(jià)。整體B端肯定會(huì)比C端帶來更多的收入,但是為什么微軟還要做像Ofice 365這樣的套件升級(jí)?其實(shí)首先要占領(lǐng)市場(chǎng),其次要培養(yǎng)用戶的意識(shí),讓大家意識(shí)到他們的工作可以與個(gè)人助手一起分擔(dān),養(yǎng)成這樣的用戶習(xí)慣。最后在打磨好相應(yīng)場(chǎng)景后,最終向B端客戶傳到并收費(fèi)13、B端目前針對(duì)M365 Copilot的反饋針對(duì)當(dāng)前Copilot的購買意愿,實(shí)際上歐美地區(qū)的客戶非常愿意購買相應(yīng)服務(wù),大約有8%的用戶選擇了付費(fèi)服務(wù)與預(yù)期10%差別并不大。共性相應(yīng)企業(yè)通常與科技相關(guān),不論是新興企 業(yè)、傳統(tǒng)企業(yè)還是互聯(lián)網(wǎng)和軟件公司,它們都與科技相關(guān),尤其是些傳統(tǒng)的媒體和廣告公司,雖然它們屬于傳統(tǒng)分類,但實(shí)際上它們從事的是新媒體和科技賦能的活動(dòng),因此與微軟有接觸的公司通常都屬于科技新興企業(yè)的范疇。目前還沒有遇到純粹的傳統(tǒng)企業(yè)購買微軟的云服務(wù),大多數(shù)情況是由傳統(tǒng)企業(yè)集團(tuán)旗下的科技分公司來采購。其次由于微軟非常注重隱私保護(hù),并承諾不查看用戶數(shù)據(jù),只提供模型服務(wù)給客戶使用,所以只能判斷調(diào)用量大的企業(yè)包合以下幾類:互聯(lián)網(wǎng)企業(yè),主要指那些本身就從事互聯(lián)網(wǎng)媒體工作,并使用對(duì)話機(jī)器人的企業(yè);而做客服軟件科技的企業(yè)則是第二類;第三類是專門從事內(nèi)容創(chuàng)作的科技公司,比如素材創(chuàng)作和新聞資訊等,此外,其他行業(yè)的公司則屬于細(xì)分子場(chǎng)景,沒有特別突出的特點(diǎn)。15、當(dāng)前企業(yè)端需求的持續(xù)性如何目前相應(yīng)領(lǐng)域已經(jīng)經(jīng)歷了一個(gè)相對(duì)長(zhǎng)期的發(fā)展階段,并且正在朝著固化流程的方向發(fā)展。比如客服機(jī)器人已經(jīng)成功地應(yīng)用GPT技術(shù),并在實(shí)際場(chǎng)景中發(fā)揮作用?,F(xiàn)在很多實(shí)際場(chǎng)景已經(jīng)將GPT的能力作為基礎(chǔ)服務(wù)進(jìn)行賦能,但是仍然存在提升和探索的空間他們很有可能不會(huì)撤銷這項(xiàng)服務(wù),調(diào)用量基本上是持續(xù)增長(zhǎng)的。16、如何理解微軟對(duì)OpenAI研發(fā)的影響,以及后續(xù)OpenAI模型與微軟產(chǎn)品的結(jié)合情況首先,微軟一直是OpenAl的主要股東,提供了包括硬件、戰(zhàn)略平臺(tái)、數(shù)據(jù)以及其他工具和服務(wù)等各方面的支持扮演著OpenAI的主要支持者角色。其次,微軟的科學(xué)家在GPT-4中已經(jīng)貢獻(xiàn)了大約三分之一的研究人員,與歐洲聯(lián)盟的團(tuán)隊(duì)一起進(jìn)行探索。實(shí)際上在GPT-5中,微軟的科學(xué)家將占據(jù)大約一半比例,并在研發(fā)工作中有一定分工??傮w上微軟將逐步承擔(dān)在特定領(lǐng)域的開發(fā)工作,并逐步發(fā)揮主導(dǎo)作用。盡管整體框架仍然由OpenAl主導(dǎo),但對(duì)于特定領(lǐng)域的特殊算法,微軟起著決定性的作用。因此,兩個(gè)團(tuán)隊(duì)之間形成了緊密的合作關(guān)系。而且微軟的投入將會(huì)比以前更大,微軟的影響力也會(huì)更大。隨著時(shí)間的推移,OpenAl將持續(xù)將大型模型的能力輸出到微軟的產(chǎn)品中,由于OpenAl現(xiàn)在非常依賴微軟,合作并不會(huì)中斷。17、微軟Azure云已經(jīng)接入了OpenAI以外的開源模型,是否會(huì)影響微軟和OpenAl的合作并不會(huì)影響微軟和OpenAl的合作。因?yàn)槲④浐蚈penAl在思路上有一些不同,微軟是一家大型公司,擁有多個(gè)部門和集團(tuán),其中云部門是其中之一,研究院則是另一個(gè)重要部門。研究院主要為AI領(lǐng)域提供科學(xué)家與OpenAl進(jìn)行合作,而云部門則擁有自己的平臺(tái)戰(zhàn)略。云部門致力于構(gòu)建一個(gè)開放的平臺(tái),不會(huì)限制客戶使用云服務(wù)或者使用計(jì)算資源。在研究院方面,與OpenAl有著緊密的合作,在共同開發(fā)GPT等相應(yīng)產(chǎn)品方面,整體不存在沖突的情況。ChatGPT下載量提升,堅(jiān)定看好AI應(yīng)用9/25起,ChatGPT Plus/企業(yè)用戶可使用語音及圖像交互功能據(jù)Data ai,ChatGPT美國地區(qū)iOS的下載榜排名,由9/24的第19名,最高上升至9/26的第3名,目前位于第5名。--------------------------此前ChatGPT訪問量,在3-4月達(dá)頂峰,此后下滑。此次升級(jí)(尤其是語音交互),顯著提升普通用戶與AI交互的體感,擺脫純文字的枯燥,To C進(jìn)一步打開。“ChatGPT”一詞的谷歌搜索熱度,也在9月底回到75左右(3-4月為100),普通用戶對(duì)AI應(yīng)用的關(guān)注,正在逐步回暖。目前語音功能尚未對(duì)全部用戶開放,若后續(xù)大范圍放開,預(yù)計(jì)ChatGPT使用率將進(jìn)一步提升。2、后續(xù)AI催化節(jié)點(diǎn)#10月15-16日: 英偉達(dá)AI峰會(huì),黃仁勛將發(fā)言1)系統(tǒng)性重視游戲:估值調(diào)整到位,版號(hào)常態(tài)化/景氣回暖,9月買量成本有下降#愷英網(wǎng)絡(luò) (小游戲進(jìn)入前10)、吉比特 (M66重啟預(yù)約)、#三七互娛 (小游戲第1)巨人網(wǎng)絡(luò) (AI玩法內(nèi)測(cè))、#盛天網(wǎng)絡(luò) (AI音頻社交)神州泰岳 (AI催收)#萬興科技 (天幕大模型)中文在線 (AI漫畫) #芒果超媒 (超跌+關(guān)注10月招商會(huì)催化)
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。