時間回到2022年11月,此時英偉達的股價近乎腰斬,跌至不足3000億美元。
就在這個時候OpenAI發(fā)布了ChatGPT聊天機器人,這一基于生成式人工智能的AI Bot,一時間成為了科技界的頭條。此時,甚至Google創(chuàng)始人慌亂,回來緊急發(fā)布應(yīng)對策略。因為在這個時候大家不知道它是如何實現(xiàn)的。
英偉達GPU芯片可以加速AI基礎(chǔ)模型的訓練,同時具有完善的CUDA平臺,它抓住了向上的“新風口”,其股價開始回升,市值逐步恢復(fù)。
到2024年的今天,僅僅兩年過去,英偉達市值達到3.012萬億美元,成為了全球市值第二的公司。
英偉達的GPU芯片依然在加速生產(chǎn)中,而且他們現(xiàn)在擁有至高無上的定價權(quán),每個人訓練大模型的公司都必須接受 Nvidia 用金湯匙喂養(yǎng)他們的東西。
當前 H100的毛利率超過 85%,可以說英偉達成了AI2.0時代最賺錢的公司,沒辦法賣“鏟子”的總比“挖金礦”的要先一步掙到錢。
而對于這波風口上的大模型公司來說,所有人都在關(guān)注無利可圖的支出還將會持續(xù)多久。當前大模型創(chuàng)業(yè)公司的明確目標還是在趕上甚至超越 OpenAI,以及構(gòu)建更大性能更好的模型,來掙取更多的預(yù)期收益。
而OpenAI也一樣,OpenAI必須不斷推出新的震撼世界的產(chǎn)品,同時推出可以直接觸達用戶的產(chǎn)品,否則它將陷于Meta 和 Google包圍之中。
當前許多公司在聊天機器人 ELO 方面與 OpenAI 最新的 GPT-4 相差無幾,而在上下文長度和視頻模式等某些方面,一些公司已經(jīng)領(lǐng)先。
前不久Sora和GPT-4o的發(fā)布,并未引起像ChatGPT剛發(fā)布時引爆的破圈討論風潮,這是因為ChatGPT剛發(fā)布時,我們并不知道它是如何實現(xiàn)的,我們也不知道如何追趕。而現(xiàn)在我們基于開源基礎(chǔ)模型,可以大概判斷出其實現(xiàn)的技術(shù)方案,只是需要時間來進行復(fù)現(xiàn)而已。
顯然,只要有足夠的計算能力,最大的科技公司都可以匹敵 OpenAI 的 GPT-4。據(jù)傳,阿里最新發(fā)布的Qwen-2.0的開源模型已經(jīng)可以比擬GPT-4 Turbo,Meta 的 Llama 3 405B 也將在開源的同時匹敵 GPT-4,Gemini 2 Ultra 已經(jīng)在各方面超越 GPT-4 Turbo。
OpenAI 現(xiàn)在的優(yōu)勢之一是他們在收集使用數(shù)據(jù)方面一直處于領(lǐng)先地位,但這種情況相信很快就會改變。所以O(shè)penAI才說人才是第一位的,其他沒有什么是不可替代的,OpenAI也在不斷的開出百萬美元的年薪從Meta 和 Google等競爭對手的公司挖人。
如果OpenAI沒有不斷的推出新的技術(shù)產(chǎn)品,可以說其技術(shù)優(yōu)勢正在逐漸縮小。
雖然說微軟宣布將為OpenAI 投入超過 100 億美元的資本支出,而且這其中還有一大部分事用于推理,以便在自己的產(chǎn)品和服務(wù)中部署 OpenAI 模型。
由于 OpenAI 的怪異結(jié)構(gòu),微軟也并未完全押注于OpenAI,一大部分資源被用于微軟自己開發(fā)的模型上。
OpenAI 是一個非營利組織,其主要目標是創(chuàng)造安全且造福全人類的通用人工智能 (AGI)。OpenAI可以而且會違反允許微軟訪問 OpenAI 模型的協(xié)議,而微軟對此沒有任何追索權(quán)。
這是因為OpenAI 仍然是一家完全獨立的公司,由 OpenAI Nonprofit 管理。微軟是無投票權(quán)的董事會觀察員,沒有控制權(quán)。AGI 明確地排除了所有商業(yè)和 IP 許可協(xié)議。對于微軟來說,最令人擔憂的是,OpenAI 董事會可以在沒有任何微軟投票的情況下隨時決定他們已經(jīng)實現(xiàn)了 AGI。
雖然說現(xiàn)在OpenAI的產(chǎn)品可以通過微軟來直達消費者用戶,但他們之前并非完全背靠背的合作關(guān)系,OpenAI依然需要尋求獨立的產(chǎn)品路線。
而微軟也在減少對 OpenAI 的依賴,包括 Copilot 和 Bing 計劃。微軟最新發(fā)布的Phi-3模型,使用來自大型模型的大量合成數(shù)據(jù)訓練小型模型,效果非常出色。其次,微軟也正在使用 MAI-1 ~500B 參數(shù) MOE 模型,利用了 Inflection 預(yù)訓練團隊及其數(shù)據(jù)集,并結(jié)合了微軟自己的一些合成數(shù)據(jù),來訓練自己的GPT-4 類模型。
OpenAI的缺點其實非常明顯,它并沒有擁有像 Meta 和 Google 可以更直接地接觸消費者終端流量產(chǎn)品。
相比于Google的瀏覽器,Meta的聊天軟件,ChatGPT的用戶量還是比較少的,而且其中大多數(shù)只使用過幾次,不會繼續(xù)使用它。
未來的大多數(shù)可以預(yù)見的消費者,將通過現(xiàn)有平臺來使用大語言模型,包括 Google、Instagram、WhatsApp、Facebook、iPhone/Android。
雖然 Meta 尚未找到如何將賺錢的方法,但他們的 Meta AI(由 Llama 3 70B 提供支持)已在 Facebook、Instagram 和 Whatsapp 上可用。
并且已宣布的推廣范圍已擴展到包括美國在內(nèi)的 14 個國家/地區(qū),這些國家/地區(qū)的總?cè)丝跒?11 億。大量用戶已經(jīng)可以使用比 ChatGPT 免費模型更好的模型。Meta AI 正處于其增長曲線的早期階段,距離實現(xiàn)其 32.4 億每日活躍用戶群的目標僅完成了三分之一。
Google也宣布將AI 融入了 Workplace 辦公工具中,使得Gmail、Google Drive、Docs、Sheets 和 Slides 都可以一鍵使用AI,同時未來也將打造新的搜索—-用AI組織搜索,同時Gemini 生成式人工智能模型添加到廣告服務(wù)中,探索賺錢方法。
所以在這個背景下,OpenAI推出了自己的手機APP和桌面APP,用于直接面向用戶,一方面便捷用戶的使用,減少使用上復(fù)雜操作的時間成本;另一方面可以直接面對用戶和占有用戶。
此外,OpenAI也積極與蘋果合作,打造新一代的siri,占有這個巨量的終端用戶群體。如果OpenAI真的iPhone 上獨家提供服務(wù),那么OpenAI將一舉成功占用最重要的終端市場。
價格戰(zhàn)的序幕應(yīng)由 DeepSeek-V2 的問世拉開,這款產(chǎn)品以其卓越的性能和低廉的運行成本,成功超越了 Meta 的 Llama 3 70B。
DeepSeek-V2 的定價策略極具競爭力,它不僅在成本效益上明顯優(yōu)于市場上的其他競爭模型,而且其價格之低,甚至打破了風險投資支持的推理 API 提供商之間的價格戰(zhàn)局面。這些提供商在為 Meta 和 Mistral 模型提供服務(wù)時,已經(jīng)面臨著虧損的壓力。
DeepSeek-V2 的推出,無疑在這場激烈的市場競爭中掀起了新的波瀾。
DeepSeek 聲稱,一個由 8卡 H800 GPU 組成的節(jié)點可以實現(xiàn)每秒超過 50,000 個解碼token的峰值吞吐量,其API定價為每百萬 tokens 輸入 1 元、輸出 2 元。即使在這樣的情況下,依然可以實現(xiàn)高達 70% 以上的毛利率。而且DeepSeek-V2 沒有照搬國外的開源模型,針對MoE、RoPE 和 Attention 都有全新的創(chuàng)新。
緊接著,智譜 AI 、字節(jié)豆包大模型和阿里Qwen-Long API也都相應(yīng)的大幅下調(diào)價格。百度則直接宣布 ERNIE Speed 和 ERNIE Lite 兩款模型免費。
OpenAI則對于非企業(yè)用戶優(yōu)先采取了免費優(yōu)先的策略,雖然有一定的頻次限制,但對于非企業(yè)用戶來說是足夠的。這標志著他們將去年的定價模式發(fā)生了重大商業(yè)模式轉(zhuǎn)變,現(xiàn)在開發(fā)者和企業(yè)進入了完全補貼消費者的時代。
通過貼補消費者來增加用戶使用終端頻率和習慣,搶占終端用戶市場。對于這些沒有大規(guī)模終端使用的大模型公司來說,如果創(chuàng)新遇到瓶頸,那么這些擁有直接終端用戶的企業(yè)公司,將可能快速將其包圍。
國內(nèi)價格戰(zhàn)時間線:
DeepSeek 發(fā)布全球最強開源 MoE 模型:2024-05-06,DeepSeek-V2(32K 上下文) API 的定價為:每百萬 tokens 輸入 1 元、輸出 2 元
用大模型 API 就上 bigmodel.cn!:2024-05-11,智譜 AI 的 GLM-3 Turbo API 價格調(diào)整為 1 元/百萬 tokens(輸入輸出同價)
2024 春季火山引擎 FORCE 原動力大會上: 2024-05-15 ,字節(jié) Doubao-pro-128k(128K 上下文) API 的定價為:每百萬 tokens 輸入 5 元、輸出 9 元;Doubao-lite-128k(128K 上下文) API 的定價為:每百萬 tokens 輸入 0.8 元、輸出 1 元
智譜 AI 最新推出 Batch API:2024-05-21,支持的模型以及價格:GLM-4 API 價格為 50 元 / 百萬 tokens,GLM-3-Turbo API 價格為 0.5 元 / 百萬 tokens(輸入輸出同價)
降價,立即生效!:2024-05-21,阿里云 Qwen-Long API 價格調(diào)整為每百萬 tokens 輸入 0.5 元、輸出 2 元。
免費,立即生效!:2024-05-21,百度宣布 ERNIE Speed 和 ERNIE Lite 兩款模型宣布免費。
OpenAI 面臨的最大風險就是芯片。
盡管 OpenAI 的芯片野心已經(jīng)傳聞了一段時間,最近OpenAI對谷歌TPU芯片的頂尖人才開始了大膽的偷獵行動。
OpenAI自己做芯片和基礎(chǔ)設(shè)施也是迫不得已。
一方面,與購買 Nvidia 芯片相比,它大大降低了計算成本。當前Google的 TPU 建設(shè)速度非??欤页杀緯浅1阋?。Meta 和亞馬遜正在將其內(nèi)部硅片的產(chǎn)量提升到不同程度,這讓他們的大模型獲得了計算成本優(yōu)勢。
另一方面,OpenAI公司目前處境尷尬,不能完全依賴微軟的芯片和云服務(wù),因為兩者的關(guān)系緊張且微妙,而且微軟正在認真制定自己的AI計劃。
從長遠的角度來看,OpenAI 在成本節(jié)約方面可能難以從微軟那里獲得顯著的優(yōu)惠,因為微軟的商業(yè)策略傾向于通過向'外部'用戶出租其內(nèi)部芯片和云服務(wù)來實現(xiàn)盈利。OpenAI 有著更為深遠的愿景,它渴望自主設(shè)計芯片和系統(tǒng),以更貼近制造成本的方式打造定制化的解決方案,從而實現(xiàn)成本效益的最大化。
然而,OpenAI 對于微軟芯片的設(shè)計缺乏必要的控制權(quán),這可能導(dǎo)致微軟提供的芯片及其系統(tǒng)無法完全滿足 OpenAI 的特定需求。這種局限性可能會影響 OpenAI 在實現(xiàn)其技術(shù)目標和優(yōu)化成本效益方面的靈活性和效率。
當前AI大模型還處于發(fā)展的初期,巨量上升的空間使得資本可以無限制的投入,然而這種無限制的投入會持續(xù)多久呢?
在整一條產(chǎn)業(yè)上,目前只有賣芯片的英偉達賺到了錢,其他公司都是在賺取對未來期望的錢。一旦OpenAI所帶來的創(chuàng)新性不足,那么也就意味著AI2.0將進入平臺期。
OpenAI必須利用當前的優(yōu)勢,快速的占領(lǐng)終端用戶,吸納自己的用戶群體。否則一旦式微,Google和Meta這種已經(jīng)擁有巨量流量的現(xiàn)成產(chǎn)品公司,將具有非常大的后發(fā)優(yōu)勢。
所以說,終端產(chǎn)品成為市場競爭的關(guān)鍵,Google和Meta等公司擁有直接接觸消費者的平臺和產(chǎn)品,而OpenAI則需要通過推出自己的APP和與蘋果等公司的合作來拓寬用戶基礎(chǔ)。通過價格戰(zhàn)和補貼消費者將成為搶占市場份額的重要手段。
最后,芯片或許會成為OpenAI面臨的最大風險。盡管OpenAI有意自主開發(fā)芯片和基礎(chǔ)設(shè)施,但與微軟的合作關(guān)系緊張,OpenAI需要在芯片開發(fā)和成本效益之間找到平衡,以保持其在AI領(lǐng)域的領(lǐng)先地位。