中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關于ZAKER 合作
      虎嗅APP 11分鐘前

      GPT-5 不及預期,但給 OpenAI 喂數(shù)據(jù)的公司卻身價暴漲

      出品|虎嗅科技組

      作者|SnowyM

      編輯|陳伊凡

      頭圖|視覺中國

      "AI 原生 100" 是虎嗅科技組推出針對 AI 原生創(chuàng)新欄目,這是本系列的第「12」篇文章。

      8 月 8 日,OpenAI 最新模型 GPT-5 正式發(fā)布,但性能提升幅度遠沒有達到人們期待的 " 下一代模型 " 水準,雖然性能有一部分大幅提升,但有相當一部分并未與 o3 或者是 Claude、Grok4 拉開距離。

      這個現(xiàn)象背后,整個 AI 行業(yè)正在面臨一個關鍵轉(zhuǎn)折點:僅僅通過增加數(shù)據(jù)量和計算資源來提升模型性能的傳統(tǒng)路徑,可能已接近天花板。

      此時,一家給 OpenAI 喂數(shù)據(jù)的公司浮出水面—— Turing。

      2022 年年初,Turing 的 CEO ——喬納森 · 西達爾特(Jonathan Siddharth)從美國硅谷帕洛阿爾托,驅(qū)車前往 OpenAI 的辦公室。彼時的 Turing 是一家人力資源招聘公司。

      在去的路上,他做好了給這家新興的硅谷 AI 巨頭推銷 Turing 產(chǎn)品的準備—— Turing 可以幫助 OpenAI 招聘人才。

      當走進辦公室時,一堆 OpenAI 的研究員卻向喬納森提了一個需求——他們不要人,他們要數(shù)據(jù)。彼時,OpenAI 的研究員們發(fā)現(xiàn),在訓練 GPT-3 的數(shù)據(jù)集中,加入一些計算機代碼,有助于提高模型的推理能力。因此,他們希望 Turning 能夠給他們提供質(zhì)量上乘的代碼,用于 GPT-4 的開發(fā)中。

      這次會議,成為了 Turing 發(fā)展的拐點。只用了 7 年時間,這家公司從零達到 22 億美元估值,并且成為了繼 Scale AI 之后,硅谷第二家風頭正盛的數(shù)據(jù)標注公司。

      如今隨著大模型能力的演進,互聯(lián)網(wǎng)上可公開的數(shù)據(jù)已經(jīng)很少了,對更難生成的數(shù)據(jù)的需求將會急劇增長。隨著 Scale AI 被 Meta 收購,Turing 將有希望在數(shù)據(jù)標注領域成為估值第一的公司。

      虎嗅接觸了 Turing 的早期投資方——硅谷風投資機構 UpHonest Capital,其投資人表示,他們對 Turing 團隊的第一印象是沉穩(wěn)從容的連續(xù)創(chuàng)業(yè)團隊,對產(chǎn)品路線與商業(yè)化有清晰判斷;同時,Turing 還通過高頻、透明的進展匯報營造出強烈的 FOMO(形容創(chuàng)業(yè)者對新技術、新趨勢敏感的表現(xiàn)),善于動員資源。

      彼時的 Turing 與現(xiàn)在的業(yè)務相距甚遠,UpHonest Capital 投資 Turing 是 2019 年,正值 Zoom 上市,Zoom 早期借助了亞洲工程人才紅利快速成長,投資方認為,這是 " 人才地理套利 " 結構性機會,而 Turing 創(chuàng)始團隊具備亞裔跨境背景與執(zhí)行力,在這一賽道擁有天然優(yōu)勢。這也是他們投資 Turing 的原因。

      不過,業(yè)內(nèi)投資人也表示,Turing 這樣的數(shù)據(jù)標注公司,本質(zhì)上還是一種人力資源外包型企業(yè),毛利率不高,需要精細化運作和控制成本。隨著如今數(shù)據(jù)標注公司越來越多,數(shù)據(jù)的質(zhì)量成為了競爭的勝負手。

      Turing 的上升空間和想象

      Turing 正在書寫著 " 經(jīng)濟上行期 " 的故事。

      Turing 最初切入的是遠程工程師招聘市場,憑借 AI 驅(qū)動的人才云(Talent cloud,Turing 積攢的人才網(wǎng)絡)平臺快速壯大。

      2021 年,公司成功躋身獨角獸行列。此時,他們已經(jīng)有了 400 萬專業(yè)開發(fā)者的龐大人才網(wǎng)絡和 ALAN AI 平臺(Turing 自研的 AI 模型開發(fā)工具平臺),并成為了最大、最國際化的開放人才平臺之一。

      但這遠不是故事的結局。

      當 OpenAI 等頂級 AI 基礎模型廠商對數(shù)據(jù)的需求正在瘋漲時,Turing 捕捉到這一機遇,果斷轉(zhuǎn)型為 AGI 基礎設施提供商,將以往積攢的龐大資源(軟件工程代碼數(shù)據(jù)及模型評估能力)包裝成標準化服務。

      如今,頭部模型廠商基本都是 Turing 的客戶,例如,OpenAI、Anthropic、Google、Meta 等頂級 AI 實驗室,Turing 為他們提供模型訓練、微調(diào)和智能體開發(fā)等底層支持。

      如果了解大語言模型的誕生經(jīng)過就知道,大模型會先將大量從網(wǎng)頁上收集到的數(shù)據(jù)進行預訓練,然后再經(jīng)過微調(diào)和后訓練,讓 AI 模型學習如何回答問題,在監(jiān)督微調(diào)中,模型可以通過專門的數(shù)據(jù),學會新的技能。這個專門的數(shù)據(jù),就是 Turing 提供的,標注過的,高質(zhì)量數(shù)據(jù)集。

      這個目的是讓模型學習和泛化。因此,數(shù)據(jù)標注的專業(yè)性在這個環(huán)節(jié)就顯得尤為重要。

      Turing 的人才庫中,有涉及不同領域的專家。喬納森表示,他們要做的就是提供互聯(lián)網(wǎng)上搜不到的數(shù)據(jù)。

      資本市場對 Turing 的認可度可以用 " 估值翻倍 " 來概括。2021 年底的 Series D 輪融資中,公司籌得 8700 萬美元,投后估值約 11 億美元,正式成為獨角獸。

      2025 年 3 月完成的 Series E 輪融資:1.11 億美元的資金注入讓估值直接翻倍至 22 億美元。這輪融資由馬來西亞主權財富基金 Khazanah Nasional Berhad 領投,WestBridge Capital、Sozo Ventures、UpHonest Capital 等十多家機構參投。

      截至 Series E 完成,Turing 累計融資總額約 2.25 億美元。更值得關注的是其業(yè)績表現(xiàn):2024 年公司年度收入達到 3 億美元規(guī)模,較上一年增長三倍,并成功實現(xiàn)盈虧平衡。

      我們梳理了 Turing 的融資歷史:

      2018-2019 年:獲得種子資金,2019 年完成 1400 萬美元種子輪

      2020 年 12 月:完成 3200 萬美元 Series B 輪,由 WestBridge Capital 領投

      2021 年 12 月:完成 8700 萬美元 Series D 輪,估值 11 億美元成為獨角獸

      2025 年 3 月:完成 1.11 億美元 Series E 輪,估值 22 億美元

      最新財務數(shù)據(jù)顯示,Turing 的 年度經(jīng)常性收入(ARR)約 3 億美元。

      創(chuàng)始人:連續(xù)創(chuàng)業(yè)者的故事

      Turing 由 Jonathan Siddharth 和 Vijay Krishnan 于 2018 年聯(lián)合創(chuàng)立。

      Vijay Krishnan (左)Jonathan Siddharth(右)

      兩位創(chuàng)始人均擁有斯坦福大學計算機科學碩士背景,在校期間因?qū)C器學習的共同興趣而結識,并萌生了聯(lián)合創(chuàng)業(yè)的想法 。研究生畢業(yè)后,他們多次合作技術項目并嘗試創(chuàng)業(yè)。

      2008 年,他們聯(lián)合創(chuàng)辦了內(nèi)容推薦平臺 Rover,后于 2016 年被 Revcontent 收購 ,兩人深刻體會到僅依賴灣區(qū)本地招募頂尖工程師的局限,于是開始嘗試遠程分布式團隊的模式 。

      在這個過程中,他們逐步摸索出如何高效甄別和管理全球各地的人才,并 " 無心插柳 " 地獲得了打造 AI 驅(qū)動的人才云平臺的靈感。

      2018 年,Jonathan 和 Vijay 將這一洞見付諸實踐,創(chuàng)立了 Turing ,以機器學習技術對工程師進行技能審核和匹配,幫助企業(yè) " 云端組建 " 全球開發(fā)者團隊。

      正如 Jonathan 所強調(diào)的,傳統(tǒng)線下招聘和外包模式已難以滿足高速發(fā)展的科技行業(yè)需求,他們希望通過 Turing 打造全球人才網(wǎng)絡,讓企業(yè) " 不受地理位置限制找到世界上最優(yōu)秀的人才 "。

      一個 AI 轉(zhuǎn)型企業(yè)的教科書式樣本

      Turing 的華麗轉(zhuǎn)身值得細說,因為他們所上演的故事幾乎堪稱傳統(tǒng)企業(yè)向 AI 企業(yè)轉(zhuǎn)型的標準教科書。

      在收到 OpenAI 需求時,喬納森坦言,他們當時完全沒料到 ChatGPT 會引發(fā) AI 熱潮,更沒想到 " 軟件工程師的代碼對教會大語言模型思考和推理如此重要 "。" 他們的要求簡直是瘋了,他們想要在這么短的時間內(nèi)獲得大量數(shù)據(jù)。" 喬納森回憶。

      但最后,Turing 確實給 OpenAI 在模型性能上提供了巨大幫助,使得 ChatGPT 能夠在發(fā)布后,震驚世界。

      另一面,Turing 并沒有完全拋棄原有業(yè)務。創(chuàng)始人強調(diào),各條業(yè)務線都在增長,只是把主要資源投入到 AI 相關的新業(yè)務上。這種務實的做法為新戰(zhàn)略提供了現(xiàn)金流支撐。

      Turing 的 AI 業(yè)務

      轉(zhuǎn)型后的 Turing 形成了兩大核心業(yè)務板塊,即公司內(nèi)部稱為 "Turing AGI Advancement" 和 "Turing Intelligence" 的兩條業(yè)務線。

      Turing AGI Advancement 專門服務全球頂級 AI 實驗室,幫助提升前沿基礎模型的各項能力。簡單說,就是讓 AI 模型變得更聰明。他們?yōu)?OpenAI、Anthropic、Google、Meta 等頂尖公司提供高質(zhì)量訓練數(shù)據(jù)、代碼生成、模型微調(diào)等服務。

      Turing Intelligence 則致力于將前沿 AI 能力轉(zhuǎn)化為企業(yè)應用。面向財富 500 強企業(yè)和政府機構,構建定制的 AI 系統(tǒng)和解決方案,幫助傳統(tǒng)企業(yè)實現(xiàn)智能化升級。

      兩條產(chǎn)品線分別對應 " 造模型引擎 " 與 " 用模型賦能 ",既服務 AI 行業(yè)本身,又將 AI 能力推廣到各行各業(yè)。

      支撐業(yè)務發(fā)展的是 Turing 的兩大核心資產(chǎn),這兩大資產(chǎn)又能夠形成閉環(huán),為 Turing 提供源源不斷的專業(yè)數(shù)據(jù)資產(chǎn)。

      Turing 的 AI+ 人才循環(huán)

      首先是 AI 驅(qū)動的人才云平臺。Turing 聲稱通過自動化測試篩選,Turing 從全球數(shù)百萬報名者中篩選出 400 萬技術人才,堪稱全球最大的人類智能網(wǎng)絡之一。當 AI 項目需要特定專家時,平臺能迅速匹配合適團隊。

      例如,當 OpenAI 需要大量 Python/C++ 工程師編寫代碼來豐富模型訓練數(shù)據(jù)集時,Turing 可以迅速組建起一支分布式的專業(yè)開發(fā)者團隊投入任務 ;又如某制藥企業(yè)需要生命科學背景的標注人員來給模型做專業(yè)數(shù)據(jù)標記,Turing 也能從人才庫中篩選出合格的 PhD 等高端人選。

      其次是自研的 ALAN AI 工具平臺,用于高效編排 AI 模型開發(fā)的各類工作流。ALAN 將人類專家與機器算法緊密結合,支持從數(shù)據(jù)生成到模型評估的全流程自動化。Turing 通過這個平臺實現(xiàn)了模型訓練與優(yōu)化的 " 流水線式 " 標準化生產(chǎn)。

      Turing 最初采用典型的人力資源外包模式,通過撮合企業(yè)與遠程開發(fā)者并抽取傭金盈利。

      轉(zhuǎn)型后,商業(yè)模式變得更加多元:

      在 Turing AGI Advancement 板塊,公司的主要客戶是全球頂級的 AI 模型研發(fā)機構。這些 AI Labs 利用 Turing 來獲取大規(guī)模的定制數(shù)據(jù)服務和人類反饋,例如為模型生成代碼語料、構建評測基準、執(zhí)行模型對比測試,以及提供成百上千名有特定領域?qū)I(yè)的標注人員進行 RLHF 微調(diào)等 。

      Turing Intelligence 板塊,則類似軟件項目制或訂閱制,從需求分析到部署運維,提供端到端的 AI 應用開發(fā)服務。在多個行業(yè)已有顯著成果,例如幫助醫(yī)院降低 15% 庫存成本、將制藥晶體分析時間從 250 小時縮短到 2-3 小時、提升銀行客服響應速度 40%

      2024 年,Turing 實現(xiàn)了盈利,這也證明了商業(yè)模式的可持續(xù)性。投資者也給予高度評價,從 Foundation Capital、WestBridge 到馬來西亞主權基金,每輪融資都有頂級機構背書。

      數(shù)據(jù)標注進入 " 精英喂養(yǎng) " 時代

      根據(jù)市場研究機構預測,全球 AI 數(shù)據(jù)收集與標注市場 2024 年的規(guī)模已達到約 180 億美元,預計 2025 年將增至約 220 億美元,此后幾年維持 20 – 30% 的年復合增長率 。

      這一領域受到資本的熱烈追捧:Scale AI 等頭部公司的高估值就是明證。例如 Meta 斥資 143 億美元 收購 Scale AI 49% 股權,將該數(shù)據(jù)標注獨角獸估值推高至 290 億美元,并挖走其 CEO 負責 Meta 的超級智能項目 。

      OpenAI 的內(nèi)部評估亦印證了這種趨勢——其表示,下一代模型若按傳統(tǒng)方式訓練,性能增益將大幅低于預期,GPT-5 就是最好的例子 。為突破瓶頸,各大實驗室紛紛尋求解決方案,包括從企業(yè)自身業(yè)務中挖掘私有數(shù)據(jù)、生成合成數(shù)據(jù)、引入更多人類反饋等。

      去年 12 月,OpenAI 展示了一項叫做 "Test-Time Scaling" 的新技術測試結果,這被業(yè)界視為大模型在后預訓練時代提升能力的重要突破。這個技術簡單來說,就是讓 AI 在回答問題時花更多時間 " 思考 ",從而給出更準確的答案。

      2024 年下半年,OpenAI 秘密開發(fā)了一個代號為 "Orion" 的新模型。公司內(nèi)部原本計劃將它作為萬眾矚目的 GPT-5 發(fā)布,期望它能比當時最強的 GPT-4o 模型表現(xiàn)更出色。然而,測試結果讓人失望—— Orion 的表現(xiàn)并沒有達到預期的大幅提升。

      從 Orion 到 GPT-4.5 再到 GPT-5,海外媒體的許多報道印證了一個事實:性能提升確實不夠顯著。這期間,關于 OpenAI 面臨數(shù)據(jù)瓶頸的消息不斷傳出。特別值得注意的是,OpenAI 前首席科學家 Ilya Sutskever 在一次公開演講中曾表示,支持 Scaling Law(算力越大越好)的高質(zhì)量訓練數(shù)據(jù)已經(jīng)不多了。

      一個顯而易見的趨勢是,數(shù)據(jù)標注正在進入 " 精英喂養(yǎng) " 時代,各領域的專家,取代了初級數(shù)據(jù)標注員。

      其中,引入海量高質(zhì)量人類標注和代碼數(shù)據(jù)被證明是近期最有效的手段之一 。例如,Meta 在訓練 Llama3 模型時投入了超過 1000 萬條人類標注數(shù)據(jù) 。但如此巨量且高質(zhì)量的數(shù)據(jù)獲取絕非易事,必須建立起專業(yè)化的數(shù)據(jù)生產(chǎn)流水線。

      這正是像 Turing 這樣的 AI 數(shù)據(jù)服務商崛起的背景:它們填補了 AI 實驗室 " 數(shù)據(jù)生產(chǎn)能力 " 的空白,幫助后者源源不斷地獲取所需的 " 燃料 ",從而延續(xù) Scaling Law。

      喬納森在 Turing 官網(wǎng)上發(fā)布了一篇文章提出,領先的前沿實驗室正在面臨新的挑戰(zhàn)——需要具有適當深度、多樣性和反饋結構的數(shù)據(jù),從而真正釋放能力提升——這意味著,數(shù)據(jù)標注領域,正在進入 " 精英喂養(yǎng) " 的模式。喬納森則表示,Turing 采取的是中立的態(tài)度,不會與任何實驗室對抗。

      Surge AI 的創(chuàng)始人 Edwin Chen 表示,質(zhì)量高于一切。Turing 則能夠提供 400 多萬軟件工程師、數(shù)據(jù)科學家、領域?qū)<业娜瞬艓欤荒軌蚣磿r聘跨專業(yè)領域的博士、奧林匹克級別的人才;發(fā)起人工智能驅(qū)動的審查,確保每位貢獻者的質(zhì)量一致。

      不過,隨著資本不斷涌入,這個賽道正變得越來越擁擠。數(shù)據(jù)質(zhì)量是決定這個行業(yè)的勝負手,并且,當大語言模型的性能提升曲線逐漸平緩,對數(shù)據(jù)標注的質(zhì)量要求將越來越高。

      Turing 的挑戰(zhàn):精細化運營和數(shù)據(jù)質(zhì)量

      在 AI 數(shù)據(jù)服務領域,Turing 和 SurgeAI 這兩家十分有潛力的 AI 公司走出了截然不同的路子,就像兩個基因不同的物種,各有各的生存策略。

      硅谷三大數(shù)據(jù)標注公司情況 虎嗅根據(jù)公開信息整理

      Turing 更像一個什么都能干的 " 一站式平臺 "。由于一開始的人才云業(yè)務積累,它的業(yè)務范圍很寬,既能提供技術人員(工程師、數(shù)據(jù)科學家),又能提供高質(zhì)量的代碼數(shù)據(jù)和評測,并依靠這些能力幫助企業(yè)搭建 AI 系統(tǒng)。

      而 Surge AI 走的是精品路線,主要做多輪對話標注、AI 安全測試、復雜評測等高難度任務,需要頂級專家和嚴格流程來保證質(zhì)量。業(yè)內(nèi)提到它的融資時,都會強調(diào) " 人類在環(huán) " 這個定位。其創(chuàng)始人 Edwin Chen 在談及 SurgeAI 業(yè)務時,十分 " 驕傲 ",并始終強調(diào) " 質(zhì)量為王 "。

      它的擴張邏輯與 Turing 完全不同:不求量大,但求價值高。圍繞高質(zhì)量數(shù)據(jù)這個核心,不斷完善工具和流程,讓每個數(shù)據(jù)樣本都更值錢。

      在 AI 數(shù)據(jù)提供這方面,SurgeAI 雖然晚成立 2 年,但已經(jīng)圍繞數(shù)據(jù)深入做好了相關技術儲備,甚至被稱為 " 業(yè)內(nèi)早已公認超越了 ScaleAI",而 Turing 的資源池積累相對更大一些,未來的 Turing 還有多大上升空間,值得關注。

      相關標簽
      ai

      相關閱讀

      最新評論

      沒有更多評論了
      讀覽精華

      讀覽精華

      精致閱讀,品味生活

      訂閱

      覺得文章不錯,微信掃描分享好友

      掃碼分享

      熱門推薦

      查看更多內(nèi)容