中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>

<bdo id="rfd20"><ins id="rfd20"></ins></bdo>

全天候科技 12小時前

百度開源 ERNIE 4.5：策略是什么？

作者：周源 / 華爾街見聞

6 月 30 日，百度正式開源文心大模型 4.5 系列（ERNIE 4.5），涵蓋 10 款不同參數(shù)規(guī)模的模型，包括 47B（470 億）、3B（30 億）激活參數(shù)的混合專家（MoE）模型及 0.3B（3 億）參數(shù)的稠密型模型，預(yù)訓(xùn)練權(quán)重與推理代碼均完全開放。

目前，這些模型已可在飛槳星河社區(qū)、HuggingFace 等平臺下載，百度智能云千帆大模型平臺也同步提供了 API（應(yīng)用程序編程接口：Application Programming Interface）服務(wù)。

這一動作，延續(xù)了科技領(lǐng)域 " 開放協(xié)作 " 的傳統(tǒng)脈絡(luò)，也為大模型技術(shù)的落地提供了新的可能性。

但百度創(chuàng)始人、董事長兼 CEO 李彥宏曾在 2024 年的 WAIC（世界人工智能大會：World Artificial Intelligence Conference）上，認(rèn)為開源大模型是 " 智商稅 "。

從參數(shù)覆蓋到工具適配

百度此次開源的 10 款模型，形成了從 0.3B 到 47B 參數(shù)的梯度覆蓋，囊括基礎(chǔ)文本模型和視覺多模態(tài)模型（VLM）。除最小的 0.3B 模型外，其余模型都采用異構(gòu)多模態(tài) MoE（專家混合模型：Mixture of Experts）架構(gòu)。

對于算力有限的中小開發(fā)者，0.3B 參數(shù)的稠密型模型可降低部署門檻，MoE 模型則能滿足企業(yè)級復(fù)雜任務(wù)的需求。這種分層供給思路，讓不同資源條件的使用者都能找到適配的工具。

與常規(guī)的單模態(tài) MoE 不同，此次百度開源的 ERNIE 4.5 模型是一種異構(gòu)混合型，也就是通過 " 分而治之 " 策略提升模型性能的人工智能架構(gòu)：將多個不同類型的專家模塊集成在一起，每個輸入僅激活部分相關(guān)的專家模塊，從而在不顯著增加計算量的前提下大幅提升模型容量。

這種架構(gòu)的核心思想是將復(fù)雜任務(wù)分解給多個專門的 " 專家模型 "（Expert）處理，再通過門控網(wǎng)絡(luò)（Gating Network）動態(tài)選擇最優(yōu)專家或組合專家輸出，從而在保持模型規(guī)模可控的同時，提升模型的表達(dá)能力和效率。

相對而言，文心大模型 4.5 系列的技術(shù)特點，集中體現(xiàn)在多模態(tài)能力的優(yōu)化上。

作為原生多模態(tài)模型，ERNIE 4.5 對圖像、音視頻的理解能力并非簡單疊加，而是基于異構(gòu) MoE 架構(gòu)實現(xiàn)的模態(tài)融合，沒有盲目追求單一指標(biāo)的突破，而是在文本任務(wù)性能穩(wěn)定的基礎(chǔ)上，逐步增強多模態(tài)處理能力。

觀察 ERNIE 4.5 的技術(shù)結(jié)構(gòu)可以發(fā)現(xiàn)：ERNIE 4.5 的異構(gòu) MoE 架構(gòu)包含文本專家、視覺專家和共享專家三類 FFN 專家。

FFN 專家是指混合專家模型（MoE）中，由前饋神經(jīng)網(wǎng)絡(luò)（Feed-Forward Neural Network）構(gòu)成的專家模塊。

每個 FFN 專家都可以看作是一個獨立的子模型，能處理特定類型或范圍內(nèi)的數(shù)據(jù)。

模型會通過門控網(wǎng)絡(luò)或路由機制來確定對于每個輸入 token，應(yīng)該由哪些 FFN 專家負(fù)責(zé)處理。

比如在圖像理解中，無論是日常照片還是漫畫圖標(biāo)，模型都能輸出符合場景邏輯的解讀。這種能力的提升源于對多模態(tài)數(shù)據(jù)關(guān)聯(lián)性的持續(xù)學(xué)習(xí)，而非孤立的技術(shù)堆砌。

眾所周知，英偉達(dá)之所以強大，除了 AI 加速卡本身性能出色，也與以 CUDA 適配開發(fā)工具生態(tài)有緊密關(guān)系。

百度也同步推出了 ERNIE 4.5 的配套開發(fā)工具：開源完整的開發(fā)工具鏈，包括 ERNIEKit 訓(xùn)練工具和 FastDeploy 推理部署工具，旨在降低開發(fā)者使用大模型的門檻，推動多模態(tài) AI 技術(shù)的廣泛應(yīng)用。

這在本質(zhì)上，也是在踐行 " 工具應(yīng)當(dāng)服務(wù)于人 " 的技術(shù)倫理。

這些工具降低了模型后訓(xùn)練與部署的技術(shù)門檻，使開發(fā)者無需深入掌握底層原理，就能基于開源模型做二次開發(fā)。

百度此次開源并非孤立動作，早在今年 2 月，百度便公布了文心大模型 4.5 的開源計劃。

從生態(tài)構(gòu)建的角度看，文心大模型 4.5 的開源遵循了 " 技術(shù) - 用戶 - 數(shù)據(jù) " 的正向循環(huán)邏輯。

生態(tài)的價值在于連接而非控制。

百度通過開源將模型的使用權(quán)交給開發(fā)者，后者基于模型開發(fā)的應(yīng)用會產(chǎn)生新的數(shù)據(jù)反饋，這些數(shù)據(jù)又會反哺模型迭代。

比如零售企業(yè)用其開發(fā)商品圖像識別工具時，積累的行業(yè)數(shù)據(jù)可幫助模型優(yōu)化對商品特征的捕捉；教育機構(gòu)的使用則可能提升模型對教學(xué)場景的理解，這種分布式的優(yōu)化過程，比單一企業(yè)閉門研發(fā)更高效。

考量：平衡共享與可持續(xù)

飛槳平臺與文心模型的 " 雙層開源 "，進(jìn)一步強化了生態(tài)的協(xié)同性。

飛槳作為底層框架，為模型提供了運行環(huán)境；文心模型作為上層應(yīng)用載體，豐富了框架的使用場景。

此等結(jié)構(gòu)符合美國生物學(xué)家馬古利斯提出的 " 內(nèi)共生理論 " ——不同組件通過互利共生形成更強大的整體。

開發(fā)者在飛槳上調(diào)試文心模型時，不僅在使用工具，也在參與兩個系統(tǒng)的協(xié)同優(yōu)化，這種深度綁定比單純的技術(shù)輸出更能增強生態(tài)粘性。

但開源不意味著無邊界的免費。

文心大模型 4.5 采用 Apache 2.0 協(xié)議，既允許商業(yè)使用，也要求保留原作者信息，這樣的制度設(shè)計平衡了共享與權(quán)益保護。

實際上，從現(xiàn)實角度出發(fā)，清晰的產(chǎn)權(quán)界定是協(xié)作的前提。

明確的協(xié)議條款讓開發(fā)者知道可以做什么、不能做什么，避免了技術(shù)應(yīng)用中的法律風(fēng)險，也為百度保留了商業(yè)變現(xiàn)的空間：通過云平臺 API 服務(wù)、增值工具等方式實現(xiàn)可持續(xù)運營。

從成本角度看，開源是一種 " 分布式研發(fā) " 策略。大模型的訓(xùn)練與迭代需要持續(xù)投入算力與人力，單一企業(yè)難以承擔(dān)全部成本。

什么是好的管理呢？很簡單，就是讓合適的人做合適的事。

百度將模型開源后，全球開發(fā)者的智慧被納入創(chuàng)新體系，有人優(yōu)化推理速度，有人拓展應(yīng)用場景。這樣的分工，讓每個參與者都能聚焦自己擅長的領(lǐng)域，間接降低了整體研發(fā)成本。

對行業(yè)而言，百度的開源模式提供了一種 " 標(biāo)準(zhǔn)化基礎(chǔ)上的差異化創(chuàng)新 " 路徑。

基礎(chǔ)模型的統(tǒng)一，減少了重復(fù)研發(fā)的浪費；而開發(fā)者的二次創(chuàng)新，則能滿足不同行業(yè)的個性化需求。

就像制造業(yè)側(cè)重模型對工業(yè)圖紙的理解，傳媒行業(yè)則更關(guān)注文本生成的流暢性。這是一種 " 共性技術(shù) + 個性應(yīng)用 " 的模式，基礎(chǔ)技術(shù)是基因，行業(yè)應(yīng)用是其在不同環(huán)境中的表現(xiàn)型，豐富了技術(shù)的生態(tài)多樣性。

文心大模型 4.5 的開源，為國內(nèi)大模型產(chǎn)業(yè)提供了一種可參考的發(fā)展范式。

不同于閉源模式的黑箱操作，開源讓技術(shù)能力變得可觸摸、可驗證。開發(fā)者可直接查看模型權(quán)重與推理代碼，當(dāng)模型做出決策時，使用者能追溯其邏輯鏈條，而非被動接受結(jié)果。

從全球視角看，此次開源也是國產(chǎn)大模型參與國際協(xié)作的一次嘗試。

當(dāng)前全球大模型領(lǐng)域存在多種發(fā)展路徑：有的堅持閉源商用，有的選擇部分開源，有的則完全開放。

文心大模型 4.5 的全量開源，相當(dāng)于向全球開發(fā)者遞出了技術(shù)名片，其開放姿態(tài)，有助于國產(chǎn)技術(shù)融入全球創(chuàng)新網(wǎng)絡(luò)，在國際反饋中找準(zhǔn)自身定位。

當(dāng)然，開源并非萬能鑰匙。模型的性能最終仍需在實際應(yīng)用中檢驗：在工業(yè)質(zhì)檢場景中能否精準(zhǔn)識別微小缺陷，在政務(wù)服務(wù)中能否理解復(fù)雜的民生訴求，在教育輔助中能否貼合教學(xué)規(guī)律：這些真實場景的考驗，比實驗室的評測數(shù)據(jù)更有說服力。

百度開源文心大模型 4.5 的意義，或許不在于當(dāng)下的技術(shù)突破，而在于其展現(xiàn)的發(fā)展思路：在開放中凝聚共識，在協(xié)作中解決問題。

當(dāng)越來越多的開發(fā)者參與進(jìn)來，當(dāng)模型在更多行業(yè)場景中落地，大模型技術(shù)才能真正走出實驗室，成為推動社會進(jìn)步的實用工具，但這一過程沒有捷徑。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關(guān)標(biāo)簽

萬能鑰匙 ai

相關(guān)閱讀

金鋼科技獲數(shù)千萬元融資，瞄準(zhǔn)機器人磁編碼器市場

36氪 04-15

最新評論

沒有更多評論了

全天候科技

提供專業(yè)快速完整的科技商業(yè)資訊

訂閱

覺得文章不錯，微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

熱門訂閱換一批

藍(lán)鯊財經(jīng)社

追求最新的AI技術(shù)與財經(jīng)商業(yè)領(lǐng)域結(jié)合

Blockchain News

<sub id="jij03"></sub><span id="jij03"></span>

<sub id="jij03"></sub>

<small id="jij03"><tbody id="jij03"></tbody></small>