中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>

<bdo id="p9g43"></bdo>

<td id="p9g43"><tbody id="p9g43"></tbody></td>

雷鋒網(wǎng) 21小時前

國產(chǎn)算力公司「各自為戰(zhàn)」，曙光如何打通協(xié)作壁壘？

是什么契機，讓國內(nèi)耳熟能詳?shù)乃懔ο嚓P(guān)公司都濟濟一堂？

在 2025 世界智能產(chǎn)業(yè)博覽會的 AI 計算開放架構(gòu)暨新品發(fā)布會上，國產(chǎn)算力友商們擁有了某種向心力。而串聯(lián)起他們的核心紐帶，正是中科曙光發(fā)布的國內(nèi)首個 AI 計算開放架構(gòu)。

此次發(fā)布中，中科曙光協(xié)同 AI 芯片、AI 整機、大模型等 20 多家產(chǎn)業(yè)鏈上下游企業(yè)，共同推出 AI 超集群系統(tǒng)。在開放多項技術(shù)能力的同時，也宣布依托國家先進(jìn)計算產(chǎn)業(yè)創(chuàng)新中心，啟動 "AI 計算開放架構(gòu)聯(lián)合實驗室 " 的建設(shè)。

算力廠商們的集體亮相，背后也藏著大家對當(dāng)前國內(nèi)算力市場困局的共同焦慮：行業(yè)過去 " 強競爭、弱合作 "，導(dǎo)致國內(nèi)基礎(chǔ)設(shè)施市場雖然火熱，但不同廠商的服務(wù)器、存儲設(shè)備、算力調(diào)度平臺大多采用專有接口與協(xié)議，缺乏統(tǒng)一技術(shù)標(biāo)準(zhǔn)，從而難以形成合力，突破瓶頸。

那么，對當(dāng)下的國內(nèi)算力生態(tài)而言，曙光的這步嘗試究竟價值何在？為了推動這場突破，他們又做了哪些準(zhǔn)備？

算力產(chǎn)業(yè)鏈環(huán)節(jié)細(xì)分，內(nèi)部卻是 " 一盤散沙 "

在外部生態(tài)護(hù)城河難以攻克之時，內(nèi)部算力廠商卻仍各自為戰(zhàn)、缺乏協(xié)同，這是國內(nèi)算力市場的一大瓶頸。

而這種局面的出現(xiàn)，一大原因是 GPU 領(lǐng)域內(nèi)大量不同的品牌、廠商，彼此之間不同的算力密度、互聯(lián)方式以及生態(tài)體系差別，筑起的異構(gòu)壁壘。

2023 年前后，異構(gòu)問題的解決被越來越多廠商提上日程。然而，目前的嘗試并不盡如人意——

在技術(shù)上，不同芯片算子庫不同，運行時的技術(shù)適配差異會增大整合難度；同時，異構(gòu)的協(xié)調(diào)需要對 GPU 性能進(jìn)行預(yù)測及拆分，甚至涉及硬件協(xié)調(diào)。

在生態(tài)上，中科曙光總裁助理、智能計算產(chǎn)品事業(yè)部總經(jīng)理杜夏威向雷峰網(wǎng)介紹，行業(yè)已習(xí)慣在國際主流生態(tài)的框架下運行，現(xiàn)有慣性難以打破；且產(chǎn)業(yè)迭代速度極快、技術(shù)更新頻繁之下，AI 各個產(chǎn)業(yè)板塊發(fā)展都很活躍，這導(dǎo)致 " 齒輪 " 之間并沒有嚴(yán)絲合縫協(xié)同。

這些問題沒有解決，目前的異構(gòu)混訓(xùn)就依然會對效率造成莫大犧牲——有業(yè)內(nèi)人士指出，隨著 AI 加速卡數(shù)量的增加和不同芯片類型加入，混訓(xùn)的魯棒性和穩(wěn)定性都會變差。杜夏威觀察到 " 人們對打破壁壘的未知恐懼普遍存在 "，但市場對廠商邁出這一步的需求，已迫在眉睫。

杜夏威指出，云計算時代，客戶的起步往往較云計算提供商晚，市場教育周期可能較長；而在 AI 大模型時代，客戶接受度極高，快速增長的海量需求反推數(shù)據(jù)中心的運營革新，市場正倒逼廠商啃下異構(gòu)集群統(tǒng)一標(biāo)準(zhǔn)的 " 硬骨頭 "。

雖然有觀點認(rèn)為，異構(gòu)需求只是國產(chǎn)芯片提升性能過程中的過渡性階段，智算中心最終還是會回歸到同構(gòu)的基礎(chǔ)架構(gòu)；然而，在未來算力市場發(fā)展的短期內(nèi)，異構(gòu)需求只會有增無減：

一方面，數(shù)據(jù)中心的國產(chǎn)化比例要求逐漸嚴(yán)格，以前國產(chǎn)卡比例在數(shù)據(jù)中心內(nèi)可能只占兩成，但今年窗口指導(dǎo)等相關(guān)政策頒布后，未來可能有所升高。

另一方面，部分使用先進(jìn)算力加國產(chǎn)化算力的組合集群的大模型客戶，也明確擁有對混訓(xùn)能力的要求。

有見及此，2025 智博會上，中科曙光協(xié)同 AI 芯片、AI 整機、大模型等 20 多家產(chǎn)業(yè)鏈上下游企業(yè)，共同發(fā)布了國內(nèi)首個 AI 計算開放架構(gòu)，并基于該架構(gòu)推出 AI 超集群系統(tǒng)。

這套超集群單機柜支持 96 張加速卡，可提供超過 100P 的 AI 算力，最高能夠?qū)崿F(xiàn)百萬卡大規(guī)模擴展。它還能支持深度開發(fā)用戶迭代自有程序，同時幫助傳統(tǒng)行業(yè)用戶快速復(fù)用 AI 模型、整合業(yè)務(wù)。

與專有封閉系統(tǒng)相比，這套系統(tǒng)可適配支持多品牌 GPU 加速卡，兼容 CUDA 等主流軟件生態(tài)，為用戶提供更多選擇；同時也大幅降低硬件成本和軟件開發(fā)適配成本，使得前期投資壓力較小。

并且，曙光也攜手眾多產(chǎn)業(yè)鏈企業(yè)開放七項核心技術(shù)，包括 CPU 與 AI 加速器高性能接口協(xié)議、加速器互連協(xié)議，液冷基礎(chǔ)設(shè)施層面的規(guī)范，以及軟件棧的整合經(jīng)驗等。

" 這個 AI 超集群最大的特點，就是多元化和包容化 "，杜夏威說道。在他看來，異構(gòu)并非局限地理解為把多個品牌揉在一個系統(tǒng)下，而是尋找大家在整個系統(tǒng)化工程中擅長的部分，嘗試通過深度合作來形成對產(chǎn)業(yè)的良好支撐。

而曙光能成為開放架構(gòu)號召人的角色，正源自其多年來的實驗積累。

中科曙光高級副總裁李斌說道，過去十年，中科曙光建設(shè)了 20 多個大規(guī)模算力集群，累計部署超 50 萬張異構(gòu)加速卡。從大型機到集群，從小規(guī)模算力到超大規(guī)模算力系統(tǒng)，曙光在產(chǎn)業(yè)鏈各層級的沉淀，令其足以起串聯(lián)上下游。

這種串聯(lián)，一方面能讓各個環(huán)節(jié)的算力公司不再 " 重復(fù)造輪子 "，減少為多種不同架構(gòu)重復(fù)研發(fā)的無效過程；另一方面，也能在當(dāng)前國內(nèi)算力供需匹配不足的情況下，有效整合起分散的算力資源。

不過，讓算力資源有效運轉(zhuǎn)的條件之一，是要保障集群能長久穩(wěn)定地基礎(chǔ)運營。為此，曙光做的準(zhǔn)備遠(yuǎn)不止這些。

做好模型訓(xùn)練中的 " 臟活累活 "

智博會上，中科曙光展臺正中間立著 AI 超集群產(chǎn)品，其存儲、液冷、生態(tài)等板塊的細(xì)分展區(qū)分布四周，將其簇?fù)砥渲小?/p>

據(jù)介紹，這套 AI 超集群千卡集群大模型訓(xùn)推性能達(dá)到業(yè)界主流水平的 2.3 倍，其完善的工具鏈和軟件棧能把開發(fā)效率提升 4 倍，人力和時間投入降低 70%。

GPU 時代對軟硬件的協(xié)同優(yōu)化提出更高要求，杜夏威說道，曙光的這套架構(gòu)，也涵蓋了資源運管調(diào)度、下層并行化等策略，以及專家并行、PD 分離等技術(shù)，確保底層算力高效發(fā)揮。同時，也對底層通信庫、算子庫進(jìn)行優(yōu)化，能做到以軟件棧的形態(tài)交付服務(wù)。

而在存算方面，曙光也提出了 " 以存提算 "、存算一體，通過 Burstbuffer 數(shù)據(jù)緩存的使用，結(jié)合超級隧道降低交互，保障數(shù)據(jù) IO 以及傳輸有自己高效的專屬通道，讓 GPU 算力效能增加了 55%。

此外，那些在大模型時代發(fā)展早期被有意回避的 " 臟活累活 " ——提高穩(wěn)定性、減少故障率、縮短故障恢復(fù)時間——反而成了曙光新品的亮眼名片：

在曙光的這套新集群中，其平均無故障時間（MTBF）提高了 2.1 倍，平均故障修復(fù)時間（MTTR）降低到原來的 47% 等。" 把不影響原有業(yè)務(wù)運轉(zhuǎn)的故障替換技術(shù)，逐步釋放到整個 AI 超集群中 "，是曙光下一步發(fā)展的目標(biāo)。

高溫，也是大集群穩(wěn)定運行的一大克星。一般來說，芯片工作溫度每升高 10 度，失效率就會翻倍。曙光數(shù)創(chuàng) CTO 張鵬算了這樣一筆賬：目前，曙光通過液冷能做到 PUE 1.04，相當(dāng)于每帶走 100 個單位的熱量，只需額外花費 4 個單位的能量；而以往風(fēng)冷的能量比效率只是 1:1，相比起來，液冷的能耗節(jié)省非常明顯。

不過，在冷板、浸沒、噴淋三大液冷路線中，冷板雖先行落地成為主流，但面對目前已達(dá) 1000w 級 GPU 運行時的 " 熱浪 "，已有些捉襟見肘。

要讓芯片算力得以充分釋放，下一扇需要開啟的門是 " 浸沒 "。而曙光已經(jīng)率先握住了這把鑰匙。

中科曙光在展會現(xiàn)場展出的相變浸沒液冷設(shè)備，令雷峰網(wǎng)印象深刻——

透過玻璃視窗，可以看到 8 塊 GPU 和 2 塊 CPU 浸泡在無色液體中。細(xì)密的氣泡從芯片上覆蓋而過，旋即升騰、折向右側(cè)，形成穩(wěn)定而精確的 " 蒸汽軌道 "。

據(jù)現(xiàn)場工作人員介紹，這些特殊液體的沸騰溫度僅在 50 度左右，遠(yuǎn)低于芯片運行時 80-90 度的工作溫度。于是，在持續(xù)的沸騰中，熱量便被汽化的小氣泡裹挾帶走、隨后消散。

曙光展出的相變浸沒液冷設(shè)備，攝：雷峰網(wǎng)李想

做大型機和集群起家的曙光，從 2011 年就開始布局靜默式冷板液冷，在 2015 年量產(chǎn) TC40 冷板式高密度服務(wù)器。盡管如此，張鵬還是感慨，數(shù)據(jù)中心需求迅猛增長的這幾年，已經(jīng)對液冷發(fā)展提出近乎苛刻的高要求：

現(xiàn)在的智算中心比起傳統(tǒng)通用數(shù)據(jù)中心，負(fù)載變化率很快——在訓(xùn)練和推理中，一個回車按下的毫秒里，所有需求就要達(dá)到滿載。與此同時，單機柜功率密度在短短幾年內(nèi)從 60 千瓦，飆升至 200 千瓦甚至 300 千瓦。

曙光的這場發(fā)布，是一次團(tuán)結(jié)國內(nèi)算力生態(tài)的初嘗試，具體效果有待時間檢驗，但至少，在 " 蘋果生態(tài) " 為王的算力市場里，他們已經(jīng)打響構(gòu)建 " 安卓生態(tài) " 的第一槍。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關(guān)標(biāo)簽

ai 曙光 gpu

相關(guān)閱讀

NVIDIA宣布下代AI服務(wù)器：288顆GPU＋36顆CPU 800億億次每秒

快科技 58分鐘前

Intel高管：10臺PC有7臺用Intel處理器！我們地位依然穩(wěn)固

快科技 58分鐘前

“史上最薄”iPhone登場，分析師怎么看？

財聯(lián)社 2小時前

騰訊、阿里股價揚眉吐氣：財報披露AI戰(zhàn)備與增長挑戰(zhàn)

21世紀(jì)經(jīng)濟報道 4小時前

阿里巴巴，投出AI視頻生成賽道最大單筆融資

財經(jīng)新聞 5小時前

高德發(fā)布信用產(chǎn)品“掃街榜”！高德CEO承諾：掃街榜永不商業(yè)化

快科技 5小時前

最貴17999！iPhone 17國行版售價公布被擠上熱搜：網(wǎng)友直呼蘋果定價“良心”

快科技 7小時前

這家公司十噸級固態(tài)電池電解質(zhì)小批量出貨，百噸級硫化鋰產(chǎn)線產(chǎn)能爬坡中，并送樣下游客戶

財聯(lián)社 7小時前

王騰去職，科技巨頭的保密之戰(zhàn)

21世紀(jì)經(jīng)濟報道 9小時前

“人工智能+”加速跑算力追得上嗎？

21世紀(jì)經(jīng)濟報道 9小時前

中國供應(yīng)鏈脈動：具身智能的卡位、跨界與破圈

21世紀(jì)經(jīng)濟報道 9小時前

微信又有新功能！網(wǎng)友：再也不怕發(fā)錯群了

資訊貴陽 57分鐘前

聞香識本，華碩a豆&嬌蘭閃光禮盒，讓工作學(xué)習(xí)都自帶仙氣

太平洋科技 35分鐘前

為家庭教育減負(fù)增效！愛普生AI學(xué)習(xí)打印機全球首發(fā)，AI+打印重塑紙質(zhì)學(xué)習(xí)體驗

太平洋科技 1小時前

把“小產(chǎn)品”做出“大科技”，艾芬達(dá)重構(gòu)全球暖通行業(yè)話語權(quán)

時代財經(jīng) 4小時前

最新評論

沒有更多評論了

雷峰網(wǎng)

讀懂智能&未來

訂閱

覺得文章不錯，微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

熱門訂閱換一批

Blockchain News

<source id="7er2s"><abbr id="7er2s"></abbr></source>