雙方圍繞語(yǔ)音交互、大模型能力以及 Agent 等核心方向展開全面協(xié)同,共同推動(dòng)高德地圖從 " 連接世界 " 邁向 " 理解世界 " 的全新階段。
全鏈路語(yǔ)音共建:更精準(zhǔn)、更自然的交互體驗(yàn)
作為全球首個(gè) AI 原生地圖應(yīng)用,高德地圖 2025 的核心亮點(diǎn)之一,是推出業(yè)內(nèi)首個(gè)專精出行生活的智能體 " 小高老師 ",它可基于音頻、文本輸入等多模態(tài)方式,與用戶直觀交互。
在語(yǔ)音能力上,高德與通義實(shí)驗(yàn)室語(yǔ)音團(tuán)隊(duì)聯(lián)合打造了覆蓋喚醒、識(shí)別、理解、播報(bào)等環(huán)節(jié)的全鏈路能力,助力 " 小高老師 " 實(shí)現(xiàn)了行業(yè)領(lǐng)先的識(shí)別精度和交互流暢度。
雙方構(gòu)建的新一代語(yǔ)音語(yǔ)義感知系統(tǒng),由高德導(dǎo)航專用 ASR(語(yǔ)音識(shí)別)模型、通用領(lǐng)域大模型 ASR、高德大模型綜合理解能力等模型組成,全面覆蓋導(dǎo)航、本地生活、日常閑聊三大場(chǎng)景。
此外,全雙工語(yǔ)音技術(shù)的應(yīng)用,讓用戶體驗(yàn) " 小高老師 " 時(shí)可隨時(shí)打斷并發(fā)起新指令;抗回聲處理則確保用戶在復(fù)雜聲學(xué)場(chǎng)景下依然能保持清晰、順暢的交互體驗(yàn)。
大模型底座加持:通義 Qwen 賦能空間理解
在用戶使用過程中," 小高老師 " 能高效調(diào)度高德內(nèi)部近百種工具,將內(nèi)外部數(shù)據(jù)資源整合分析,生成最佳回答反饋和地圖交互動(dòng)作。
支撐這一能力的,是高德和通義共建的大模型簇——該模型簇由多模態(tài)空間感知、行為認(rèn)知、時(shí)空意圖理解、總結(jié)輸出交互和反饋觀測(cè)評(píng)估等多個(gè)專業(yè)模型構(gòu)成。
通義大模型具備全球領(lǐng)先的預(yù)訓(xùn)練規(guī)模與語(yǔ)義理解能力:Qwen2.5 已在 18 萬(wàn)億 token 上完成預(yù)訓(xùn)練,而 Qwen3 的數(shù)據(jù)量幾乎翻倍,達(dá)到約 36 萬(wàn)億 token。
憑借強(qiáng)大的底座能力,通義大模型已成為全球主流的基座模型之一。綜合 Hugging Face、魔搭等社區(qū)數(shù)據(jù),Qwen 系列大模型的下載量已達(dá) 4 億次,同時(shí)衍生模型數(shù)量超過 14 萬(wàn)個(gè),位居全球第一。
基于通義 Qwen 模型的底座能力,高德通過 SFT(指令微調(diào))訓(xùn)練,顯著提升了其在出行生活場(chǎng)景中的語(yǔ)義理解、上下文感知與響應(yīng)能力。
智能 Agent 登場(chǎng):出行決策化繁為簡(jiǎn)
在 Agent 領(lǐng)域,基于高德自研的 DeepResearch 框架,通義實(shí)驗(yàn)室和高德聯(lián)合開發(fā)了地圖領(lǐng)域的復(fù)雜 POI 推理 Agent,可通過理解多重約束條件、有效使用地圖和搜索工具以及整合實(shí)時(shí)聯(lián)網(wǎng)信息,為用戶提供精準(zhǔn)的 POI 推薦與導(dǎo)航服務(wù)。
該 DeepResearch 框架融合了強(qiáng)大的規(guī)劃(Planning)、反思(Reflection)和工具調(diào)用(Tool Calling)機(jī)制,具備對(duì)高德地圖全棧工具的深度理解和使用能力,能夠智能地拆解復(fù)雜任務(wù)、評(píng)估執(zhí)行路徑并高效協(xié)調(diào)各類工具。
基于此框架開發(fā)的推理 Agent 具備三大能力:
首先,基于雙方共建的高德專屬推理能力模型,該 Agent 具備了地圖領(lǐng)域領(lǐng)先的多維 POI 推理能力,可實(shí)現(xiàn)復(fù)雜時(shí)空需求的理解以及復(fù)雜 POI 的解析及處理,支持對(duì)事件、地理、參與者、時(shí)間、交通、POI 屬性等多重約束的綜合判斷;
其次,該 Agent 為高德預(yù)置了專屬地圖 API、實(shí)時(shí)天氣查詢、交通狀況監(jiān)測(cè)、POI 數(shù)據(jù)查詢 API 等工具,并能基于 POI 理解自主調(diào)度相關(guān)工具。同時(shí),它還能輕松集成新的工具和數(shù)據(jù)源,以適應(yīng)不斷變化的場(chǎng)景需求,無(wú)論是新增的 POI 類型、交通方式還是實(shí)時(shí)數(shù)據(jù),都能快速適配并提供相應(yīng)服務(wù)。
最后,該 Agent 可實(shí)現(xiàn)復(fù)雜場(chǎng)景下的 POI 任務(wù)處理,例如多 POI 路線規(guī)劃、實(shí)時(shí)約束下的 POI 推薦、定制化 POI 推薦以及長(zhǎng)時(shí)間旅行規(guī)劃建議等。
" 模型 + 場(chǎng)景 " 深度融合:AI 能力落地的行業(yè)范式
此次合作,不僅是高德與通義實(shí)驗(yàn)室技術(shù)能力的疊加,更是生態(tài)協(xié)同共建的深度實(shí)踐。通義大模型的泛化能力與高德在空間場(chǎng)景上的深度積累,在 AI 原生地圖中實(shí)現(xiàn)了前所未有的深度融合。
一方面,高德以通義大模型為 AI 底座,構(gòu)建了具備理解真實(shí)世界能力的空間智能,這不僅賦能高德地圖 APP 迭代升級(jí),未來(lái)還能驅(qū)動(dòng)智能汽車、智能眼鏡、具身智能、低空飛行等領(lǐng)域的變革。
另一方面,通義實(shí)驗(yàn)室則通過高德地圖這一海量用戶場(chǎng)景,推動(dòng)大模型能力的真實(shí)落地與驗(yàn)證,加速其在 C 端產(chǎn)品中的規(guī)?;瘧?yīng)用。
可以預(yù)見,高德與通義實(shí)驗(yàn)室的合作將成為 " 模型 + 場(chǎng)景 " 跨域融合的行業(yè)范式,為 AI 能力在更多真實(shí)世界場(chǎng)景中的落地提供可復(fù)制的實(shí)踐經(jīng)驗(yàn)。