文 | 產(chǎn)業(yè)家,作者 | 斗斗,編輯 | 皮爺
數(shù)據(jù)庫的角色正在被徹底重寫:不再只是數(shù)據(jù)倉庫、事務(wù)賬本、分析引擎,而是智能系統(tǒng)中真正可信的核心。AI 成為組織大腦,數(shù)據(jù)庫就是數(shù)據(jù)調(diào)度的中樞——誰掌握數(shù)據(jù)流,誰就掌握智能流。
數(shù)據(jù)庫,這個(gè)長期 " 藏在后臺(tái) " 的基礎(chǔ)設(shè)施,正被 AI 時(shí)代推向臺(tái)前。
客服想更精準(zhǔn)地回答用戶問題,推薦系統(tǒng)希望更快做出響應(yīng),風(fēng)控模型則需要更實(shí)時(shí)地識(shí)別風(fēng)險(xiǎn)——這些智能能力的背后,離不開數(shù)據(jù)庫提供持續(xù)、結(jié)構(gòu)化、具備上下文的數(shù)據(jù)支撐。
" 以前數(shù)據(jù)庫是倉庫,現(xiàn)在更像是中樞。"Databend CEO 張雁飛這樣對(duì)產(chǎn)業(yè)家形容。
這一角色轉(zhuǎn)變,正重新定義數(shù)據(jù)庫在企業(yè)系統(tǒng)中的位置:它不僅要存數(shù)據(jù),還要參與推理、支撐決策、響應(yīng)模型調(diào)用,成為智能系統(tǒng)的 " 實(shí)時(shí)大腦 "。
與此同時(shí),問題也隨之而來。
" 原先的權(quán)限系統(tǒng)正在失效。" 某上市企業(yè)數(shù)據(jù)安全產(chǎn)品部總經(jīng)理陳宇耀對(duì)產(chǎn)業(yè)家直言。
一個(gè)事實(shí)是,性能跟不上、權(quán)限不好管、安全邊界模糊……尤其在 AI 大量接入后,傳統(tǒng)數(shù)據(jù)庫架構(gòu)和管理方式正面臨重壓。
數(shù)據(jù)庫,正在經(jīng)歷一次深層的升級(jí)。
這一輪變化,對(duì)廠商、客戶、產(chǎn)品、安全體系,都是一次重新洗牌。
一、AI,讓數(shù)據(jù)庫正在 " 走向前臺(tái) "
" 過去數(shù)據(jù)庫偏向后臺(tái)靜態(tài)數(shù)據(jù)倉庫,而今天,它更像一個(gè)前臺(tái)實(shí)時(shí)系統(tǒng)。" 張雁飛告訴產(chǎn)業(yè)家," 數(shù)據(jù)庫,終于有新故事了。"
過去,數(shù)據(jù)庫的核心職責(zé)是存儲(chǔ)和查詢,主要被用于記錄訂單、交易、庫存等結(jié)構(gòu)化數(shù)據(jù)。但隨著 AI 模型進(jìn)入客服、搜索、推薦、分析等業(yè)務(wù)流程,數(shù)據(jù)庫的角色正在發(fā)生變化。
越來越多企業(yè)意識(shí)到,要讓 AI 系統(tǒng) " 理解業(yè)務(wù) ",必須讓它獲取實(shí)時(shí)的、結(jié)構(gòu)化的數(shù)據(jù)上下文。而這些數(shù)據(jù),大多存放在數(shù)據(jù)庫中。數(shù)據(jù)庫逐漸成為 AI 模型背后的信息源,也成為支撐企業(yè)自動(dòng)化流程的關(guān)鍵基礎(chǔ)設(shè)施。
在搜索增強(qiáng)生成(RAG)、Agent 系統(tǒng)、實(shí)時(shí)推薦等場景中,數(shù)據(jù)庫被用于:存儲(chǔ)模型調(diào)用所需的上下文信息,如用戶歷史、商品屬性、產(chǎn)品知識(shí);支持向量檢索,用于語義搜索、相似內(nèi)容匹配;記錄 AI Agent 的狀態(tài)和決策流程,確保自動(dòng)化行為可追蹤、可回溯。
數(shù)據(jù)庫的調(diào)用方式也在變化。
以往是人操作系統(tǒng)時(shí)觸發(fā)數(shù)據(jù)庫查詢,現(xiàn)在是模型或 Agent 自動(dòng)生成請(qǐng)求。這些請(qǐng)求頻率高、鏈路復(fù)雜、語義模糊,對(duì)數(shù)據(jù)庫的性能和響應(yīng)能力提出更高要求。
多位數(shù)據(jù)庫從業(yè)者跟產(chǎn)業(yè)家提到,客戶正在要求數(shù)據(jù)庫 " 不僅能存數(shù)據(jù),還要能理解語義 "。這意味著數(shù)據(jù)庫需要支持更豐富的索引結(jié)構(gòu)、更靈活的數(shù)據(jù)格式,以及與 AI 系統(tǒng)之間更高效的接口。
" 一個(gè)客戶將數(shù)據(jù)庫接入 AI 客服系統(tǒng),每一次用戶提問,模型都需要查詢產(chǎn)品信息、用戶偏好、訂單狀態(tài)等多個(gè)字段。過去一分鐘調(diào)用幾次數(shù)據(jù)庫就足夠,現(xiàn)在幾秒鐘可能就要處理上百次請(qǐng)求。" 張雁飛告訴產(chǎn)業(yè)家。
除了性能壓力,客戶也希望數(shù)據(jù)庫能兼容多種數(shù)據(jù)類型。
一些新應(yīng)用需要同時(shí)處理結(jié)構(gòu)化數(shù)據(jù)(如用戶表)、非結(jié)構(gòu)化數(shù)據(jù)(如文本記錄)、向量數(shù)據(jù)(如語義嵌入)。數(shù)據(jù)庫產(chǎn)品也開始集成更多原本由搜索引擎、緩存系統(tǒng)、特征平臺(tái)承擔(dān)的功能。
這種變化不只是企業(yè)需求上的提升,也帶動(dòng)數(shù)據(jù)庫產(chǎn)品形態(tài)的演進(jìn)。傳統(tǒng)數(shù)據(jù)庫的設(shè)計(jì)假設(shè)是 " 人操作系統(tǒng) ",現(xiàn)在則必須適應(yīng) "AI 操作系統(tǒng) " 的需求。
一些主流數(shù)據(jù)庫產(chǎn)品已開始做出回應(yīng)。
例如,PostgreSQL 社區(qū)涌現(xiàn)出多個(gè)兼容 LLM 的擴(kuò)展模塊;Databend 等云原生數(shù)倉則在底層集成向量與結(jié)構(gòu)化數(shù)據(jù)的混合檢索能力。
尤其是 Databend,其優(yōu)勢(shì)在新一輪洗牌中愈發(fā)凸顯。
張雁飛告訴產(chǎn)業(yè)家:" 我們并不是在給傳統(tǒng)數(shù)據(jù)庫加 AI 插件,而是在為 AI 生態(tài)造數(shù)據(jù)庫。"
在研發(fā)一線,這種變化也體現(xiàn)在團(tuán)隊(duì)討論方式的轉(zhuǎn)變。
過去數(shù)據(jù)庫團(tuán)隊(duì)主要關(guān)注寫入性能、查詢優(yōu)化、事務(wù)一致性,現(xiàn)在越來越多話題圍繞 " 模型能不能讀得快、Agent 調(diào)得穩(wěn)、上下文能否持續(xù)更新 "。
總的來說,數(shù)據(jù)庫的 " 用戶 " 已經(jīng)從人,變成了模型和 Agent。
這是一個(gè)看似細(xì)微、實(shí)則根本的變化。
它不僅改變了數(shù)據(jù)庫的訪問方式,也意味著數(shù)據(jù)庫必須承擔(dān)更多 " 推理輔助 " 和 " 協(xié)同管理 " 的責(zé)任。
二、技術(shù)轉(zhuǎn)型的挑戰(zhàn)和安全隱憂,集體爆發(fā)
數(shù)據(jù)庫 " 走向前臺(tái) " 的轉(zhuǎn)變,不只是性能優(yōu)化的問題,更是一場架構(gòu)重構(gòu)和安全重塑的系統(tǒng)性挑戰(zhàn)。
在 AI 時(shí)代,數(shù)據(jù)庫廠商面臨的核心問題不再是單點(diǎn)能力的提升,而是如何適應(yīng)更復(fù)雜、更動(dòng)態(tài)的智能應(yīng)用需求。
首先,數(shù)據(jù)庫形態(tài)正在發(fā)生根本性變化。過去,系統(tǒng)按 " 專一能力 " 劃分——做事務(wù)處理就專注 OLTP,做分析就服務(wù)于數(shù)據(jù)倉庫。
但今天的企業(yè),越來越傾向于 " 一庫多能 "。既要結(jié)構(gòu)化查詢,也要圖譜檢索、向量搜索、流式處理,甚至希望能原生支持 Prompt 編排與自然語言接口。
" 客戶經(jīng)常問我們,能不能一個(gè)數(shù)據(jù)庫同時(shí)做推薦、搜索,還能配合 Copilot。" 張雁飛說," 這不是簡單的功能疊加,而是要求我們從內(nèi)核設(shè)計(jì)上支持多模態(tài)融合。"
為了支撐 AI 系統(tǒng)復(fù)雜的調(diào)用鏈,數(shù)據(jù)庫廠商正在底層架構(gòu)上做出調(diào)整。例如,在索引體系中引入倒排索引、向量索引和混合檢索模塊;在查詢引擎中兼容 SQL 與自然語言解析;在執(zhí)行邏輯上犧牲部分一致性,以保證實(shí)時(shí)響應(yīng)。
張雁飛表示:" 客戶不關(guān)心數(shù)據(jù)庫叫什么名字,他們關(guān)心的是,這個(gè)數(shù)據(jù)庫能不能支撐 AI 系統(tǒng)實(shí)時(shí)運(yùn)行。"
但這讓一些問題逐漸顯現(xiàn)。
一個(gè)事實(shí)是,盡管國內(nèi)數(shù)據(jù)庫廠商在 OLTP 與 OLAP 領(lǐng)域已有突破,但面對(duì) AI 原生場景,依然存在架構(gòu)短板。向量檢索、多模融合、Agent 友好型接口等新需求,對(duì)廠商的系統(tǒng)設(shè)計(jì)靈活性和技術(shù)積累提出更高要求。
" 我們一開始就以 Serverless 和云原生為基礎(chǔ),這才讓我們有機(jī)會(huì)在底層集成向量和圖譜等能力。" 張雁飛坦言," 如果從關(guān)系型出發(fā),中途再轉(zhuǎn),幾乎不可能。"
與此同時(shí),數(shù)據(jù)庫的安全模型也面臨前所未有的挑戰(zhàn)。
過去,安全重點(diǎn)是 " 防人出錯(cuò) " ——通過權(quán)限配置、訪問控制、加密等手段保護(hù)數(shù)據(jù)。但如今,數(shù)據(jù)庫頻繁被 AI 模型與 Agent 程序調(diào)用,這些系統(tǒng)具備 " 類人 " 的主動(dòng)性,傳統(tǒng)的權(quán)限體系正在失效。
" 以前權(quán)限是基于角色或崗位來配置的。但現(xiàn)在,一個(gè) Agent 可能同時(shí)代表多個(gè)角色,每秒發(fā)起成百上千次請(qǐng)求,我們根本不知道它在查什么。" 陳宇耀對(duì)產(chǎn)業(yè)家說。
權(quán)限失控已不再是預(yù)警,而是現(xiàn)實(shí)問題。
許多企業(yè)在部署 AI 系統(tǒng)時(shí),忽略了對(duì) Agent 行為的審計(jì)和限制。例如,在 RAG 系統(tǒng)中,若缺乏權(quán)限過濾,用戶可能通過 Prompt 調(diào)取數(shù)據(jù)庫中的敏感信息。
" 問題不在模型本身,而在于數(shù)據(jù)庫缺乏識(shí)別‘訪問者身份’與‘訪問動(dòng)機(jī)’的能力。" 陳宇耀指出。
更值得警惕的是,向量數(shù)據(jù)庫還引入了新的安全風(fēng)險(xiǎn):攻擊者可能反推訓(xùn)練語料,或通過注入 " 污染數(shù)據(jù) " 操控檢索結(jié)果,進(jìn)而影響模型輸出。
" 我們已經(jīng)看到一些攻擊案例:在知識(shí)庫中混入歪曲內(nèi)容,讓模型輸出出現(xiàn)偏差。" 陳宇耀告訴產(chǎn)業(yè)家," 傳統(tǒng)的數(shù)據(jù)防泄漏系統(tǒng)在這里幾乎無效,因?yàn)樗鼰o法識(shí)別語義層的攻擊。"
這也意味著,數(shù)據(jù)庫安全的定義正在被重寫。
過去關(guān)注的是 " 存儲(chǔ)安全 ",而 AI 時(shí)代,更需要關(guān)注調(diào)用鏈路的可見性、訪問行為的可解釋性,以及上下文權(quán)限的動(dòng)態(tài)調(diào)整能力。
" 數(shù)據(jù)不再固定在一個(gè)庫里,它在多個(gè) Agent 之間流動(dòng)。" 陳宇耀總結(jié)道," 未來需要一種新型安全組件,它不再圍繞‘系統(tǒng)邊界’,而是圍繞‘?dāng)?shù)據(jù)本體’建立權(quán)限策略——權(quán)限要隨數(shù)據(jù)走。"
三、數(shù)據(jù)庫 +AI 怎么走?走到哪了?
面對(duì) AI 引發(fā)的結(jié)構(gòu)重構(gòu)與安全沖擊,企業(yè)開始嘗試通過 " 補(bǔ)能力、調(diào)權(quán)限、改架構(gòu) " 的方式應(yīng)對(duì),但這些嘗試大多仍處在探索初期。
第一步嘗試,集中在產(chǎn)品能力的擴(kuò)展上。
企業(yè)希望數(shù)據(jù)庫能原生支持文本、圖像、向量等多模數(shù)據(jù)處理,減少對(duì)中間件的依賴。" 客戶越來越希望一個(gè)系統(tǒng)處理多種數(shù)據(jù)結(jié)構(gòu),而不是東拼西湊。" 張雁飛直言。
然而,從實(shí)際來看,這一能力尚未標(biāo)準(zhǔn)化。
一些系統(tǒng)僅支持簡單的向量相似度計(jì)算,難以勝任復(fù)雜語義檢索;也有廠商雖引入向量模塊,但與主查詢引擎耦合度低,存在性能瓶頸與一致性問題。" 數(shù)據(jù)庫 + 向量 " 更多是 " 接上了 ",距離 " 融合好用 " 仍有距離。
與此同時(shí)," 上下文管理 " 機(jī)制也尚不成熟。當(dāng)前多依賴緩存或臨時(shí)表來提供上下文信息,缺乏一套高效統(tǒng)一的調(diào)用模型。多位業(yè)內(nèi)人士坦言,目前尚無數(shù)據(jù)庫在 AI 上下文支持方面形成行業(yè)共識(shí)。
第二類應(yīng)對(duì),聚焦于安全模型的重構(gòu)。
AI 系統(tǒng)頻繁調(diào)用數(shù)據(jù)庫,但原有權(quán)限設(shè)計(jì)與審計(jì)機(jī)制并未同步升級(jí)。一些企業(yè)嘗試通過 Agent 側(cè)的訪問白名單、上下文窗口等方式,限制其可訪問字段范圍。
" 以前權(quán)限是‘人對(duì)人’,現(xiàn)在得變成‘ Agent 對(duì)字段’。但很多企業(yè)甚至搞不清自己用了多少數(shù)據(jù)庫調(diào)用、有哪些 Agent 在跑。" 陳宇耀說道。
雖然部分企業(yè)已引入運(yùn)行時(shí)加密、動(dòng)態(tài)權(quán)限調(diào)整、審計(jì)網(wǎng)關(guān)等機(jī)制,但這些組件多為外掛,無法與數(shù)據(jù)庫主系統(tǒng)統(tǒng)一策略、協(xié)同運(yùn)行,反而增加了系統(tǒng)復(fù)雜度。
更大的問題在于,大多數(shù)數(shù)據(jù)庫并不具備原生的 " 身份鏈路 " 和 " 行為路徑 " 可視能力。AI 調(diào)用鏈路層層嵌套、日志分散,企業(yè)即使發(fā)現(xiàn)風(fēng)險(xiǎn)事件,也難以準(zhǔn)確追溯全過程。
第三類嘗試,則是在整體架構(gòu)上做取舍與隔離。
部分企業(yè)選擇將敏感數(shù)據(jù)保留在本地,僅在云端運(yùn)行非核心 AI 任務(wù);也有企業(yè)部署數(shù)據(jù)庫一體機(jī),封閉 Agent 接口以強(qiáng)化管控。
" 一家金融客戶把 Agent 的訪問范圍限制在每日自動(dòng)銷毀的只讀表內(nèi),雖然安全,但代價(jià)是靈活性和實(shí)時(shí)性大打折扣。" 張雁飛說。
當(dāng)前,混合部署與權(quán)限隔離是相對(duì)可行的務(wù)實(shí)策略,但也帶來數(shù)據(jù)同步壓力、接口維護(hù)成本高、系統(tǒng)響應(yīng)延遲等一系列副作用。而要真正實(shí)現(xiàn) " 安全與效率兼顧 ",企業(yè)還需在數(shù)據(jù)庫引擎層構(gòu)建具備策略調(diào)度能力的原生機(jī)制,目前這一能力尚屬空白。
更現(xiàn)實(shí)的問題是,即使某些數(shù)據(jù)庫在功能上實(shí)現(xiàn)替代,仍可能在復(fù)雜 SQL 優(yōu)化、多模協(xié)同、Agent 狀態(tài)一致性等細(xì)節(jié)上出現(xiàn)不穩(wěn)定。這種技術(shù)缺口導(dǎo)致 AI 應(yīng)用在測試階段表現(xiàn)良好,但一旦接入真實(shí)業(yè)務(wù)流量,常常暴露出查詢卡頓、語義漂移、權(quán)限錯(cuò)配等問題。
"AI 改變了數(shù)據(jù)庫的角色,但技術(shù)體系還沒跟上。" 一位制造企業(yè) CIO 對(duì)產(chǎn)業(yè)家直言,公司目前采用的是 " 加一層、補(bǔ)一段、設(shè)幾個(gè)限 " 的方案。
他還說:" 這聽起來安全,其實(shí)只是感覺安全。"
四、未來走向,誰能造出 AI 時(shí)代的 " 數(shù)據(jù)引擎 "?
目前,業(yè)界普遍認(rèn)為,AI 時(shí)代的數(shù)據(jù)庫將沿著三個(gè)方向持續(xù)演進(jìn):一體化、智能化、安全內(nèi)生化。
具體來看,首先是數(shù)據(jù)庫將走向架構(gòu)一體化。
過去,企業(yè)往往需要部署多個(gè)數(shù)據(jù)庫來分別處理結(jié)構(gòu)化、日志、向量或圖譜數(shù)據(jù)。這不僅造成架構(gòu)冗余,還帶來數(shù)據(jù)同步、權(quán)限治理和審計(jì)合規(guī)的額外負(fù)擔(dān)。
" 未來的數(shù)據(jù)庫,應(yīng)該能統(tǒng)一處理結(jié)構(gòu)化、文檔、圖數(shù)據(jù)和向量數(shù)據(jù),并提供一致的查詢接口與權(quán)限體系。"Databend CEO 張雁飛表示," 我們希望把過去五個(gè)工具才能完成的任務(wù),壓縮成一個(gè)產(chǎn)品來實(shí)現(xiàn)。"
然而,這種一體化仍面臨技術(shù)挑戰(zhàn)。
不同數(shù)據(jù)類型在存儲(chǔ)格式、索引結(jié)構(gòu)、查詢語義上差異顯著,要在同一引擎內(nèi)高效支持并不容易。目前多數(shù)所謂的 " 融合型數(shù)據(jù)庫 ",仍是關(guān)系型架構(gòu)上外掛功能模塊,缺乏真正的底層融合。
其次,數(shù)據(jù)庫將更加 " 懂 AI",也將 " 用 AI"。
AI 正倒逼數(shù)據(jù)庫 " 前臺(tái)化 ",同時(shí)也成為其自身能力升級(jí)的關(guān)鍵工具。目前,已有廠商借助大模型生成 SQL、構(gòu)造測試用例、優(yōu)化查詢計(jì)劃,大幅提升開發(fā)與運(yùn)維效率。
" 我們已經(jīng)用 AI 自動(dòng)生成上萬組查詢語句,覆蓋各種業(yè)務(wù)場景,這在人力時(shí)代幾乎不可能。" 張雁飛指出,未來數(shù)據(jù)庫優(yōu)化器的演進(jìn)也將依賴大模型,"AI 會(huì)成為數(shù)據(jù)庫研發(fā)流程中的標(biāo)配工具。"
但 " 懂 AI" 還不夠,數(shù)據(jù)庫必須 " 適配 AI",解決上下文管理、Agent 狀態(tài)維護(hù)、調(diào)用路徑壓縮等新場景問題。目前,行業(yè)尚缺乏統(tǒng)一的接口規(guī)范和調(diào)用語義標(biāo)準(zhǔn),數(shù)據(jù)庫之間的協(xié)同能力仍有壁壘。
第三,安全能力必須內(nèi)嵌進(jìn)數(shù)據(jù)庫系統(tǒng)本身。
AI 應(yīng)用對(duì)數(shù)據(jù)訪問模式的改變,使 " 外掛式安全 " 逐漸失效。頻繁自動(dòng)化調(diào)用、行為不透明、權(quán)限動(dòng)態(tài)變化,要求數(shù)據(jù)庫具備原生的權(quán)限管理、行為審計(jì)、訪問透明和運(yùn)行時(shí)加密等能力。
" 權(quán)限系統(tǒng)不能只是配置文件或外置引擎,它必須嵌入數(shù)據(jù)庫核心邏輯。" 陳宇耀指出。真正 " 安全內(nèi)生 " 的數(shù)據(jù)庫,應(yīng)深度融合身份體系、行為模型與策略引擎,為 AI 調(diào)用提供全過程可控的信任機(jī)制。
目前,僅有少數(shù)產(chǎn)品嘗試將權(quán)限、調(diào)用路徑與敏感字段識(shí)別 " 綁定 " 在引擎層,大多數(shù)仍停留在網(wǎng)關(guān)封堵、合規(guī)對(duì)接階段,距 " 安全即設(shè)計(jì) " 還有不小差距。
誰能率先完成這三重轉(zhuǎn)型,有望成為 AI 時(shí)代新的基礎(chǔ)設(shè)施提供者。
值得注意的是,這場變革也為新興玩家提供了窗口。傳統(tǒng)數(shù)據(jù)庫廠商架構(gòu)包袱沉重、演進(jìn)緩慢,而一些新項(xiàng)目則從 AI 場景出發(fā),繞過舊范式,直接構(gòu)建面向 Agent、向量與上下文的底層邏輯。
"AI 對(duì)數(shù)據(jù)庫的重構(gòu),不是插件升級(jí)或功能擴(kuò)展,而是理念轉(zhuǎn)變——從存儲(chǔ)轉(zhuǎn)向協(xié)同,從記錄轉(zhuǎn)向參與。" 張雁飛強(qiáng)調(diào)。
從這個(gè)視角看,數(shù)據(jù)庫的角色也在徹底重寫:不再只是數(shù)據(jù)倉庫、事務(wù)賬本、分析引擎,而是智能系統(tǒng)中真正可信的核心。AI 成為組織大腦,數(shù)據(jù)庫就是數(shù)據(jù)調(diào)度的中樞——誰掌握數(shù)據(jù)流,誰就掌握智能流。
當(dāng)然,這一進(jìn)化仍在進(jìn)行中。一體化架構(gòu)仍在調(diào)試,智能能力受限于應(yīng)用場景,安全機(jī)制尚未標(biāo)準(zhǔn)化落地。要真正成為 AI 系統(tǒng)的 " 實(shí)時(shí)引擎 ",數(shù)據(jù)庫還需穿越長坡厚雪。