中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>

<samp id="11166"><source id="11166"></source></samp>

<th id="11166"></th>

鈦媒體 18分鐘前

從混元到智譜，六大國(guó)產(chǎn)大模型，編程“手藝”到底怎么樣？

文 | 錦緞

人們總是說(shuō)，AI 一出來(lái)，程序員都要失業(yè)了，這說(shuō)法是真是假？

為了搞清楚這個(gè)問(wèn)題，這次我們?cè)O(shè)計(jì)了一場(chǎng) "AI 程序員能力挑戰(zhàn)賽 "。

別擔(dān)心看不懂，我們會(huì)把所有測(cè)試都比喻成你最熟悉的生活任務(wù)。

這一次，我們盡可能選擇了擅長(zhǎng)編程的參賽選手：

深度求索：DeepSeek-R1

騰訊：Hunyuan-TurboS

阿里：Qwen3-Coder

智譜：GLM-4.5

月之暗面：Kimi-K2

百度：ERNIE-X1-Turbo

老規(guī)矩，開啟深度思考，關(guān)閉聯(lián)網(wǎng)搜索。

這次的 "AI 程序員能力挑戰(zhàn)賽 "，采用考駕照的方式。

我們將通過(guò)四個(gè) " 科目 "，從易到難，全方位考察參賽選手們的編程能力。

01 科目一：理論知識(shí)筆試（基礎(chǔ)知識(shí)問(wèn)答）

在真正上路（編寫代碼）前，我們得先測(cè)試一下 AI 參賽選手們的基礎(chǔ)知識(shí)是否牢固。因此，我們選擇了一些編程行業(yè)的 " 常識(shí)題 "。

測(cè)試題目 1：" 請(qǐng)用一個(gè)初中生能聽(tīng)懂的比喻，解釋一下什么是‘面向?qū)ο缶幊獭∣OP）？"

" 面向?qū)ο缶幊?" 是程序員行業(yè)內(nèi)的一個(gè)核心哲學(xué)。

專業(yè)化的表述 " 封裝、繼承、多態(tài) "，別說(shuō)初中生了，不少大學(xué)生和研究生都得犯迷糊。

這道題考的不是 AI" 懂不懂 "，而是會(huì)不會(huì) " 教 "。

測(cè)評(píng)結(jié)果：

各模型選擇了不同的生活場(chǎng)景，對(duì)面向?qū)ο缶幊讨械慕?jīng)典概念進(jìn)行講解：

其中，Qwen3-Coder 和 Kimi-K2 的講解全面而生動(dòng)，解釋質(zhì)量、準(zhǔn)確性和啟發(fā)性較高。

DeepSeek-R1、GLM-4.5 和 ERNIE-X1-Turbo 對(duì)于關(guān)鍵的概念有所省略，但仍然能做到易于理解。

本輪評(píng)分：

測(cè)試題目 2：" 解釋一下‘遞歸’是什么，并說(shuō)明使用它時(shí)需要注意什么？"

" 遞歸 " 是編程領(lǐng)域中一種 " 自己調(diào)用自己 " 的奇特技巧，優(yōu)雅但危險(xiǎn)。

用好了，程序的可讀性和性能都會(huì)得以提升；用不好，程序很容易陷入無(wú)限循環(huán)，直到內(nèi)存耗盡而崩潰。

各模型異曲同工地都選擇了俄羅斯套娃作為比喻之一。

同時(shí)，詳細(xì)地描述了使用遞歸時(shí)的限制條件。

所有模型都能對(duì)專業(yè)名詞進(jìn)行正確解釋，且給出的比喻基本相同。

其中，Qwen3-Coder 和 GLM-4.5 還提及了遞歸的應(yīng)用場(chǎng)景，使回答更加充實(shí)；

而 DeepSeek-R1、Hunyuan-TurboS 和 ERNIE-X1-Turbo 在沒(méi)有提及其他概念的情況下，將遞歸與循環(huán)和迭代做了對(duì)比，也是亮點(diǎn)之一。

測(cè)試題目 3：" 進(jìn)程和線程有什么區(qū)別和聯(lián)系？舉個(gè)例子說(shuō)明。"

這是程序員面試的基礎(chǔ)題目之一，涉及計(jì)算機(jī)如何同時(shí)處理多個(gè)任務(wù)的底層原理。

能講清楚這兩個(gè)概念，證明 AI 的計(jì)算機(jī)知識(shí)體系相當(dāng)完備。

同樣地，各模型首先給出簡(jiǎn)單的比喻，然后從多個(gè)方面對(duì)比二者的區(qū)別和聯(lián)系：

與上一題類似，各模型給出的比喻大致相同。

除 Kimi-K2 外，各模型均從多個(gè)角度對(duì)比了進(jìn)程與線程之間的區(qū)別和聯(lián)系，內(nèi)容充實(shí)。

其中 GLM-4.5 給出的答案篇幅較長(zhǎng)，包含了簡(jiǎn)單的比喻和專業(yè)的解釋，覆蓋用戶范圍更廣。

與之相反，Kimi-K2 給出的回答卻十分簡(jiǎn)短，雖然易于理解，但并未揭示二者的本質(zhì)。

科目一成績(jī)：

理論考試環(huán)節(jié)，各模型都展現(xiàn)出了碾壓性的實(shí)力。

這些本身就是計(jì)算機(jī)領(lǐng)域頂尖水平的 " 考生 "，知識(shí)儲(chǔ)備淵博，表達(dá)清晰，比喻也很精妙。

從評(píng)分來(lái)看，Qwen3-Coder 和 GLM-4.5，在理論方面略勝一籌。

如果光看筆試成績(jī)，這些 AI 恐怕已經(jīng)可以勝任本科生的計(jì)算機(jī) " 私人教師 "。

不過(guò)，程序員的世界，終究還要靠代碼說(shuō)話。

02 科目二：動(dòng)手實(shí)踐課（入門級(jí)編程任務(wù)）

理論知識(shí)過(guò)完，就來(lái)到基礎(chǔ)操作環(huán)節(jié)。

這就像科目二中的 " 倒車入庫(kù) " 等環(huán)節(jié)，需要手眼協(xié)調(diào)，考驗(yàn)基本功是否扎實(shí)。

測(cè)試題目 1：" 寫一個(gè)經(jīng)典的‘ FizzBuzz ’問(wèn)題：從 1 打印到 100，如果是 3 的倍數(shù)就打印‘ Fizz ’，5 的倍數(shù)就打印‘ Buzz ’，同時(shí)是 3 和 5 的倍數(shù)就打印‘ FizzBuzz ’，其他情況直接打印數(shù)字。"

從我們的角度看，這不過(guò)是一道小學(xué)生級(jí)別的數(shù)學(xué)題。

事實(shí)上，這類編程入門題能夠快速判斷 AI 的編程邏輯。

而我們作為 " 考官 "，還要看看 AI 能不能給出我們一下子想不到的答案。

先說(shuō)結(jié)論，AI 生成的代碼均可正確運(yùn)行，給出的答案共有兩種：

一是逆向邏輯：先判斷 15 的倍數(shù)，再分別判斷 3 和 5 的倍數(shù)；

二是字符串拼接：先判斷 3 的倍數(shù)后輸出字符串 Fizz，再判斷 5 的倍數(shù)后直接拼接 Buzz。

DeepSeek-R1、GLM-4.5、Kimi-K2 和 ERNIE-X1-Turbo 都只給出了第一種答案。

Hunyuan-TurboS 和 Qwen3-Coder 則成功給出了兩種答案，智能程度滿分。

測(cè)試題目 2：" 寫一個(gè)函數(shù)，用來(lái)判斷一個(gè)輸入的正整數(shù)是不是‘素?cái)?shù)’（也叫質(zhì)數(shù)）。"

引入素?cái)?shù)的概念，相比上一題稍難一些，人類可能難以一眼看出解法。

但細(xì)想一下，實(shí)際上核心思路很簡(jiǎn)單：

判斷一個(gè)數(shù)是不是素?cái)?shù)，沒(méi)必要從 2 一直除到 n-1。只需要除到它的 " 平方根 " 就行了。

這次，要考驗(yàn) AI 對(duì)數(shù)學(xué)概念的程序化轉(zhuǎn)換能力和淺層次的算法優(yōu)化意識(shí)。

所有模型都給出了正確的算法；

除 Hunyuan-TurboS 外，所有模型均給出了可運(yùn)行的代碼；

除 Hunyuan-TurboS 和 Kimi-K2 外，其余模型均給出了時(shí)間復(fù)雜度。

值得關(guān)注的是，Hunyuan-TurboS 和 GLM-4.5 均指出在數(shù)字較大時(shí)可以使用 Miller-Rabin 素性測(cè)試等更高效的算法。

而 Qwen3-Coder 不僅給出了正確的算法，還給出了適合批量判斷的埃拉托斯特尼篩選法，也給出了時(shí)間復(fù)雜度。

測(cè)試題目 3：" 寫一個(gè)函數(shù)，判斷一個(gè)字符串是不是‘回文’。"

這道題在一定程度上屬于 " 開放式 " 題目，實(shí)現(xiàn)辦法多種多樣，考驗(yàn) AI 處理字符串的能力。

由于解決方案較多，由人類來(lái)評(píng)判可能有失偏頗，我們請(qǐng)同行 Gemini 2.5 作為裁判進(jìn)行評(píng)判。

" 裁判 " 從方案廣度與深度、代碼質(zhì)量與規(guī)范、解釋與教學(xué)性、獨(dú)特亮點(diǎn)和主要不足這五方面進(jìn)行了客觀的評(píng)價(jià)：

DeepSeek-R1：

方案廣度與深度：高，提供了空間優(yōu)化

代碼質(zhì)量與規(guī)范：高，代碼嚴(yán)謹(jǐn)

解釋與教學(xué)性：高，復(fù)雜度分析準(zhǔn)確

獨(dú)特亮點(diǎn)：提供了最高效的空間解法

主要不足：方案種類較少

Hunyuan-TurboS：

方案廣度與深度：中，方案實(shí)用但缺少最優(yōu)解

代碼質(zhì)量與規(guī)范：高，解法具備 Python 特色

解釋與教學(xué)性：極高，排版清晰，總結(jié)表格

獨(dú)特亮點(diǎn)：教學(xué)性和用戶體驗(yàn)最佳

主要不足：缺乏空間復(fù)雜度的最優(yōu)解 |

Qwen3-Coder：

方案廣度與深度：極高，四種方法，包含遞歸

代碼質(zhì)量與規(guī)范：極高，組織良好，包含測(cè)試函數(shù)

解釋與教學(xué)性：高，對(duì)比清晰

獨(dú)特亮點(diǎn)：技術(shù)最全面，廣度與深度兼?zhèn)?/p>

主要不足：排版不夠生動(dòng)

GLM-4.5：

方案廣度與深度：中，專注最優(yōu)解

代碼質(zhì)量與規(guī)范：極高，包含使用類型提示

解釋與教學(xué)性：高，包含執(zhí)行流程示例

獨(dú)特亮點(diǎn)：對(duì)最優(yōu)解的解釋最形象

主要不足：方案單一，廣度不足

Kimi-K2:

方案廣度與深度：低，僅有一種方案

代碼質(zhì)量與規(guī)范：高，使用了 __name__（Python 編程風(fēng)格）

解釋與教學(xué)性：極高，語(yǔ)言最親切、口語(yǔ)化

獨(dú)特亮點(diǎn)：親和力第一，代碼結(jié)構(gòu)規(guī)范

主要不足：技術(shù)深度最淺

ERNIE-X1-Turbo：

方案廣度與深度：中，專注于接口設(shè)計(jì)

代碼質(zhì)量與規(guī)范：高，但有瑕疵

解釋與教學(xué)性：高，展示不同應(yīng)用場(chǎng)景

獨(dú)特亮點(diǎn)：體現(xiàn) API 設(shè)計(jì)思想，函數(shù)靈活可配置

主要不足：測(cè)試用例有邏輯錯(cuò)誤

科目二成績(jī)：

到了實(shí)踐環(huán)節(jié)，" 考生 " 們開始展現(xiàn)出區(qū)分度。

Qwen3-Coder 在三道測(cè)試題中都給出了完美的回答，毫無(wú)疑問(wèn)獲得滿分，排行第一；

DeepSeek-R1 和 GLM-4.5 也給出了高分回答，保證答案正確的情況下各具特色；

Hunyuan-TurboS 和 ERNIE-X1-Turbo 則都出現(xiàn)了細(xì)小的錯(cuò)誤，令人遺憾。

科目二的測(cè)試題目難度大概和大一大二的普通計(jì)算機(jī)學(xué)生水平相當(dāng)。

由此可見(jiàn)，AI 完成計(jì)算機(jī)專業(yè)部分課程的期末考試已經(jīng)不在話下。

03 科目三：生活應(yīng)用題（解決實(shí)際問(wèn)題）

由于科目一和科目二還局限于學(xué)術(shù)范圍，我們要再次升級(jí)難度。

科目三要測(cè)試的是 AI 能否解決我們生活和工作中的實(shí)際痛點(diǎn)。

這考驗(yàn)的不僅是 AI 的編程技巧，還有對(duì)人類需求的理解和解決問(wèn)題的能力。

測(cè)試題目 1：" 我桌面上有幾百個(gè)文件，有圖片、文檔和視頻，太亂了。你寫個(gè)程序幫我整理一下，把不同類型的文件放到各自的文件夾里。"

非常典型的 " 自動(dòng)化辦公 " 需求。

每次看到一臺(tái)電腦的桌面上被堆滿應(yīng)用圖標(biāo)，強(qiáng)迫癥都難以呼吸。

因此，這道題目要求 AI 編寫一個(gè)與操作系統(tǒng)打交道的腳本。

需要完成文件的查找、分類、創(chuàng)建文件夾和移動(dòng)文件等一系列操作。

所有模型都給出了可運(yùn)行的代碼，并實(shí)現(xiàn)了文件分類的功能。

其中，GLM-4.5 給出了令人驚喜的回答：

它生成的代碼提供了一個(gè)額外功能：模擬運(yùn)行，即只顯示操作但并不實(shí)際移動(dòng)文件。

這對(duì)于評(píng)測(cè)來(lái)說(shuō)是不可多得的亮點(diǎn)之一。

表現(xiàn)相對(duì)較差的則是 Kimi，僅給出了圖片、文檔和視頻三種分類方式。

測(cè)試題目 2：" 我想知道現(xiàn)在外面空氣質(zhì)量怎么樣，如果 PM2.5 指數(shù)很高，就提醒我戴口罩。幫我實(shí)現(xiàn)這個(gè)功能。"

難度進(jìn)一步上升。

這道題的核心難點(diǎn)在于需求與 " 外部數(shù)據(jù)獲取 " 掛鉤，專業(yè)術(shù)語(yǔ)叫做 "API 調(diào)用 "。

AI 編寫的程序需要能夠訪問(wèn)一個(gè)提供天氣或氣象相關(guān)數(shù)據(jù)的網(wǎng)站，并獲取 PM2.5 的數(shù)值。

而作為評(píng)判者，除了要關(guān)注數(shù)據(jù)的正確性，還要關(guān)注程序的自動(dòng)化程度。

畢竟，很多網(wǎng)站的數(shù)據(jù)需要先注冊(cè)才能獲取，但 " 一鍵式 " 才是我們追求的目標(biāo)。

對(duì)于這道難題，各模型給出的答案令人有些失望。

DeepSeek-R1 沒(méi)能給出直接獲取數(shù)據(jù)的方法，給出的方案需要在 tianqiapi.com 注冊(cè)獲取密鑰，但提供的鏈接也無(wú)法直接訪問(wèn)；同樣地，ERNIE-X1-Turbo 給出的方案也需要在和風(fēng)天氣注冊(cè)獲取密鑰，且程序只能發(fā)揮定時(shí)檢測(cè)作用而非查詢作用。

Hunyuan-TurboS 提供了兩種方案，一種是使用 OpenWeatherMap 的 API，同樣需要注冊(cè)并獲取密鑰；另一種是直接使用 AQICN 的公開數(shù)據(jù)，實(shí)現(xiàn)了 " 一鍵式 " 獲取，雖然數(shù)據(jù)似乎有些不準(zhǔn)確。

Qwen3-Coder 生成的代碼功能較為齊全，能夠成功調(diào)用外部 API 實(shí)現(xiàn) " 一鍵式 " 獲取，但可惜查詢存在錯(cuò)誤，如輸入城市為北京，但輸出數(shù)據(jù)為上海，且程序運(yùn)行一次后自動(dòng)結(jié)束。

至于 GLM-4.5 和 Kimi-K2 提供的代碼則完全無(wú)法實(shí)現(xiàn)所需功能，也未給出可行方案。

測(cè)試題目 3：" 幫我做一個(gè)簡(jiǎn)易的密碼生成器。"

第三題的需求相對(duì)封閉，不涉及外部依賴，AI 的表現(xiàn)肉眼可見(jiàn)的 " 好起來(lái)了 "。

因此，我們需要關(guān)注 AI 生成代碼功能是否靈活、齊全。

所有模型都能編寫出可用的密碼生成器，但功能存在一定差別：

DeepSeek-R1 非常貼心地在代碼中加入了 " 避免模糊字符 " 功能，解決了常見(jiàn)的大寫字母 I 和小寫字母 l 的辨認(rèn)問(wèn)題。

Hunyuan 則另辟蹊徑，使用 HTML 形式編寫了可交互式的密碼生成器，且有密碼強(qiáng)度評(píng)分功能。

Qwen3-Coder 在允許用戶自定義密碼生成規(guī)則的情況下，還允許用戶一次性生成多個(gè)密碼。

GLM-4.5、Kimi-K2 生成的代碼只能在命令行中運(yùn)行，操作比較麻煩；同時(shí)，Kimi-K2 和 ERNIE-X1-Turbo 編寫的密碼生成器不允許用戶自定義密碼生成規(guī)則，靈活性較差。

科目三成績(jī)：

這一次，輪到 Hunyuan-TurboS 領(lǐng)跑賽道，獨(dú)占榜首。

先前的測(cè)評(píng)中，我們已經(jīng)知道，對(duì)模型來(lái)說(shuō)獲取準(zhǔn)確的外界信息是一項(xiàng)難度很大的任務(wù)。

因此，能夠跨越與外界聯(lián)系的 " 鴻溝 "，獲取到氣象數(shù)據(jù)，實(shí)屬不易。

DeepSeek-R1 和 Qwen3-Coder 緊隨其后，在其他兩道測(cè)試題上的表現(xiàn)不錯(cuò)，在封閉環(huán)境下發(fā)揮了可靠的能力。

其余三位考生則各有 " 短板 "，發(fā)揮不佳，令人失望。

04 科目四：終極項(xiàng)目挑戰(zhàn)（高階綜合能力）

這是最終的壓力測(cè)試。

如果把前面的題目比作 " 零件 " 級(jí)別的任務(wù)，那科目四就像讓 AI 動(dòng)手 " 組裝機(jī)器 "。

下面的題目考驗(yàn) AI 的系統(tǒng)設(shè)計(jì)、代碼組織和綜合應(yīng)用能力。

如果能順利通過(guò)科目四，證明 AI 已經(jīng)是代碼領(lǐng)域內(nèi)一名合格的 " 司機(jī) "。

測(cè)試題目 1：" 幫我寫一個(gè)網(wǎng)頁(yè)版的待辦事項(xiàng)列表（To-Do List）。"

入門級(jí)的前端項(xiàng)目。

它不只是一個(gè)后臺(tái)腳本，而是需要一個(gè)用戶能直接交互的 " 界面 "。

這要求 AI 必須同時(shí)掌握三種 " 語(yǔ)言 "：HTML、CSS 和 JavaScript。

所有模型都設(shè)計(jì)出了功能完備的待辦事項(xiàng)列表。

值得注意的是，在程序結(jié)構(gòu)方面，只有 Qwen3-Coder 將 HTML、CSS 和 JS 分成了三個(gè)獨(dú)立的文件。而其他五個(gè)模型都選擇了將 CSS 和 JavaScript 直接嵌入 HTML 文件中的做法。

看起來(lái)，Qwen3-Coder 的做法并不如其他模型的做法便捷，無(wú)法 " 開箱即用 "；

但是，" 分文件 " 的做法才是專業(yè) Web 開發(fā)者的標(biāo)準(zhǔn)做法，具備較高的可維護(hù)性和可讀性。

這種方式有助于代碼復(fù)用、團(tuán)隊(duì)協(xié)作和性能優(yōu)化，教授了一種專業(yè)、可持續(xù)的開發(fā)模式。

盡管對(duì)新手來(lái)說(shuō)稍有門檻，不過(guò) Qwen3-Coder 也備注了詳細(xì)的使用方法。

測(cè)試題目 2：" 請(qǐng)編寫一個(gè)程序，充當(dāng)一個(gè)簡(jiǎn)單的網(wǎng)頁(yè)信息提取器。它的任務(wù)是訪問(wèn)新浪財(cái)經(jīng)的首頁(yè)，然后自動(dòng)提取并打印出該網(wǎng)站首頁(yè)上‘要聞’區(qū)域的前 5 條新聞標(biāo)題。"

AI 應(yīng)用的熱門領(lǐng)域之一——網(wǎng)絡(luò)爬蟲。

這道題類似于讓 AI 派出一個(gè)小機(jī)器人去自動(dòng)瀏覽網(wǎng)頁(yè)，從海量信息中精確地抓取所需信息。

不過(guò)，難點(diǎn)并非數(shù)據(jù)的提取，而是復(fù)雜且多變的網(wǎng)頁(yè)結(jié)構(gòu)該如何處理。

這道題也讓 AI 參賽選手們出現(xiàn)了明顯的 " 分化 "。

很遺憾，DeepSeek-R1、GLM-4.5 和 ERNIE-X1-Turbo 都無(wú)法獲取到指定內(nèi)容。

相比之下，Hunyuan-TurboS 和 Kimi-K2 的爬取能力明顯增強(qiáng)，能夠獲取到網(wǎng)頁(yè)信息，不過(guò)位置有錯(cuò)誤。

只有 Qwen3-Coder 出色地完成了任務(wù)，爬取到了正確的新聞標(biāo)題。

測(cè)試題目 3：" 請(qǐng)用代碼模擬一個(gè)最簡(jiǎn)單的圖書館借書系統(tǒng)。需要有‘書’和‘讀者’這兩個(gè)概念。"

最后一道測(cè)試題回歸到了純粹的 " 系統(tǒng)設(shè)計(jì) "，考察前面 " 面向?qū)ο?" 思想的實(shí)際應(yīng)用。

事實(shí)上，這也是計(jì)算機(jī)專業(yè)學(xué)生幾乎必定經(jīng)歷過(guò)的課程設(shè)計(jì)題目之一。

因此，我們將測(cè)評(píng)題目也設(shè)計(jì)為開放式，只告訴了 AI 最基本的需求。

除了完成系統(tǒng)的設(shè)計(jì)，我們還要著重觀察 AI 能否添加并完善系統(tǒng)的功能。

所有模型都給出了可運(yùn)行的代碼，構(gòu)建了復(fù)雜程度不同的圖書館系統(tǒng)。

對(duì)于借書、還書的邏輯，所有模型都能夠輕而易舉地正確復(fù)現(xiàn)。

但是，對(duì)于沒(méi)有直接提出的一些需求，則暴露出部分模型的短板。

DeepSeek-R1、Hunyuan-TurboS、Qwen3-Coder 和 GLM-4.5 都很自覺(jué)地加入了查詢圖書館藏書清單和查詢用戶借閱清單的功能。

而 Kimi-K2 和 ERNIE-X1-Turbo 卻只實(shí)現(xiàn)了簡(jiǎn)單的借書和還書邏輯。

另外，我們要求 AI 設(shè)計(jì)的是圖書館 " 系統(tǒng) "。

顧名思義，這個(gè)系統(tǒng)是要能夠與用戶進(jìn)行交互的。

這里必須夸獎(jiǎng)一波 Qwen3-Coder，六個(gè)模型中唯一采用交互式而非測(cè)試用例的 AI。

它生成的代碼提供了兩種運(yùn)行模式，允許使用測(cè)試用例進(jìn)行演示，也允許用戶上手操作：

同時(shí)，實(shí)現(xiàn)的功能也是所有 AI 中最為齊全的：

科目四成績(jī)：

毫無(wú)疑問(wèn)，在其他模型表現(xiàn)平庸的襯托下，Qwen3-Coder 的編程能力一騎絕塵。

它不僅能夠正確理解人們的實(shí)際需求，還能夠根據(jù)概念來(lái)構(gòu)建一個(gè)完善的微型系統(tǒng)。

設(shè)計(jì)清晰，邏輯嚴(yán)謹(jǐn)，功能強(qiáng)大，令人信服。

05 一點(diǎn)基本結(jié)論

這場(chǎng)駕照考試就到此為止。

通過(guò)各個(gè)科目的成績(jī)，可以看出，Qwen3-Coder 輕松拿到了本次考試的榜首。

不論是在理論知識(shí)、基礎(chǔ)編程、生活應(yīng)用還是項(xiàng)目挑戰(zhàn)，它都能夠成為一個(gè)寫代碼的 " 好幫手 "。

同時(shí)，在測(cè)評(píng)過(guò)程中，我們也注意到了一些其他的細(xì)節(jié)：

生成代碼的長(zhǎng)度和速度方面，Qwen3-Coder 都體現(xiàn)出了明顯的優(yōu)勢(shì)。

在科目四的測(cè)試中，它生成的代碼比其他模型要長(zhǎng)數(shù)十行，卻能夠比其他模型更快完成編寫。

反之，Kimi-K2 的代碼風(fēng)格極為簡(jiǎn)潔，長(zhǎng)度極短，因此也基本只能實(shí)現(xiàn)文字意義上的功能。

但總的來(lái)說(shuō)，對(duì)于較為簡(jiǎn)單的需求，現(xiàn)階段的 AI 水平已經(jīng)足夠。

那么，回到我們先前討論的問(wèn)題：AI 能取代程序員了嗎？

答案是：目前還不能，但它已經(jīng)在徹底改變 " 程序員 " 這個(gè)職業(yè)的定義。

與其說(shuō)是取代程序員，不如說(shuō) AI 是在推動(dòng)自己和程序員的 " 進(jìn)化 "。

不僅是程序員，對(duì)于有編程需要的學(xué)生和職場(chǎng)人來(lái)說(shuō)，AI 大模型已經(jīng)成為必不可少的 " 外掛 "。

以 AI 目前的能力，解決掉 80% 以上的重復(fù)枯燥的 " 體力活 "（寫基礎(chǔ)代碼、查資料、寫注釋等）已經(jīng)不在話下。

同時(shí)，它還能在幾分鐘內(nèi)，搭建起一個(gè)項(xiàng)目的 " 毛坯房 "，用戶無(wú)需在程序框架上絞盡腦汁，而是可以把精力投入到 " 室內(nèi)精裝修 "（核心業(yè)務(wù)邏輯、用戶體驗(yàn)優(yōu)化、系統(tǒng)架構(gòu)設(shè)計(jì)）。

更重要的是，它能極大地降低編程的入門門檻，那些有創(chuàng)意但不懂技術(shù)的人，已經(jīng)不再需要把自己培養(yǎng)成程序員，就可以借助 AI 將想法變?yōu)楝F(xiàn)實(shí)。

說(shuō)實(shí)話，在這次測(cè)評(píng)的過(guò)程中，看到 AI 在幾十秒內(nèi)就生成了一個(gè)功能完整的程序時(shí)，作為一個(gè)幾年前畢業(yè)的計(jì)算機(jī)學(xué)生，我直接愣住了，甚至有點(diǎn)恍惚。

屏幕上自動(dòng)滾動(dòng)的代碼，結(jié)構(gòu)清晰、注釋齊全，腦海里閃過(guò)的，不是 AI 生成的速度如此之快、質(zhì)量如此之高，而是當(dāng)年為一個(gè)類似的課程設(shè)計(jì)通宵達(dá)旦的場(chǎng)景。

以前，為了實(shí)現(xiàn)一個(gè)簡(jiǎn)單的圖書館借閱系統(tǒng)，我可能要一邊翻閱 C++ 的 " 抽象圣經(jīng) "，一邊因?yàn)橐粋€(gè)數(shù)據(jù)庫(kù)的 BUG 在 CSDN 的帖子間反復(fù)橫跳；為了實(shí)現(xiàn)最簡(jiǎn)單的一個(gè) UI 界面，我可能要在使用文檔上花一個(gè)下午，因?yàn)檎?Bug 找?guī)讉€(gè)小時(shí)而懷疑人生。整個(gè)課程設(shè)計(jì)從開始到運(yùn)行，幾周的時(shí)間并不算長(zhǎng)。

而現(xiàn)在，AI 完成這些的時(shí)間，只用了我喝一杯水的時(shí)間。

百感交集，有一種青春被 " 降維打擊 " 的失落感。以前熬夜攻克的 " 難題 "，現(xiàn)在 AI 云淡風(fēng)輕地一筆帶過(guò)。與此同時(shí)產(chǎn)生的，是一種難以言喻的惆悵和敬畏。

我們這一代程序員，已經(jīng)是見(jiàn)證歷史的一代。我們?cè)秒p手砌墻，而未來(lái)的程序員將直接指揮機(jī)器人蓋起高樓大廈。

當(dāng)然，這不是一個(gè)時(shí)代的落幕，而是一個(gè)新紀(jì)元的開啟。

程序員的價(jià)值，將不再是 " 砌墻 "，而是設(shè)計(jì)大廈的 " 藍(lán)圖 "，我們的目標(biāo)，是思考它的結(jié)構(gòu)、它的美感和它的價(jià)值。

當(dāng)然，得帶著 AI 助手。

因此，沒(méi)有太多的焦慮，更多的是對(duì)未來(lái) AI 時(shí)代的期待。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺(tái)

一起剪

ZAKER旗下免費(fèi)視頻剪輯工具

相關(guān)標(biāo)簽

ai

相關(guān)閱讀

蘋果廉價(jià)版MacBook來(lái)了：A18 Pro+12.9英寸屏幕！起售價(jià)不到5000元

數(shù)碼測(cè)評(píng) 2小時(shí)前

中金：AI算力驅(qū)動(dòng)PCB量?jī)r(jià)齊升，市場(chǎng)規(guī)模有望持續(xù)擴(kuò)容

36氪 1小時(shí)前

“東方慧眼”亮相！全球首個(gè)天地一體化智能遙感系統(tǒng)問(wèn)世

快科技 1小時(shí)前

蘋果發(fā)布iOS 26開發(fā)者預(yù)覽版Beta 6：液態(tài)玻璃、動(dòng)效加強(qiáng)

快科技 3小時(shí)前

小米首款小尺寸手表！小米手表S4 41mm微信語(yǔ)音電話提醒內(nèi)測(cè)招募

數(shù)碼測(cè)評(píng) 9小時(shí)前

劇透未來(lái)：機(jī)器人走向?qū)嵱弥髁x

北京商報(bào) 9小時(shí)前

《縱橫商海之屠龍少年2》：透視異能下的商業(yè)幻夢(mèng)

網(wǎng)易娛樂(lè) 1小時(shí)前

計(jì)算機(jī)軟件2025年二季度投融市場(chǎng)報(bào)告

Wind資訊 3小時(shí)前

機(jī)構(gòu)稱具身智能機(jī)器人行業(yè)有望加速商業(yè)化，這家公司與浙江大學(xué)聯(lián)合研制了首款具身智能化工取樣機(jī)器人

財(cái)聯(lián)社 3小時(shí)前

小米YU7標(biāo)準(zhǔn)版被誤以為是丐版雷軍問(wèn)網(wǎng)友要不要改名

快科技 12小時(shí)前

培訓(xùn)SaaS洗牌提前開始

虎嗅APP 2小時(shí)前

雷軍：小米YU7標(biāo)準(zhǔn)版絕非丐版僅續(xù)航就超越友商Pro或Max

快科技 12小時(shí)前

越疆郎需林：讓具身智能機(jī)器人先“上崗位”再進(jìn)生活

21世紀(jì)經(jīng)濟(jì)報(bào)道 13小時(shí)前

剛?cè)?000萬(wàn)又沖IPO！多光譜AI龍頭海清智元瞄準(zhǔn)H股

21世紀(jì)經(jīng)濟(jì)報(bào)道 14小時(shí)前

最新評(píng)論

沒(méi)有更多評(píng)論了

鈦媒體

訂閱

覺(jué)得文章不錯(cuò)，微信掃描分享好友

掃碼分享

熱門推薦

我國(guó)科學(xué)家突破全固態(tài)鋰電池關(guān)鍵難題，半固態(tài)電池首次在大眾市場(chǎng)量產(chǎn)上車鈦媒體
碰瓷YouTube，是我見(jiàn)過(guò)最愚蠢的事情之一鈦媒體
淘寶閃購(gòu)：用抖音的刀，割競(jìng)對(duì)的肉鈦媒體
我們正不可逆地進(jìn)入“倍速社會(huì)” 鈦媒體
王小川的百川智能開源全新醫(yī)療增強(qiáng)大模型，部署成本比DeepSeek降低57倍鈦媒體
高盛突然宣布不裁員了，金融業(yè)要有大變了嗎？鈦媒體
AI浪潮下，具身智能的崛起與數(shù)據(jù)瓶頸鈦媒體
上美影成就了《浪浪山》，還是《浪浪山》成就了上美影？鈦媒體
百果園不需要教育消費(fèi)者鈦媒體
美國(guó)對(duì)亞洲三國(guó)光伏發(fā)起“雙反”調(diào)查；山東正式出臺(tái)“136號(hào)文”承接方案鈦媒體
36萬(wàn)元起，坦克500用智能化和三架構(gòu)挑戰(zhàn)高端越野鈦媒體
科股早知道：新藏鐵路勘察設(shè)計(jì)可研評(píng)審進(jìn)行中，強(qiáng)調(diào)合理控制工程投資鈦媒體
事關(guān)中國(guó)第一大稅種，兩部門征求意見(jiàn)；螞蟻、中國(guó)稀土辟謠“共建全球首個(gè)稀土人民幣穩(wěn)定幣”；長(zhǎng)安汽車19名高管集體增持，每人不低于30萬(wàn)元鈦媒體
品牌扎堆短?。赫嬗行?，還是偽熱鬧？鈦媒體
皮爺咖啡華南首店關(guān)店，低價(jià)潮中的精品咖啡何去何從？鈦媒體
全球醫(yī)藥史上最貴的教訓(xùn) 鈦媒體
顛覆中創(chuàng)變，經(jīng)濟(jì)型酒店正在穿越新周期鈦媒體
“寧王”停產(chǎn)引鋰狂飆，“反內(nèi)卷”情緒發(fā)酵下的躁動(dòng)能持續(xù)嗎？鈦媒體
獨(dú)立程序化廣告平臺(tái)有沒(méi)有護(hù)城河？鈦媒體
從LABUBU到WAKUKU，誰(shuí)在顛覆潮玩經(jīng)濟(jì)？鈦媒體

查看更多內(nèi)容

熱門訂閱換一批

星河商業(yè)觀察

聚焦星河商業(yè)動(dòng)態(tài)，洞察行業(yè)發(fā)展脈絡(luò)。

Blockchain News