AI替代程序員的現實性,還是有段距離。

本帖於 2025-08-04 21:41:20 時間, 由普通用戶 加州lalin 編輯

越來越多的公司開始宣稱多少代碼由AI生成。我們合作最多的一家 out sourcing 公司也在商討利用AI完成一定的代碼生成。但是,在現實應用中的代碼轉換需求測試中,AI代碼生成和轉化和Ai做微積分一樣還不成熟。這篇論文挺有意思的。 https://arxiv.org/pdf/2405.11514

測試結果顯示,各大基於LLM上的代碼翻譯器的完美度都低於50%,而且完美度隨著變量參數的增加,和fiction的調用次數增加而下降,幾乎不可用。而比賽或者刷題環境和現實應用場景相差甚遠,以考試或者競賽題來判斷Ai的成熟度,明顯是不夠的。

現在language之間的轉換,需要一個更有效的工具。個人保留意見,還是不認為基於LLM的 Marovian 基礎思維還不是推理智能的功能。 

所以,基於LLM上的AI大概率停留在recommendation的功能上。

所有跟帖: 

基於LLM上的AI大概率停留在recommendation的功能上。CS就業不會一直不好。 -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (0 bytes) () 08/04/2025 postreply 21:42:25

主要是學得人多了,基數大造成的吧。需求趕不上求需的。娃現在有朋友從物理轉CS. 還有一個打算DS轉CS -zaocha2002- 給 zaocha2002 發送悄悄話 zaocha2002 的博客首頁 (0 bytes) () 08/04/2025 postreply 23:22:22

中等以下碼工的工作幾乎完全可以被 AI取代了,可以質疑但心存僥幸是要不得的。 -Knight_2024- 給 Knight_2024 發送悄悄話 (0 bytes) () 08/05/2025 postreply 00:04:47

你有沒有親自做做?我的經驗是提高了效率,但不能取代 -12度圓缺- 給 12度圓缺 發送悄悄話 12度圓缺 的博客首頁 (0 bytes) () 08/05/2025 postreply 06:33:10

你用的什麽模型呀?是1Mtoken輸入輸出的嗎? -ClearCase- 給 ClearCase 發送悄悄話 ClearCase 的博客首頁 (0 bytes) () 08/05/2025 postreply 06:48:00

AI coding現在還替代不了高級程序員,但是比絕大多數初級中級程序員強。 -ClearCase- 給 ClearCase 發送悄悄話 ClearCase 的博客首頁 (0 bytes) () 08/05/2025 postreply 06:46:00

取代是通過提高效率,即使不能end to end,也會大大減少人的數量。你的文章是2018年的?那時根本沒llm -風景線2- 給 風景線2 發送悄悄話 (273 bytes) () 08/05/2025 postreply 07:12:59

四月17日,2025年的paper。他提出的關鍵問題是LLM是否可以是可靠的code轉換器,引深問題基於LLM的AI是否 -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (49 bytes) () 08/05/2025 postreply 10:29:34

我記得僅僅一年多前很多程序員還對用copilot嗤之以鼻,認為是弱雞的表現。現在估計不會用AI輔助編程的估計都被layoff光了 -ClearCase- 給 ClearCase 發送悄悄話 ClearCase 的博客首頁 (0 bytes) () 08/05/2025 postreply 07:25:00

程序一旦出錯, 抓蟲子是最煩人最耗時的事情 -槍迷球迷- 給 槍迷球迷 發送悄悄話 槍迷球迷 的博客首頁 (347 bytes) () 08/05/2025 postreply 08:02:01

現在都能自己生成測試。 -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (0 bytes) () 08/05/2025 postreply 13:36:59

真希望是這樣啊, -糯米粥- 給 糯米粥 發送悄悄話 糯米粥 的博客首頁 (491 bytes) () 08/05/2025 postreply 09:26:59

早年程序員是一行行寫,後來有各種工具調用,現在有Ai生成結構。都是工具的提高,效率的提高。 -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (0 bytes) () 08/05/2025 postreply 10:24:43

請您先登陸,再發跟帖!