不是科幻,寫成科幻:生成式人工智能基礎模型何時才能走進普通人家?
一個理解生成式人工智能未來的有用比喻,是從昂貴的大型主機到可負擔的個人電腦的曆史轉變。如今的主流基礎模型——例如 GPT?4 級別的係統——很像集中式的大型主機:強大、遠程,隻能通過網絡接口訪問。但這些龐大的模型是否最終能夠在本地運行,直接安裝在個人或組織的設備上?
試想在不久的將來,你購買一台電腦時,就像操作係統預裝在機器上一樣,它自帶一個經過完全訓練的生成式 AI 模型,該模型被直接刻錄在存儲硬件上。這樣的“個性化 GPT”能夠繼續使用私有的、內部的數據進行訓練和定製,而無需將敏感信息傳輸到雲端。
這樣的轉變將自動緩解當前許多關於 AI 使用的安全與隱私問題。數據不再離開場所,微調在本地完成,風險暴露大幅下降。
但也許更具變革性的是經濟影響。
在過去四十年裏,幾乎每個組織都需要自己的網站,這催生了大量高薪的工作崗位,如網頁設計、維護、網絡安全、內容創作以及係統管理。
當每家公司、機構和非營利組織都需要一個屬於自己的、根據其工作流程、文化與數據量身定製的內部生成式模型時,一場類似的就業浪潮可能會再次出現。圍繞這些模型,可能會形成完整的新部門,例如:
- 本地模型訓練與維護
- 企業級提示工程
- AI 安全與治理
- 模型審計與合規
- 組織內部的多模型協同管理
向內部生成式 AI 的轉變不僅會解決技術問題——它將重新塑造勞動力市場。
內部 GPT 模型能在 20 年內實現嗎?我的答案是:可以。
讓我們審視一下硬件趨勢。假設未來的旗艦 GPT 級別模型擁有 2 萬億參數。在今天,這樣的模型僅存儲其訓練權重就需要數十 TB 的存儲容量。但在二十年後,我們完全有理由期待:
- 10 TB 甚至更多的本地存儲 會成為中高端個人係統的標準配置
- 內存擴展速度將超過現有預測,使多 TB 內存係統可被機構負擔
- GPU 集群的價格將足夠低廉,即使單個設備無法容納整個模型,組織仍可在本地運行模型
即使個人設備無法達到要求,小型的內部集群——相當於今天的一個小型機房——也可以輕鬆運行萬億參數級別的 AI 模型。
還有,對內部生成式模型的需求甚至可能催生全新的機器類別——超越現代電腦的某種東西。正如在大型主機時代很難想象個人電腦的存在一樣,為容納個人生成式 AI 而構建的設備,可能會徹底重新定義我們對“計算”的概念。
從集中式 AI 向個人化、內部化的生成式模型轉變不僅是可能的,而且是極有可能發生的。基於我對人工智能的理解,我相信這一趨勢必將到來。
更多我的博客文章>>>
