【404文庫】“也許五年後,在地球絕大部分地區,GPT取代了穀歌,但是大陸還在用百度”(外二篇)
歡迎來到404檔案館,在這裏,我們一起穿越中國數字高牆。
盡管中國的言論審查和輿論管控日趨嚴峻,國家對公民的監控也無處不在,但我們依然可以看那些不服從的個體,頂著被刪號、被約談、甚至被監禁的風險,對不公義勇敢發出自己的聲音。
中國數字時代在“404文庫”欄目中長期收錄這些被當局審查機製刪除的聲音。
本期節目,我們選讀過去一周中引起輿論關注的三篇404文章。
一、紅博士說|中國如何缺席CHATGPT盛宴
2022年11月,OpenAI開發的一個人工智能聊天機器人程序ChatGPT被推出。該程序使用基於GPT-3.5架構的大型語言模型並通過強化學習進行訓練。2023年2月,ChatGPT開始在中國互聯網上爆火。但早在2022年12月它推出之時,就引爆了全球互聯網,發布兩周之內用戶即破億,熱度經久不衰。
2月2日,微信公眾號“紅博士說”發布文章《中國如何缺席CHATGPT盛宴》。
作者在文中梳理了ChatGPT的時間軸,ta寫道:
2020年
年初,Covid-19爆發。中國閉關。
5月,GPT-3論文發布。
6月,GPT-3 API發布。
9月,ChatGPT的關鍵原型算法相關論文發布。
12月,歐洲機構發布用於GPT-3複現的開源數據集。
2021年
11月,GPT-3 API Public Release,不對中國開放。
中國閉關。
2022年
12月1日,ChatGPT發布。Musk等名流開始談論ChatGPT,引爆英文互聯網。
12月初,中國互聯網的自媒體逐漸開始討論ChatGPT,主要以翻譯twitter的方式。知乎上有學者開始反思。一周後,關注指數下降,兩個月來隻剩下AI自媒體把ChatGPT作為自己的主要關注內容。
中國閉關。
2023年
1月,微軟宣布投資OpenAI數十億美元,並將GPT加入全家桶。
2月,中國春節結束,微軟和Google你方唱罷我登場,納斯達克財報季,AI被反複提起。中國互聯網是認識微軟的,ChatGPT引爆中國互聯網,關注指數飆升。
中國開放。
值得注意的是,中國因為疫情閉關的三年,正是OpenAI的GPT發展、壯大、產品化的三年。
10年來,我們以為自己積攢的AI算法、數據、應用的優勢,如今變成中美巨大的鴻溝。這個時候,我們甚至沒有一個新聞調查,把這件事的來龍去脈,挖它個底朝天。
另一個問題是,我們的中文互聯網不足以提供高質量的訓練數據。什麽是高質量的數據?比如維基百科、高質量的活躍論壇、專業新聞、學術論文、高質量代碼、圖書。
沒有好的中文數據,我們就隻能搭全球互聯網的數據順風車。上麵這些優質數據的產生,需要開放的社區,我們似乎無解。
二、知乎網友|國內研究CHATGPT的主要阻礙是怕它亂說話
在知乎上,一名網友發起了提問“阻礙國內團隊研究ChatGPT這樣產品的障礙有哪些,技術,錢,還是領導力?”,評論區有一條回複遭到了刪除。ta寫道:
主要阻礙是怕ChatGPT亂說話……大語言模型完全是黑箱,你不能保證他永遠不說一些不興說的東西,一旦說錯話對任何一個公司都是毀滅性的打擊。所以根本不會有團隊去做,做出來了也不可能開放給普通人用。也許五年後,在地球絕大部分地區,GPT取代了穀歌,但是大陸還在用百度。
中國數字時代編輯同時摘錄了一些其他用戶的回複:
lili:首先得讓AI具備識別一切敏感點的能力。不但得能識別過去和現在的。還得可以預測未來的,起碼10後的。估計550W的算力不夠,550WWWWWW也許成。
知乎用戶:方向。這個東西一定會被拿來做審核機器人的,我碰到過好幾個這樣的團隊了。絕對不可能拿來做大模型公開使用的,不然競對直接惡意提問+舉報,能把你搞到破產+吃撈飯。
顧塵:追求自由的環境吧,第一,學者有自由研究的習慣和空間,第二,非官方研究機構有空間做大做強,第三,有政策環境和法律保障保護參與貢獻者包括個人和公司的合理回報。
羨魚智能:最大的阻礙是眼界、風氣。創新是有失敗風險的,而跟風就穩妥多了,擅長後發製人。站在國外成果的肩膀上,搞個XX中文版,雖然不一定能吃上肉,但肯定能喝到湯,贏麻了!可惜,有些東西還真複刻不出來,這時候就會說,他們怎麽不開源!
Out Man:一個問題+一個答案,也許一個產品就沒了,有哪個資本敢投?就算你好不容易讓這個產品苟活下來,也早已麵目全非了,甚至很可能你花在人工篩選上的成本都超過研發投入了。
知乎用戶:你如果,非要刨根問底,非要每一個事情的原因都說明白。那麽我隻能說,到最後,會發現是意識形態問題。這不是我的主觀猜測,這是一個客觀事實罷了,而且大部分人心裏都清楚,就是嘴上要辯解。這也很正常,屁股決定腦袋。
巴拉丁:想平地起高樓,要先打好地基,地基都沒得,你也就能起個三層小洋樓。
嘉心糖P用沒有:我有一個想法,我們可以研究一個審核chatgpt說話的ai,我們不能隨便說,但是我們可以隨便不說!審核AI-chineseGPT,項目立項了之後,其實隻需要加一個敏感詞庫,經費來!
三、網易新聞|官媒尷尬了,為什麽越來越多的人都不相信勤勞能致富了?
2月9日,人民網發布了一篇名為《好好幹,日子會越來越甜》的文章,試圖傳播“正能量”。然而,這篇文章卻引發了網友熱議,越來越多的人不相信勤勞能夠致富。2月14日,在網易自媒體平台“網易號”上,一篇名為《官媒尷尬了,為什麽越來越多的人都不相信勤勞能致富了?》被發布。
文中寫道:
按道理說,中國經曆了3年疫情,在這3年裏,人們的生活過得非常的苦,很多人因為疫情失去了工作,失業在家,還不起房貸和車貸,所以很多人經濟發生了一些翻天覆地的變化。
以前有疫情,賺不到錢可以怪疫情,現在疫情放開了,沒有理由沒錢了,再沒錢就說不過去了。再沒錢就是你不努力了。
所以人民網的作者才想到寫這麽一篇小短文來鼓勵大家吧,小短文是真的很甜啊,但是甜甜的小短文沒有獲得老百姓的一致好評,反而還受到了越來越多的嘲諷,為啥為啥呢?
我就拿我身邊的人來舉例子吧,從我身邊的人身上我看到了,其實努力幹,真的賺不到錢。
我老公有一段時間晚上去送外賣,一單才掙5塊錢,從晚上八點跑到晚上12點才賺了三十幾塊錢,一個月才賺了800塊錢,這800塊錢能幹啥啊?
關鍵是送外賣很辛苦啊,刮風下雨天氣那麽冷,雨水打到臉上多難受,衣服都淋濕,爬樓梯,這麽辛苦,一天才賺30塊錢,好點的情況下賺50塊。
冬天冷的要命,夏天熱的要命。
你說他不吃苦嗎?他也吃苦了,但是收益很小啊,和付出的勞動不成正比。
但是你看某些人,一杯茶,一份報紙,日上三竿才到單位,到單位報個道,坐那裏喝喝茶,醒醒酒,中午出去陪情人約會,晚上高檔娛樂場所玩一玩,人家一年賺的錢都比我們一輩子賺的都多,人家貪汙的錢,比我們後代幾輩人賺的都多,這樣的日子多麽瀟灑?快樂似神仙。
以上是本期選讀的三篇404文章。這些作品版權歸原作者所有。中國數字時代僅對原作進行存檔,以對抗中國的網絡審查。