2012 (72)
2013 (74)
2014 (70)
2015 (55)
2016 (64)
2018 (67)
2019 (63)
2024 (45)
2025 (4)
“OpenAI”公司的人工智能語言邏輯對話軟件“ChatGPT”推向社會之後,廣受追捧(Good milk comes from happy cows, happy cows live in San Francisco, *_*)。 然後,“百度”公司推出了號稱“原創”的百度語言邏輯對話軟件,“文心一言”。
“一言”同學這個百度的“我也有”,讓社會多一種服務款式是好事情,但是…..
百度的“文心一言”很快被使用者發現問題,比如,在輸入“起重機”要求給出圖片時,“一言”同學給出了一隻鶴的形象。
熟悉中英文互換的朋友應該能從中了解,從“起重機”到“鶴”的誤解,是經曆了一個“中文至英文”的換能過程。於是,“文心一言”的“原創性”受到高度質疑,一種猜測是“一言”同學把ChatGPT類的英文版軟件給加了個中文殼,經典的“山寨版”。
如果百度的“一言”是山寨產品,它不是山寨首例,連翹楚都算不上。山寨,或是說“土匪版”,是有基因的,“紅色基因”的一部分,產於太祖時代。
早期一例是“紅旗轎車”。
看圖:
取自“香港周末報”的“一九六六年國慶畫冊”。
這個嗎…….
單從外形看,“紅色基因”的“紅旗牌”,有沒有其它基因?比如:
這是 Chrysler 1955 年的“禮模型”豪華車“Imperial”。
本老漢不是車癡,對除了自家車之外的其它車懂很少。看到前麵“國慶獻禮”的“紅色基因”車能想到Chrysler的“帝國主義”車的可能為零。這款Chrysler的車,是當年把“紅旗”三排座豪華轎車給“試製成功”的一位主要參與者在個人回憶中提到的,是從南斯拉夫駐北京大使館流出來的一輛二手車,“試製成功”中將其全拆,然後照此車“逆向工程”。
這種“偷”,我是說山寨,*_*,當然不限於“紅色基因”的厲害國。偷師的韓國車,過去20年,從車界笑話到現在走入世界車界主流。但光靠偷肯定沒戲。這個“紅旗牌”的故事,立項就是麵子工程,為了領袖出場有麵子,用演藝界的行話說,“劇團成立就是為了唱堂會”。產車25年,總共得車1500輛,平均每個月兩輛車。在“市場”初立的1984年停產了。
這個“紅色基因”的山寨特色,是無法否認的。太祖當年曾專題論過:
“山下旌旗在望……”-------山
“早已森嚴壁壘……”--------寨(文化的說)
連山寨的具體位置都說了“黃洋界上炮聲隆”。
所以,“一言”同學的疑似山寨換殼,如被證實,隻是那個太祖山寨基因的一種代傳,不是例外而是意料之中。
“山寨成性”的一個附帶產品是“原創廉價”,偷基因從“紅旗牌”到“文心一言”不停,創意就全靠“親自指揮,親自部署”了。偶爾,也能山寨成為世界第一,比如“測核酸”,^_^。
後注:此文未經任何ChatGPT 注入。
世上本沒有那麽多賊,做賊的有義正詞嚴,於是便養出這這許多賊來。
傳人哥要謝謝機器五毛上T台免費作供。
但這裏談論的是特點,並不是比較優劣。
簡單講,因為中文具有的多義性和語意連帶關係的複雜程度遠遠高於英文,因此同樣的學習方式用在中文會遠比用在英文複雜和難度大。
也就是因為AI在中文下對語言的理解是很難的,至少在現有技術下。這事情類似曾經的打字機的發明,中文打字鍵盤基本不可能。
這也預示在現有技術下,AI在理解中文的環境中還不能突破,或者任何一種類似的抽象性高特點的語言都會出現同樣問題。
但這僅僅是一個階段而已。
有一個與這事情相關的事情是很說明這類問題的,大概全世界人都不反對說中國人智商高,甚至搬出什麽腦容積相對身高大一類的理論。
其實並不是因為腦容積大,而是中文的多義性導致人們必須有強烈的聯係字義,抽象與實際化之間的迅速轉換,這是中文的OO特點決定的,是中文的一個特點,但這種體現OO的語言擴展性也增大了語言的複雜程度。
你整天生活在這種環境下自然“聰明”。
人們一般說東亞人聰明,但實際上指的是中國人和日本人,並不是具有拚音文字或者語音文字特點的其他東亞人,比如越南人韓國人。
而中國人與日本人share同一種文字,文字都具有object oriented的特點。
對於這種文字理解的AI的設計是不同的。
至於山寨不山寨的,並不是什麽丟人的事情,這本身就是學習的過程。如今在新能源技術上中國領先,也是經曆了山寨學習的過程。Tesla決定恢複使用雷達,也是因為世界主流自動駕駛的成功,華為的技術。