個人資料
正文

[山寨爭鳴] 漢語遲早要“淘汰”英語嗎?

(2013-07-24 19:57:29) 下一個

[概要] 最近在網上看到一篇文章,標題是《“漢語”遲早要淘汰“英語”! 》。追捧轉貼很多。山民對漢語英語都有興趣,看到這篇文章,差點笑翻。文章不是這麽寫的嘛。忍不住點評幾句。
======================

[轉貼] 漢語遲早要淘汰英語!

漢語的一個明顯的優勢是,思維麵廣闊,在數學上由於單音節發音,對數字的反應速度也更快,但在邏輯思維方麵還是拚音文字較好,但從人類文明發展的趨勢看,作為表意文字的漢語,由於可以自由組合新名詞新概念以至新思想,可以容納信息和知識爆炸的衝擊,無疑將發展為人類的共同語言,用這種語言來交流思想更加方 便,更加豐富多彩,當然在論文和計算機語言是漢語和拚音文字並用了。

漢語的偉大就在於兼容,你們看看在漢語的學術論文有漢語和阿拉伯數字和西方拚音文字的混用現象,但在英語論文中則找不到一個漢字,中國的物理學專家可以憑 借他在中學時代的化學基礎知識通讀化學專家的論文,反之依然,而英美的不同行業的專家要交流他們的學術成果,則是對牛彈琴,憑這個優勢,漢語就有資格成為世界語,而我們國內還有些學者還要把漢語拚音化,這不是邯鄲學步東施效顰嗎?
=================
點評:
(1)“中國的物理學專家可以憑 借他在中學時代的化學基礎知識通讀化學專家的論文,反之依然” 。即使是化學博士,中文化學論文也不一定都看得懂。你要是不信,試試這個:苯並吡嗪,前線軌道,乘積算符。
(2)“而英美的不同行業的專家要交流他們的學術成果,則是對牛彈琴”。 這位同學大概沒有讀過英文學術期刊,也沒有開過多學科的學術會議。

==================

我們中國人民也有資格控告那些所謂的文明的西方人,是誰在製造環境汙染,破壞森林和草原,就是他們,因為印刷同樣內容的一本書,西方語言要比漢語浪費2倍的紙張,全世界使用西方語言的人要比使用漢語的人多5倍,按照簡單的因素級連倍乘法,就要浪費10-20倍以上的木材增加20倍以上的工業廢水(真是一筆糊塗帳!)。就語言的 優越性來講,西方人沒有什麽資格對漢語說三道四,連文盲都知道從聯合國五種工作語言找出漢語文本,因為漢語文本是最薄的那一本
==================
點評: 聯合國的文件沒見過。但是大英博物館,盧浮宮各種文字的書籍簡介,中文本絕對不比英文本薄。比較一下《光榮與夢想》中英文版:



 

英文: 中文: 
Title: The Glory and the Dream 書名: 光榮與夢想
Publisher: Bantam Books (1975) 出版社: 海南/三環出版社 (2004)
1st PAPERBACK edition 裝幀: 平裝
ISBN-10: 0553012096 國標編號: X7-80700-024-4/K
Dimensions: 225mm x 150mm 開本: 16開 (260mm x 185mm)
Paperback: 1398 pages 頁數: 1334
(英文版中的100來頁索引和文獻,中文版沒有)  

 另外,現在英文電子書大行其道。Amazon.com 的電子書籍銷售量早就超過印刷書籍的銷售量了。
==================

中國人心裏有這樣一種成見;認為漢語遲早要被英語所淘汰。

記得有一次,大概是胡野碧在辯論時幹脆把它清楚地說了出來。前幾天“世紀大講堂”請了一位學者李銳也認為全球化的結果是讓英語統治世界。隻有阮次山在一次 “大時代,小故事”中談到漢語的思維速度比英語快。但是,他又提出一個問題;既然由於漢語使用了‘聲’使得漢語的思維速度比英語快,那麽,由於廣東話中的 聲比普通話多,是不是廣東話的思維速度比普通話更快呢?我的回答是,廣東話雖然使用的聲調多於普通話,但是,廣東話有兩個缺點,第一、它的文字規劃得不 好,文字表達欠佳,且有閉音節的聲音存在。第二、它的聲音利用率不高,普通話有21個聲母、35個韻母和四聲,連乘的結果是2900個聲音,但是能夠被利 用的是2500個,而真正被用到普通話中的僅1200個。廣東話有九聲,即使它的聲母和韻母與普通話一樣多,那麽它實際使用的聲音也應該是普通話的兩倍多才對,但是,廣東話中實際使用的聲音僅有1500個,與普通話相差不多,而它的利用率比普通話小了幾乎一倍。利用率小,就說明難學。因為同樣的一個聲母或 韻母,每次的使用實際上也是一種練習的過程,利用率高的聲母或韻母必然容易記憶、容易掌握。日常生活中也可以看到,凡是常用的語言元素,包括聲母、韻母、 漢字和單詞等到,越是經常使用的越容易掌握。語言的好壞其實取決於兩個方麵,第一、是不是能夠用很少的記憶來掌握,第二、是不是能夠在有生之年掌握到比其 他人更多的知識?用一句極限的話來講應該是:最好的語言是不學而知但是所掌握的知識又最多的語言,或者說,學少而知多的語言
==============
點評: (1)所謂能夠被利用的發音數毫無意義。因為說話時並不要求不能用同音字。(2)以下例子,隻有四個發音,也能表達很多意思。(3)漢語難學,就不用說了。

趙元任《施氏食獅史》  石室詩士施氏,嗜獅,誓食十獅。施氏時時適市視獅。十時,適十獅適市。是時,適施氏適市。氏視是十獅,恃矢勢,使是十獅逝世。氏拾是十獅屍,適石室。石室濕,氏使侍拭石室。石室拭,氏始試食是十獅。食時,始識是十獅,實十石獅屍。試釋是事。
==============

英語與普通話相比則不同,國際音標中,英語有20個元音和20個輔音,所以英語的聲音種類不會超過20×20=400個;反過來說,不在這四百個聲音之內的任何聲音都不被英語所承認,或者被認為是不正確的發音;這裏所說的不是“音節”。比較一下就會看出,漢語的發音種類是英語的3倍,兩者的比值遠大於廣東話與普通話的比值。

下麵要說一下,為什麽聲音種類越多,思維速度就越快。這個問題,去年我在“北大中文”論壇討論了一個月才使大家弄清楚,在這裏我希望盡量說得簡單。假設有 一個僅會發兩種聲音的人,具體地講,他就會發a和b兩個音。根據電腦的理論,我們知道,他用這兩個符號依然可以表達整個世界。再假設,世界上僅有400種 事物需要表達,那麽,一個英國人可以用每一個發音來表達400種事物中的一件,而僅會發兩個聲音的人,有時就不得不用九個發音來表達400種事物中的一 件,因為二的九次方才大於400。比如,英國人用“i”代表“我”而僅會兩個聲音的人可能要用abbababba代表“我”這個概念。一般人每發一個聲音 大約需要消耗四分之一秒的時間。比較兩者就會看出,僅會兩個聲音的人,不但表達得慢,而且還費力氣。在表達“我”這個概念的時候,英國人使用四分之一秒的時間,而僅會兩個聲音的人使用了二又四分之一秒。如果兩個人總以這樣的比例生活一輩子,他們一生中所享受到的所有信息將是它的反比9:1。(這裏的關鍵是英語根本就不是兩個聲音的語言!)
===============
點評:
作者忽略了幾個事實:(1)語言表意不局限於單音節。 所以獨特單音節數字的比較無實際意義
(2)思維的時候不一定需要發音。湖南方言有六個聲調,湖南人思維速度不一定就比北京人快。(3)即使思維速度與表達速度相關,那起作用的也隻是單位時間內能夠發出的音節數所能表達的意義。與語言中聲音總數無關。
===============

實際的情況中,最明顯的是日語與漢語的對照,我們知道,日語使用了100種不同的聲音,而漢語使用了1200種聲音,因此很多漢字讓日本人一念就必須用兩個或者三個聲音來表達。我們假設日語中所有的字都用兩個聲音來表達,那麽豈不是說,日本人一生所能夠享受到的信息僅僅是中國人的一半嗎?我曾經思考過,這是不是與日本曆史上從來沒有出現過偉大的思想家有關。
===============
點評:難道“中國”這個詞漢語發(zhongguo)時表達的信息和日語發(ちゅうごく)時表達的信息是不一樣的?
===============

我們知道,思維實際上是一種心裏說的過程,如果在說話時表達得快,那麽,思維的速度也應該跟著快。具體的例子是趙元任曾經比較用英語和漢語背誦乘法口訣的速度,漢語使用了30秒,而英語使用了45秒。因此,如果兩個人同時用英語和漢語來背誦的話,到了 30秒的時候,漢語使用者一定想到了九九八十一,而英語使用者則一定到不了這裏,說不定,他想到的僅僅是七七四十九。這就證明了使用發音種類多的語言比使 用發音種類少的語言思維速度快。這一點曾經被國、內外許多學者所證實。至於思維速度快是否就代表聰明這個問題是被很多學者所承認的。
==============
點評:思維與發音是兩回事。你讓兩個小孩書麵答題,一個用英文,一個用中文。隻要都會乘法,我想答卷的速度應該是差不多的。另外,背誦和朗讀不是思維。
==============

我的證據是解釋一個曆史上的“謎”:古希臘人為什麽比其他人更聰明?因為希臘的文化來自古菲尼基人,我們知道菲尼基人發明了人類的拚音字母,就聲音的分解 來說,這是一大進步,就思維速度來說,它是一大倒退。因為,為了篩選容易區分的聲音元素,菲尼基人僅僅使用了22個輔音,這樣,它的表達速度當然比現在任 何語言都慢,而希臘人則采用了元音,我們知道元音與輔音結合以後,聲音種類等於增加了好幾倍。事實上,菲尼基人的聲音中也有元音,否則他們是發不出來的。 所謂的22個輔音是說他們僅承認這22個輔音為信息栽體,也就是,ma、me、mu、mai、muo在他們的耳朵裏與一個m沒有任何區別就像me的四種聲 調對於英國人來講沒有任何區別一樣。由於聲音種類的突然增加使得希臘人的思維突飛猛進,造成了後來的現象。論壇上曾經有人問漢語的聲音種類依然多於英語, 為什麽沒有英國先進。我的回答是,當聲音種類突然增加的時候就有新思想出現,反之,當聲音種類減少時,思想就趨於保守,而元朝以後,中國的聲音中失掉了一 個“入”聲,中國的衰弱正巧從那時開始。最後,在討論尼安德特人的時候,人們也發現,使用聲音種類少的人種會被曆史淘汰。
==================
點評:按照作者的觀點,上海應該是越來越沒落了。因為上海話的聲調與韻母越來越少了。
上海話主要以年齡區別老派、中派和新派。
老派:
聲母27個,韻母51個,聲調6個(陰平、陰上、陰去、陽去、陰入、陽入)

中派:
聲母28個,韻母43個,聲調5個(陰平、陰去、陽去、陰入、陽入)

新派:
聲母28個,韻母32個,聲調5個(陰平、陰去、陽去、陰入、陽入)

==================

我之所以認為漢語必定戰勝英語的根據還不在這裏,關鍵是要解決人類目前所麵臨的知識爆炸問題。我們知道,目前的英語單詞包括各種生物名稱及專利發明的新術語已經超過了數百萬,如果考慮到英語中有一些可以推導和聯想的成份;比如前、後綴和複合詞等,它所需要記憶的基本單詞也有一百萬個。而所有這些單詞在漢語中都可以用四千個漢字來表達。根本的原因還是英語的發音種類不夠。
==================
點評:文章混淆了發音與表意的差別。日語也用漢字表意,但是日語直接用片假名拚寫英語外來詞,難道也是發音種類不夠?要知道,早年很多漢語新詞,都是從日本引進的。如民主,科學,共產黨。說明日語(實際是日語發音的漢字)造新詞的能力也不差嘛。可見造字能力與發音無關。 
http://www.zhaojun.com/youci/riyu.htm
==================

比如pork這個詞,在英語中代表豬肉,它和豬pig、肉meat沒有任何關係而僅僅代表它們的一個聯合體而已,如果把豬肉pork、羊肉mutton、 牛肉beef、豬油lard、羊油suet和牛油talon放在一起進行比較的話就發現,英語中所有的聯體詞都是一個與其中任何一個分解詞毫無關聯的新符 號,而它們卻構成了英語詞匯的主體,英語中幾百萬的單詞就是這樣來的。它的根本原因是由於如果將pork改成pig和meat連在一起的形式,那麽就要發音四次而pork僅僅發音兩次;所以聯體的詞能夠節省發音卻要增加記憶,而分體的詞,無需記憶可是卻增加了發音次數。設想,一位屠夫,每天要用到“豬肉” 這個詞上千次,使用兩次發音的單詞要比使用四次發音的詞節省兩千次發音,何樂不為?(這麽說的話,英語打招呼說 Hi, 漢語打招呼說“你好”。人人都會天天打招呼,但隻有屠夫才天天說豬肉, 哪個省事?個別的例子沒有任何意義。)但是遇到不常用的詞的時候,英語還是和漢語一樣,使用分解的詞,比如驢 肉就用donkey meat來表達。因為不常用的詞,即使設立了符號形式,別人也記不住。漢語能夠將英語中聯體詞匯分解的功能,非常有用,它使所需要記憶的詞匯大大地減少; 不僅如此,它還能夠將詞匯在人們頭腦中的位置整理得清清楚楚。達爾文主義的誕生就是建立在林奈的雙名法的基礎之上的,這種方法使得各種印象在腦子中由原來 的平麵,變成立體的。比如,在林奈以前,人們給所有的生物一個名字,結果,由於種類太多,同一種生物可能有兩種名字,而另外的生物,可能沒有名字。林奈則 將所有的生物先分類,並且給出一個類名,然後在類名的下麵放一個詞,兩者組成雙名法的名字。這樣不但清晰,而且大大的減少了需要記憶的符號;比如原來有一萬個名字,現在分成一百個類,又在每類中分成一百種,我們所需要記憶的僅僅是一百個類名和一百個種名,共二百個,而不是原來的一萬個。隨著知識爆炸的問題 逐漸惡化,人類就有必要將其他的術語也仿照這個方法改造,而目前唯一的辦法就是按照漢語的結構進行改革。而原因還是在於發音種類的數量。
================
點評:當初化學傳入中國,化學元素的翻譯是個大問題。漢字傳統的造詞方法根本行不通。還是傳教士傅蘭雅新創前所未有的造字法,才翻譯了所有的化學元素名稱。由此看來,單字的獨特發音再多也無濟於事。(http://proj3.sinica.edu.tw/~chem/servxx6/files/paper_1791_1231831930.pdf
================

這個現象最先是德國的萊布尼茲體會到的,他認為漢語是自亞裏士多得以來,西方世界夢寐以求的組義語言。但是,他沒有看到聲音的真正特性,卻由於漢字的數量 上的性能而定義漢字是世界上最先進的文字。我想,如果他看到今天知識爆炸的世界,他一定會要求世界上所有的國家廢除拚音文字而采用漢字。

最後,談一下關於人的一生中到底能夠記住多少單詞或符號的問題。中國人所使用的漢字通常在三到四千,而莎士比亞時代的英語僅有三萬個單詞,他本人能夠全部掌握。但是,到了丘吉爾時代,他的單詞量依然是三萬個,可是,那個時候的英語已經擁有近百萬個單詞了。所以,我認為,莎士比亞使用英語單詞的熟練程度是後 人根本無法達到的。我問,到底學習英語應該掌握多少單詞才成,但是,他們的回答總是含糊不清,或者扯一些別的東西。後來,在一些無法避免這個問題的文章 中我發現,語言學家們對於英語單詞的要求是:一個受過教育的英語使用者應該掌握五到二十五萬單詞。不但差距範圍很大,而且,用這個標準來衡量,莎士比亞和 丘吉爾都應該是文盲,至少是沒受過教育的人。我認為,這是任何推崇英語的人的軟肋,隻要他們能夠躲過別人問這個問題,其他的方麵……
================
點評:作者沒有問對人嘛。看看下麵:

With a vocabulary of 15,000 words you should be able to read about 98% of texts of which headwords account for around 72%. Headwords are those words used to locate an entry and dictate its alphabetical position in a dictionary. However, a native reader needs to understand approximately 95% of a text to really comprehend what is being read not discounting the different types of texts (i.e. a novel vs. a newspaper). So, this answer can range anywhere from 2000 to 5000 or more ‘high frequency’ words. A native English speaker, for example, understands approximately 20,000 words by the time he/she finishes college.

 How many English words do I need? 

The number of words you need varies according to individual needs: are you a banker, bus driver, academic, business person, entrepreneur, etc. As a speaker of English as second language a vocabulary of around 3000 high frequency words can be enough to get by.

Also see: http://www.nflrc.hawaii.edu/RFL/PastIssues/rfl122ward.pdf
====================
[略去三段關於the Cox report, English only comments etc.]

談漢語與英語的優劣


談到漢語與英語的優劣問題,首先就會想到“表意文字”與“表音文字”的區別。前麵已經講到隨著漢字的演變,漢字已不再是純粹的表意文字了。存在著大量形聲 字。曆史上隨著文明的不斷發展,語言所要表達的概念不斷增加,表意文字要求漢字擁有了一個數量龐大的字符集,但現代漢語已經不用增加字符來表達新的概念, 而是創造新詞,加上對漢字漢語的規範化,這已經基本上達到了減少了使用字數的目的。


與漢字相反,英語名為“表音文字”,其實並不能真正的表音;英語正詞法中比較嚴重的問題就是如何解決英語的書麵拚寫形式和讀音之間的矛盾問題。由於文藝複 興時期印刷術的推廣和教育的普及,英語的書麵拚寫形式逐漸統一,形成了規範的形式,而這些規範的形式又通過印刷的方式進一步固定下來。但與此同時,英語的 語音發生了很大的變化。例如,gnash(咬牙)和 gnat(小昆蟲)中,g不發音,knight (騎士)和 know (知道)中,k不發音,而在中古英語中,這幾個字母全都要發音。又如,輔音字母前的 r (如 arm)和詞尾的 r (如 father)不發音,詞尾的 e(如 live)不發音,而在中古英語中,它們都是要發音的。這種情況,使得規範的書麵形式與實際的發音之間出現了很大的矛盾。這也是中國人學習英語時遇到的一個難點:學習一種“表音文字”如果不查字典、不看國際音標,也不一定能準確發音,是不是好笑?

====================
從學母語的角度,中國人念白字的很多。 美國人念錯字的很少。
從學外語的角度, 美國人學漢語問題大了, 比中國人學英語問題大。
在形聲脫節方麵,漢語有更大的問題。
====================


18世紀開始,英國強調語言的規範化,要求語言準確有力。1755年,約翰遜(Samuel Johnson)編寫了第一部英語詞典,把英語詞的拚寫形式固定了下來。這樣,英語的正詞法就能夠以詞典作為規範的根據。這很象中國秦朝時將小篆的書寫規 範化,但是卻沒能阻止漢字語音的變化。

這就提出了第二個問題:所謂拚音文字也有一個大問題,就是許多拚音文字,由於千百年來口語的不斷變化,它的書麵文字與讀音往往相去甚遠。法語也一樣,它的書麵語言表達的還是四、五百年以前的發音,不發音的元音彼彼皆是,象hommes讀為um,aiment讀為em。

事實上,現在的書麵英語、法語,已經有很大“表意文字”的成分了。曆史上的漢字作為表意文字(ideograph),文字與語音沒有直接關係,無論用哪種 語言或方言去讀,意義沒有變化。這是幾千年來各種口語分化交熔變遷,而漢字一直作為一種統一的文字被所有人認同的原因。漢字使操不同口語的人互相交流成為 可能,而隔膜是統一的主要障礙。所以在“表意”、“表音”這一點上,漢字並不比英語劣勢。

現在普遍認為漢字的龐大的字符集使它顯得非常複雜:難學、難記、難用。但是這裏麵需要搞清一個前提:那就是漢字的“字”與英文的“word”是不同的概 念。現在的中小學教育需要掌握2000-3000個漢字,才能夠滿足日常閱讀。但這不僅僅是學習2000-3000個“字”,而是學習2000-3000 個概念。一個人一天之內可以學習26個英文字母,但是他能閱讀英文嗎?由於英文已經不是典型的“表音文字”,學會26個字母甚至連準確的單詞發音都沒有掌 握。到頭來,在以英文為母語的國家中小學中,仍然要進行大量的單詞拚寫訓練。掌握2000-3000英文單詞是什麽水平?能應付日常閱讀嗎?學習過英語的 人都明白!

====================
美國的兒童似乎不搞默寫。也不抄寫生詞。在美國生活過的人都明白。
漢語除了字典,還有辭典。「辭海」也是很大很厚的書。

Studies indicate that a 2,000-word vocabulary of high frequency words actually comprises 87% of words in an academic text accompanied by an additional 800 academic words identified as comprising an additional 8% of textual items are sufficient for a successful college life.

These are the most common words in English, ranked in frequency order.  The first 25 make up about a third of all printed material. The first 100 make up about half of all written material, and the first 300 make up about 65 percent of all written material.  Is it any wonder that all students must learn to recognize these words instantly and to spell them correctly also? (http://www.discountutor.com/most_commonly_use_words.htm

First Hundred Words

Words 1 - 25 Words 26 - 50 Words 51 - 75 Words 75 - 100
the or will number
of one up no
and had other way
a by about could
to word out people
in but many my
is not then than
you what them first
it were so been
he we some call
was when her who
for your would oil
on can make its
are said like now
as there him find
with use into long
his an time down
they each has day
I which look did
at she two get
be do more come
this how write made
have their go may
from if see part

Common suffixes: -s, -ing, -ed, -er, -ly, -est


====================

研究表明:漢字作為一個複雜的文字符號係統,其信息熵很高。研究的基本方法是:逐漸擴大漢字容量,隨著漢字容量增大,信息熵的增加趨緩;漢字增加到 12370以後,不再使信息熵有明顯的增加。我國科學家指出:漢字的容量極限是12366個漢字,漢字靜態平均信息熵的值(平均信息量)是9.65比特。 通過數理語言學中著名的齊普夫定律(ZIPF’S LAW)核算(ZIPF’S LAW 考慮字符使用頻率),這是當今世界上信息量最大的文字符號係統。聯合國五種工作語言文字的信息熵的比較如下:
法  文: 3.98比特
西班牙文: 4.01比特
英  文: 4.03比特
俄  文: 4.35比特
中  文: 9.65比特
可以看出,拚音文字的信息熵小,差別不大。漢字的信息量最大。

=================
什麽是熵?與封閉體係混亂度(無序)相關的概念。
至於信息熵,是指對一個字符集進行編碼時,所需要的最小碼長,單位為比特 (bit)。 8 bits =1 byte
英文隻考慮26個字母的話,最小碼長為:4.7。漢字隻考慮2500個常用漢字,最小碼長為11.3(不考慮出現頻率)。

如英語有26個字母,假如每個字母在文章中出現次數平均的話,每個字母的信息熵為:

I_e = -log_2 {1over 26} = 4.7

而漢字常用的有2500個,假如每個漢字在文章中出現次數平均的話,每個漢字的信息熵為:

I_e = -log_2 {1over 2500} = 11.3

考慮不同字符的使用頻率,整個係統的平均信息熵是:

H_s = sum_{i=1}^n p_i I_e = -sum_{i=1}^n p_i log_2 p_i
對於中文,字符集有多少字是關鍵。 特別要注意的是,以上隻是字符的編碼長度,不是語義信息量的衡量。 因為英文是對字母(而不是單詞)編碼,漢字是對漢字(而不是筆畫)編碼。  這兩個理論最小碼長的大小並不代表兩種語言信息量的比較。而是表示兩種書麵文字字符集(英文為字母,中文為漢字庫)所需要的最小理論編碼長度。

以上信息熵數據的應用是各種語言字庫的輸入編碼。從文字的鍵盤輸入來講,一個英文字母輸入要敲一下鍵盤,按照理論平均碼長,一個中文字平均要敲3下鍵盤才能達到(9.65/4.03 = 3)。但實際編碼時比3要多。

漢字的信息熵值較大,並非體現所謂每個漢字的語義信息量,而是體現要編碼漢字的字數多!如果我們不對漢字本身編碼(就像英文不對英文單詞編碼一樣), 而是對漢字筆畫編碼(不管實用性),那漢字的信息熵就與英文相近了。
=================


漢字對拚音文字的這種信息熵優勢是什麽概念?簡單的比喻就是十進製數與二進製數的差別。十進製數字係統需要人記憶0-9,10個符號,二進製隻需要記憶0 和1兩個符號。十進製乘除要記憶9×9表,二進製隻需要學會與、或、非的簡單邏輯。但是,人類在日常生活中為什麽不使用二進製數字係統呢?因為那樣很浪 費,一個數字“7”表示成二進製就成了“111”,記個大數不把人累死?反過來,人類為什麽不用十六進製,或更高的進製呢?一方麵是人腦智力的限製,另一 方麵,十六進製也未必能大幅度提高信息熵。這種信息熵反映在文字上,就是聯合國文件中,中文版本一定是最薄的。信息熵高是不是就不利於計算機處理呢?這方 麵恐怕還很難下結論。簡單的比較漢字與英文的輸入速度是不能說明問題的,因為“字”與“word”是不同的概念。要比較隻能比較同一內容的中英文兩個不同 文本,計算擊鍵數的差值。在“詞”的單位基礎上,現代漢語與英語是可以進行比較的。現代英語為了應付不斷湧現的新事物、新思想、新科技、新概念,也在不斷 地造詞。無非是借助拉丁詞根、或重新組合已有單詞,結果越是專業科技的詞匯,就越長、越難記。或者是大量使用縮寫:如WTO、FBI、IBM、UFO等 等,縮寫一多就容易混淆、難以理解。在這方麵,現代漢語造詞的優勢就十分突出了。這就是漢字字符集信息熵高的優勢。

真正阻礙中國進步的並不是技術,而是人們思想的禁錮。在西洋活字傳入中國之前,利馬竇、徐光啟翻譯的歐洲文藝複興思想書籍,已經通過古老的雕版印刷出來 了。但是在當時及後世很長時間內,卻得不到國人重視。這是一件很悲哀的事情。在落後思想的禁錮下,即便我們象伊朗、土耳其那樣把自己的文字全部改成先進的 阿拉伯文或拉丁文拚寫,我們也無法逃避象古波斯和奧斯曼帝國那樣的衰敗。

神奇的漢語,愚笨的英語

最不喜歡聽一瓶子不滿半瓶子搖的人講漢語的壞話。什麽“漢語不精確了”,“漢語不能細化了”。記得的本人都中學的時候,語文課本上堂而皇之地寫著:“走拚音化道路是漢語的必然趨勢。”其中最主要的一條理由便是,英文可以打字,而漢語不能。現在回想起來真可笑。隨著計算機技術的發展,漢字的鍵盤輸入速度已遠遠超過英文,而且還在隨著技術進步而不斷快速提高。可英文呢?滯步不前了吧。

現代所有學科領域,中國都有很好的學者,沒聽說哪位因漢語“不精確”而搞不好研究的。中國的火箭照樣可以精確升空,中國的原子彈照樣可以精確爆炸。所有的英文科技文獻都可以翻譯成漢語。漢語文獻影響力正隨著國力的增強而在世界範圍內增強。

下麵舉個最簡單的例子來顯示英文的笨拙:本人曾問係裏的幾個教授“長方體”如何用英文講,可這幾位母語是英文的工科教授竟說不知道,接下來連問幾個本地的 研究生,結果他們也不知道。著實令我大吃一驚!現在我要問讀者:您知道麽?反正不是Cube,Rectangular……。(恰恰就是 cuboid, rectangular prism.) 後來,我倒是真的在字典裏找到 了該詞,可現在又忘了,原因是它太生辟。感歎,英文真是笨人的語言,試圖給天下每一事物起一個名字。宇宙無窮,英文詞匯無窮!詞匯如“光幻覺”、“四環 素”、“變阻器”、“碳酸鈣”、“高血壓”、“腎結石”、“七邊形”、“五麵體”都隻有專業人士才會。根本不可能象漢語那樣觸類旁通,不信?去親自問問母 語是英文的人好了。英文是發散的。搞的一些基本概念如“長方體”也隻有專家才會講!怪不得英文世界裏專家那麽多,而且都那麽自信;是啊,一般人連他們的基本術語如“酒精綿球”“血壓計”都不會講。生活在英文世界真是對無知無奈!可悲可憐!

=====================
俺把作者認為很難的英語詞列出來,與下麵的漢語常用字對照。

光幻覺: optical illusion
四環素: tetracyclin
變阻器: adjustable resistor
碳酸鈣: calcium carbonate
高血壓: high blood pressure
腎結石: kidney stone
七邊形: heptagon
五麵體: pentahedron
長方體: rectangular prism
======================


英文是一維的,是密碼語言。寫英文是編碼,讀英文是解碼。細想想:如把英文的a、b、c、d、e換成1、2、3、4、5,並沒有什麽原則上的區別。按上邊 的對應,如一開始就把cab寫成312,用一樣的讀音,又有什麽不可以?漢語就不同了,是二維的(紙麵上的最大維數),最大限度地利用了紙麵的幾何空間。 每個漢字就是一幅畫。試問從一幅畫上得到的信息快,還是從一行密碼中得到的信息快?

國家漢字的掃盲標準是1500個字,理工科的大學生一般掌握2000個漢字。就憑這2000個字,大家可以讀書、看報、搞科研。
=====================
現代漢語常用字2500字。這些字學起來還是很費勁的。同時,漢語還有詞的概念。給初中文化水平編的「現代漢語小辭典」收單字與詞語就有三萬來條。

常用字:
  1. 17畫: 戴擦鞠藏霜霞瞧蹈螺穗繁辮贏糟糠燥臂翼驟
    18畫: 鞭覆蹦鐮翻鷹
    19畫: 警攀蹲顫瓣爆疆
    20畫: 壤耀躁嚼嚷籍魔灌

    =====================

可在英文世界裏,沒有 20000個字別想讀報,沒有30000個字別想把周刊讀順,大學畢業10年後的職業人士一般都懂80000字。新事物的湧現,總伴隨者英文新詞,例如火 箭(ROCKET),計算機(COMPUTER)等,可漢語則無須,不就是用“火”驅動的“箭”麽,會“計算”的“機”麽!可英文就不能這麽幹,不能靠組詞,原因是“太長”了。如火箭將成為“FIRE-RIVEN-ARROW”,計算機將成為“COMPUTAIONAL-MACHINE”等。人的視角有 限,太長的字會降低文章的可讀性與讀者的理解能力。

====================
作者的資料很有問題。請看:
The Receptive Vocabulary Size of Adult Native English Speakers Researchers are beginning to reach a consensus regarding the average receptive vocabulary size of native English speakers. A fairly recent study by Zechmeister, Chronis, Cull, D'Anna and Healy (1995) indicates that the receptive size of a college-educated native English speaker is about 17,000 word families, about 40% more than first year college students, who know about 12,000 word families. A word family consists of a base word and its inflected forms and derivations (Nation, 2001, p. 8).
(source: http://iteslj.org/Articles/Cervatiuc-VocabularyAcquisition.html)

=====================

目前,英文詞匯已突破40萬,預計下世紀中葉,將突破100萬大關。而漢語則相對穩定,現在中學生還可以琅琅上口地讀屈原的楚詞。英文就難了,太不穩定。 現在的人們讀沙士比亞的原著已困難重重,更不用說讀400年前英國詩人喬叟的詩了。學GRE的時候,注意到很多韋氏字典收錄的詞匯竟是本世紀初的新詞,如 “Gargantuan”取自拉伯雷的小說。這也不奇怪,畢竟英文400年前才統一了拚寫。(作者顯然忘了漢語簡體字是最近幾十年的事情。
=====================
The Second Edition of the 20-volume  Oxford English Dictionary contains full entries for 171,476 words in current use, and 47,156 obsolete words. To this may be added around 9,500 derivative words included as subentries. (http://oxforddictionaries.com/us/words/how-many-words-are-there-in-the-english-language)

《大辭
海》是中國一部大型綜合性辭典,它既收單字和普通詞語,又收各類專科詞語。全書收詞約25萬條,共約5000萬字。(百度百科)
=====================

為漢語辯護!呼籲那些糟蹋漢語的人注意以下事實:

(1)聯合國5種文字的官方文件中最薄一本一定是漢語;(誰說的?)
(2)漢語的精確性已為蓬勃發展的中國科技事業所證實;(美國的科技事業更加發達又說明了什麽?)
(3)計算機語音輸入最具有希望的是漢語;(喬布斯笑了。)
(4)漢語是穩定的是收斂的,英文是不穩定的是發散的;(什麽是收斂的語言?)
(5)漢語是二維信息是生動的高效的,英文是一維信息是密碼型的是枯燥低效的。(生動是真,高效沒看出。)
(6)在英文世界裏能讀文學名著是一件了不起的事,不是所有受過大學教育的人都能幹的。如閱讀用英文描述的非州的一些植物真是艱澀無比,一般英美人也隻能囫圇吞棗而已;可在中文世界裏,又有誰會對僅有中學學曆的人讀完四大名著而感到驚奇?美國的高中生讀多少名著作者知道嗎?
(7)當今雖是英語文明的蓬勃期。但在曆史的長河中,英文世界的文明史遠比漢語世界的文明史短。

為漢語驕傲!(漢語當然是博大精深。但是因為漢語是自己的語言就貶低別的語言,就是沙文主義傾向了。)

更為堅信漢語時代即將到來的中國人的熱情與信心而歡呼!(有點自高自大。咱中華文化,講的是謙虛。)

這篇文章的主要內容是:

(1)漢字的發音種類多(因為有四聲),所以表達的信息量多。這是不對的。同一篇中文文章,不管是廣東人還是北京人讀,它表達的意思是相同的。盡管廣東話有9個聲調,北京話隻有4個聲調。

(2)漢語是單音節字,英語是多音節詞,所以英語人士的思維速度比漢語人士慢(並舉出背誦乘法口訣的例子)。 這裏的錯誤是誤將表達當作思維過程中決定速度的一步。

(3)按照信息論,漢字的信息熵比其他語言大,所以漢字的信息量大。這是對信息熵的誤解。信息熵與語言的信息量無關,而僅僅表明對語言編碼時要處理的字符數多少。

(4)漢字的常用字少,英語的常用字多,所以英語難學。作者引用的資料有錯誤。英語的常用字並不比漢語多。而且漢語比英語難學是舉世公認的。至少中文的常用字比英文的常用字難學多了。

語言的形成與發展有它的曆史與人文淵源。對每一個民族來說自己的語言都是美麗的。一種語言在國際上應用的廣泛程度由很多因素決定,其中母國的政治經濟科技文化影響力是重要因素。同時語言學習的難易程度也很重要。對於漢語來說,中國在國際上的影響力與日俱增有益於漢語的推廣,但漢語難學製約了漢語的廣泛使用。
[ 打印 ]
閱讀 ()評論 (15)
評論
白熊from北京 回複 悄悄話 漢語和英語隻能夠共存,誰也不可能替代了誰。他們的共存好比一塊磁鐵的兩個磁極,你能說N極將要取代S極嗎? 又好比,哲學裏的形而上學和辯證法,你能說辯證法能代替形而上學嗎?那是文革中的極端,他們隻是不同的方法,沒有好壞之分。形而上學的方法把一個運動的物體的運動軌跡,在某個瞬間,看做是不動的,所以才能給他坐標值 (X,Y,Z),X,Y,Z的值在變;就是形而上地看它。而此刻用辯證法隻看他,它總在變,沒法描述它,這是辯證法就不適用了。看似是定量的問題,你不定量,這麽定性?東西方文化也有個定量的問題。所以,在任何大的問題上,不要不是黑就是白,不要搞東風壓倒西風。中國人中的某些人在昨天還狂自菲薄,認為自己的文化事事,處處不如人,言比稱希臘呢!怎麽忽然又驕傲自大,認為老子天下第一了呢?
湘西山民 回複 悄悄話 回複沈成涵的評論:
圍棋和象棋的區別,並不體現漢語和英語的區別。
中國象棋也是漢語文化的產物。它就沒有圍棋複雜。
計算機也是英語文化的產物,算盤也是漢語文化的產物。
沈成涵 回複 悄悄話 對了,日本和韓國過去都是學漢語寫漢字的。
沈成涵 回複 悄悄話 回複湘西山民的評論:
圍棋是漢語文化的產物,與漢語一樣是二維、平麵、抽象的。國際象棋的邏輯性與字母文化一樣是一元、線性的,計算機現行的運算邏輯方式也是以英語為基礎的,也是線性的。
二元、平麵的思維方式決定了其雖然會表意抽象,但是包含的內容卻更豐富。所以一個圍棋選手的智商可能比國際象棋選手的智商會低,但是能贏國際象棋的計算機卻不能贏圍棋。因為用線性邏輯來處理抽象的二元邏輯太難了。
再有,你所謂投入不足也是不對的。日本既是圍棋大國,又是計算機軟硬件大國,一直也在搞,也沒有搞出來,在台灣應氏基金會表示為設計出能擊敗圍棋冠軍選手的計算機程序者獎勵140萬美元的激勵下,設計人員不斷推出水平越來越高的會下圍棋的計算機。但迄今為止,那些在國際競賽中脫穎而出的計算機程序給人的印象是甚至敵不過剛學一年圍棋的業餘棋手。
附下:
美國天體物理學家、圍棋愛好者皮特·哈特說:“計算機圍棋程序擊敗人類選手可能至少需要100年時間。如果一位智力正常的人學習下圍棋,用不了幾個月就可以擊敗現在所有的計算機程序。”在世界冠軍級別的國際象棋比賽中,多損失一兵一卒甚至就決定了最後結果,其判斷準確率可能高達99%。但在下圍棋時,經常會聽到棄子爭先的說法,鹿死誰手還遠未可知。若是從計算機角度來看,國際象棋與圍棋間的差別似乎就沒有那麽深奧了。下國際象棋時,對局者每次需要考慮的著法平均隻有35步。在計算機術語中,一步棋及應對著法統稱為“回合”。速度最快的計算機國際象棋程序能預先分析7至8個回合的著法。分析7步棋就要甄別超過天文數字般的變化。如果計算機想多分析幾個回合,需要甄別的變化就會呈爆炸性膨脹。多分析一個回合,棋著的變化會急劇增加――國際象棋增加18億個變化,圍棋增加64萬億個變化。對圍棋而言,分析7個回合的著法,計算機需要甄別200的14次方個變化。雖然精簡技術可將變化減少到1000億億個,但運算速度像“深藍”一樣快的計算機(每秒計算2億步)也需要1年半時間才能想好一步圍棋。更糟的是,計算機在圍棋領域與人較量顯然失去了其固有的優勢。與國際象棋不同,圍棋棋子之間沒有級別之分,棋手憑棋形判斷形勢,而計算機程序算法卻很難表達棋形。有的棋形最初是厚勢,但也許要不了一會就變成了可以舍棄的孤棋,如何告訴計算機這是厚勢,這是孤棋?
高粱燒 回複 悄悄話 回複湘西山民的評論:
韓語其實就是變相的一種漢語拚音而已,往往詞不達意!
湘西山民 回複 悄悄話 回複沈成涵的評論:那就是為什麽超級計算機早就能打敗國際象棋冠軍卡斯帕羅夫,卻至今不能擊敗低段位的職業圍棋選手?
*****
很簡單,這方麵沒有與國際象棋研究等同的投入。大家知道做比較的前提是 everything else being equal.
另外,注意一下話題是討論“漢語是二維信息是生動的高效的”,不是討論象棋和圍棋。圍棋與漢語有什麽關係?日本韓國不也下圍棋嗎?韓國語不也是拚音文字嗎?
湘西山民 回複 悄悄話 回複煥華的評論:
你的博客很有意思。以後慢慢看。
不否認漢語的博大精深。但是文中的所謂論據,太不靠譜了。
並且動不動就要淘汰別的語言。也太幼稚了。
語言與文化曆史文學相連,曆史上還沒有哪個國家的人民放棄本國語言而采用所謂更加優越的外國語言。
湘西山民 回複 悄悄話 回複沈成涵的評論:那就是為什麽超級計算機早就能打敗國際象棋冠軍卡斯帕羅夫,卻至今不能擊敗低段位的職業圍棋選手?
*****
很簡單,這方麵沒有足夠的研究與投入。大家知道做比較的前提是 everything else being equal.
煥華 回複 悄悄話 http://blog.wenxuecity.com/myindex/50913/
沈成涵 回複 悄悄話 --漢語是二維信息是生動的高效的,英文是一維信息是密碼型的是枯燥低效的。(生動是真,高效沒看出。)

----你沒看出來,我來告訴你。那就是為什麽超級計算機早就能打敗國際象棋冠軍卡斯帕羅夫,卻至今不能擊敗低段位的職業圍棋選手?是圍棋選手的腦細胞和智商都高於國際象棋選手嗎?
laoxiangxyz1 回複 悄悄話 在英文世界裏能讀文學名著是一件了不起的事,不是所有受過大學教育的人都能幹的。如閱讀用英文描述的非州的一些植物真是艱澀無比,一般英美人也隻能囫圇吞棗而已;可在中文世界裏,又有誰會對僅有中學學曆的人讀完四大名著而感到驚奇?

(美國的高中生讀多少名著這位同學知道嗎?)我想原文作者是個研究漢語的專家,但對英文一竅不通,想當然的瞎評。
登錄後才可評論.