正文

世界上的語言 zt

(2011-02-22 19:54:04) 下一個
發信人: xt01@ncicbbs (塗澤東), 信區: LanguageLogic
標 題: 世界上的語言
發信站: 國家智能機中心曙光站 (Tue Oct 8 22:11:58 1996)
轉信站: ncicbbs (local)

              《世界上的語言》


●引言

最近一些朋友的貼子談及語言問題——這的確是個有趣的話題:

·“台灣話”與“大陸話”究竟是一種語言還是兩種?
·朝鮮語或日語和漢語有什麽關係?
·印度人按“種族三分法”與歐洲人有某種親緣關係,那麽他們的語言之間是
 否也有親緣關係?
·伊朗和伊拉克“五百年前是一家”嗎?

總的來說,語言學能夠指出兩種語言有多麽相似,但是認定是否同種語言的問
題,更多地是依賴於國家、民族、政治、曆史等多種因素。比如克羅地亞語
(Croatian)和塞爾維亞語(Serbian)其實完全是一種語言
(統稱塞爾維亞-克羅地亞語,Serbo-Croatian),隻是前者
采用了羅馬字母,而後者采用的是西裏爾字母(Cyrillic,就是俄語
所用的字母),這與兩個民族的曆史文化有關。與此類似,捷克語和斯洛伐克
語之間可以毫不費力地聽懂對方,就象兩種方言一樣,但是人們傳統上還是把
它們看作兩種不同的語言。

一種語言可以由兩種書寫符號(字母)表示,同樣地兩種語言也可以共用一套
書寫符號。如藏語,就是由於公元七世紀一個西藏喇嘛到克什米爾進修後引入
了梵語字母(Sanskrit,即印地語的前身)這使它們看上去有些相似,
然而這兩種語言之間毫無聯係:藏語屬於漢藏語係而印地語屬於印歐語係。

我們熟悉的漢語、日語和朝鮮語,由於後兩者在中世紀時大量借用了漢字,人
們一直懷疑它們之間有某種聯係,然而至今為止尚未發現任何令人信服的證據
證明它們之間有聯係,實際上日語和朝鮮語與當今世界上任何已知的語言,無
論是“活著的”還是“死了的”語言,都沒有發現任何肯定的聯係。

●第二節

在研究了世界上一些主要語言以後,語言學家也象生物學家那樣,把世界上的
語言按相似程度分為語係、語族、語支和語種。世界上主要的大語係有:

語係          代表語種          占世界總人口比例(約)

印-歐       英語、法語、俄語、印地語、波斯語    48%
漢-藏       漢語、藏語、泰語、緬甸語        24%
尼日爾-剛果    斯瓦希裏語 
亞-非       阿拉伯語、希伯來語            5%
馬來亞-玻利尼西亞 印度尼西亞語、馬來西亞語         5%
德拉維達      泰米爾語                 3%
阿爾泰       土爾其語、蒙古語、哈薩克語        2%

除了上麵這些“可以歸類的”語言以外,還有幾種所謂的“獨立語言”:
日語(2%),朝鮮語(1%)和越南語(1%)。這些獨立語言與所有現存
的語言沒有明顯的聯係,這當然也和它們研究得不夠有一定關係。比如日語與
朝鮮語可能有一些關係。具有諷刺意味的是,盡管它們都不同程度地采用了漢
字作為書寫語言的一部分,它們與漢語都沒有聯係。

當然談到“世界的語言”,還應當包括幾種“人造語言”,如世界語——
Esperanto。盡管還沒有人以它們作母語。

印歐語係是世界上最大的語係,覆蓋了幾乎所有的歐洲、美洲,和亞洲、澳洲
的很大一部分。它包括兩種偉大的古典語言:古希臘語和拉丁語;包括象英語
德語,菏蘭語(在比利時也叫佛蘭芒語,Flemish)和瑞典語一類的日
耳曼語族;包括象法語,意大利語和西班牙語一類的羅曼語族;包括象俄語,
波蘭語,捷克語和塞爾維亞-克羅地亞語一類的斯拉夫語族;包括象威爾士語
和蓋爾語(Gaelic,在蘇格蘭和愛爾蘭)這樣的塞爾特(Celtic)
語族;包括巴爾的(Baltic)諸語言;包括伊朗的國語波斯語;包括諸
如印地語、孟加拉語一類的印地語言;等等。

接下來我們可能會問:原始的印歐人生活在什麽年代?是從何處“發跡”的?
現在找不到原始印歐人留下的任何“書麵材料”,因為人類使用語言的曆史遠
比使用文字的曆史久遠。所以,最好的辦法就是分析他們的語言。我們可以假
定如果一個詞在大多數印歐語言中都很相似,那就是一個他們已有的概念;反
之就可以認為那是一個後來才知道的概念:這就是語言學重現“化石語言”所
用的方法。

通過重建古代印歐人的語言,我們大約可以了解到:原始的印歐人生活在寒冷
的北方森林中一個不靠近水的地方,他們飼養的家畜有馬,牛,羊和狗,他們
知道的野生動物有狼和熊,他們知道的金屬可能隻有銅。許多人認為馬和戰車
使他們在征戰中能取得很大優勢從而擴展到後來的遼闊地域。    (玩過
civilization的朋友們知道horse和chariot在古代
戰爭中的作用:-)

一般認為原始印歐文明起自於公元前三千年,也就是五千年以前的東歐某地,
大約在公元前二千五百年它分裂了,人們離開故鄉分好幾路向四麵八方遷移。
其中一路到了希臘,另一路到了意大利(這兩路分別是古希臘和古羅馬文化的
起源)。另一路穿過中歐一直到達不列顛諸島(他們是蘇格蘭□A□□□既撕□威爾士人的祖先)。還有一路北上到了俄國,同時又有一路跨過伊朗,阿富汗
最終到了印度。他們每到一處,就征服或同化當地的土著,把自己的語言傳播
到那裏。應該說他們是一個出色的民族。

●第三節

許多語言可能是從一個祖先那兒演變出來的,這想法最早是在1786年提出
來的,盡管早在十六世紀有人就注意到了梵語和意大利語之間的相似性。到了
1818年,有五十多種語言歸到了印歐語係中,然後在1854年,人們把
獨特的阿爾巴尼亞語也歸了進來,1875年又加上了亞美尼亞語。如今在歐
洲,隻有芬蘭語、匈牙利語、土耳其語、巴斯克語(在西班牙和法國交界處)
和前蘇聯境內的幾種語言不屬於印歐語係。

在亞洲,印歐語言出現在伊朗、阿富汗、巴基斯坦、印度和孟加拉等國家。□
得注意的是,雖然在印度,印地語(Hindi)是最大的語言,但是操非印
地語的當地原住民勢力也很強大。印度有一百五十多種語言,但講任何一種語
言的人都不超過百分之三十。所以它在1947年獨立時不得不同時采用印地
語和英語作為官方語言——一半以上的印度人根本就不懂印地語嘛。在大約公
元前一千年印歐人入侵以前,當地原住民所操的德拉維達語係(如泰米爾語)
和蒙達語係,如今在印度中、南部人口中仍占很大的比例。在巴基斯坦和孟加
拉國大部分人講印歐語言。他們都能在一定程度上聽懂印地語,但互相之間卻
很難聽懂。一個學法律的孟加拉朋友告訴我,他認為二十年前巴、孟分裂成兩
國,除了地理上的隔閡外,語言上的隔閡也是一個重要因素。

印歐語言之間究竟有多象?印歐語言與非印歐語言的差別有多大?看看幾個
“基本詞匯”之間的比較:

英語 month mother new nose three
威爾士語 mis mam newydd nos tri
德語 Monat Mutter neu Nase drei
瑞典語 ma^nad moder ny nasa tre
法語 mois me`re nouveau nez trois
西班牙語 mes madre nuevo nariz tres
意大利語 mese madre nuovo notte tre
俄語 mesyats mat\' novy nos tri
希臘語 men meter neos rhis treis
_ _
波斯語 mah madar nau bini se
_ _
梵語 mas matar nava nas trayas
芬蘭語 kuukausi aiti uusi nena kolme
匈牙利語 ho\'nap anya u\'j orr ha\'rom
土耳其語 ay anne yeni burun uc,

(記得去年網上有不少人與鍾先生爭論說世界語(Esperanto)不是
世界語而僅僅是歐洲語言的代表,我們也可以看看它與印歐語言的聯係究竟有
多強。∶-)

●第四節

英語,作為當今世界事實上的國際社交語言,它取得的成功是史無前例的。從
使用它的人口來說,以英語為母語的人數僅次於漢語而居世界第二位,大約有
四億多人。然而以英語作為第二語言、或者在一定程度上使用英語的人數,要
遠比這多得多,可以說分布在世界的各個角落、各個民族,在這一點上漢語是
望塵莫及的。它是怎樣發展起來的?

英倫三島的第一批印歐居民是塞爾特人。原先島上可能還有更早的居民,但是
人煙稀少,所以沒有留下多少遺跡。前文提到,塞爾特人是古印歐人的一支,
大約在四千五百年前離開他們在東歐的故鄉向西遷移,在公元前一千年時(相
當於我國商朝末年、西周初年),他們成了德國南部、阿爾卑斯山北麓的一個
強大民族。在公元前五百年左右(相當於我國春秋時期),他們開始向西遷移,
後來到了英倫諸島。這就是印歐人的第一次“入侵”。

印歐人的第二次入侵是在公元五世紀中葉,當時生活在現在的德國和丹麥交界
處有兩個部落,一個是石勒蘇益格(Schleswig)的盎格魯
(Angles),另一個是霍爾施坦因(Holstein)的薩克森
(Saxon)。石勒蘇益格/霍爾施坦因現在是德國最北麵的兩個□陛撕□
一次世界大戰時德國從丹麥那裏“取得”的。這兩個部落從那裏跨過北海,占
據了英格蘭,原來的塞爾特人很快地後退到威爾士、愛爾蘭和蘇格蘭高地。
English一詞就出自Angles,原意為“角落”,意即他們來自歐
洲大陸的一角。在古英語中Angle寫作Engle,他們的語言叫做
Englisc(在古英語中“sc”讀如“sh”,如“sceap”——
“sheep”)。順便說一句,“塞爾特”(Celt)中的c可以讀如s
或k,所以也叫“凱爾特”,美國人中有許多來自蘇格蘭和愛爾蘭,所謂的
“美國腔”可能是凱爾特口音。波士頓不是有個著名的球隊叫“凱爾特人隊”
嘛。

古英語一直發展到公元1066年法國的諾曼人入侵。在此以前,由於受北歐
人和羅馬人的影響,許多斯堪地那維亞詞匯和拉丁詞匯溶了進來。前者如
egg,cake,skin,leg,window,husband,
sky,fellow,skill,anger,flat,ugly,
odd,get,give,take,raise,call,die,
they,their,them;後者如street,kitchen,
kettle,cup,cheese,wine。塞爾特語的遺跡大多留在
地名中,如Thames,Kent,Dover。

諾曼人的入侵為英語帶來了大量的法語詞匯,這使得現代英語中存現大量的同
義/近義詞:shut/close,answer/reply,smell
/odor,yearly/annual,ask/demand,
room/chamber,wish/desire,might/power
(英語詞/法語詞)。有一個有趣的現象是產肉的動物多是英語詞,如ox,
cow,calf,sheep,swine,deer,而它們的肉則是法
語詞,如beef,veal,mutton,pork,bacon,
venison。大概持法語的多為貴族統治者,隻注意他們餐桌上的肉,並
不在意生畜們叫什麽。

另外在已有的英語/斯堪地那維亞語同義詞基礎上,如英語的wrath和斯
堪地那維亞語的anger之外,法語又加了個ire。連我們漢語也貢獻了
幾個詞:kowtow(叩頭),typhoon(台風),sampan
(舢板),kaolin(高嶺土),tea(閩方言),shanghai
(不是地名∶-)。

這些外來語使英語成為一個表達力豐富的語言。盡管溶入了如此眾多的“外來
語”,古英語仍然構成了它的核心——不到五千的古英語單詞一直保持到了今
天。在此期間英語逐漸向高層發展,1399年繼承王位的亨利四世是第一個
以英語為母語的英國國王。在十四世紀快要結束的時候,喬叟(Chaucer)
完成了『坎特伯雷的傳說』(Canterbury Tales),以倫敦
方言為代表的現代英語終於開始出現:一個來自當年“角落”的語言。

●第五節

在結束討論印歐語言時,再順便舉個例子說明語言學研究對於其它學科的幫助,
如史學和民族學。歐洲有個民族叫吉卜賽,他們是什麽人?從哪兒來?這問題
長期沒有答案,好象他們自己也說不清楚,因為直到不久前他們中的大多數還
是文盲,沒有文字記載的曆史。以前有人根據英語“吉卜賽”(Gypsy)
一詞認為他們來自埃及(Egypt)。後來通過對他們語言的仔細研究發現
他們來自印度——從他們的語言(叫做Romany)與梵語及後來的印地語
的共同特征中得不出任何別的結論。吉卜賽人從公元(後)一千年左右開始向
西遷移,途經的波斯、亞美尼亞和希臘都在他們的語言中留下了不同時期的痕
跡。現在聽到一些老美愛說“pal”,這詞就來自吉卜賽語phral,意
為“兄弟”。

好,終於輪到漢-藏語係的故事了。漢藏語係裏有一個“大家夥”,不用猜就
知道。它占漢藏語係總人口的85%以上。不過,對於非印歐語言的語言學研
究都不如印歐語係那樣深入,它的起源、發展、演變等都有許多問題有待解決。
有一個笑話說,從前有個人認字隻看個大概,一次有個不識字的問他路邊一家
鋪子叫什麽字號,那店鋪上書:“天義齋”(用大五碼看)。他看了一眼說:
“叫‘大蓋齊’”。咱現在也隻能來他個“大概齊”了……。

漢藏語係分四個語族:漢語自成一家;藏-緬語族,包括藏語和緬甸語這兩大
語種,以及彝{戚憚□戮□插戚舄j□捌摹□□壬習俑魴∮鎦鄭惶□□嫌鎰澹□包括泰語和老撾語這兩個國語,以及壯、布依、侗等幾個小語種(壯語不應算
小語種!有一千多萬人講壯語,比一些小的語係還大,他們不是還有自己的自
治區嘛);還有一個苗-瑤語族,由苗語和瑤語組成。另外,不少人認為越南
語與漢語有遠親關係,事實上越南語有一半的詞來源於漢語,但是它們的關係
仍有待進一步研究。

講漢藏語言的人除了在中國以外,還分布在緬甸、印度、尼泊爾、泰國、老撾
等國,以及在東南亞和世界各地的華人中。總之,持漢藏語言的各民族中,漢
族生活在最北麵。

●第六節

漢語是論人口世界上最大的語言,有差不多十二億人以漢語為母語:這包括在
台灣的二千萬、馬來西亞的五百萬、泰國的五百萬、香港的五百萬、新加坡的
二百萬、印度尼西亞的一百萬、越南的一百萬等。漢語是聯合國1945年成
立時的五種工作語言之一(1974年又加上了阿拉伯語)。

漢語有七種主要的方言:北方方言約占總人口的四分之三,所覆蓋的地域包括
中國的東北、華北、西北、山東、河南、湖北和安徽、江蘇的長江以北部分、
四川、雲南和貴州的漢族人聚居區,在另外還有一些北方方言的“孤島”在福
建、廣西和海南;吳方言,通行於江蘇的長江以南部分、浙江和上海市,人口
有七千萬,是第二大方言;粵方言,主要流行於廣東、廣西和海外華人中間,
約有六千萬人;閩方言,通行於福建、台灣和東南亞諸國,約有六千萬人,其
中情形十分複雜,到了互不通行的程度,可能是漢人在秦漢時代南侵時與當地
的語言交互的結果;湘方言通行於湖南;贛方言通行於江西,這兩種方言的特
征不太突出,受周圍方言的影響較大;還有客家話,主要分布於廣東、廣西、
福建和台灣。這些“方言”之間差別常常是很大——比如北京人聽廣州人講話,
決不比英國人聽法國人講話輕鬆,台灣人去聽陝西話,也會聽得一頭霧水。是
什麽理由語言學仍把這些方言統統歸為一種語言?除了長期以來的統一民族、
統一文化和統一國家這些因素以外,還有一個重要的原因是文字——漢字。

從商朝的甲古文開始,漢字有三千多年的連續曆史,三千多年來漢字的字形、
字義的變化都是連續的。與大多數其它語言不同的是,漢字的發展經曆的是一
條象形——表意的途徑。這條道路產生了兩個主要效應:第一,隨著文明的不
斷發展,語言所要表達的概念不斷增加,使得漢字擁有了一個數量龐大的字符
集(雖然現代漢語已經不用增加字符來表達新的概念,而是創造新詞,這在一
定程度上減少了使用的字數)。漢字的龐大的字符集使它顯得非常複雜:難學、
難記、難用;第二,漢字作為表意文字(ideograph),文字與語音
沒有直接關係,無論用哪種語言或方言去讀,意義沒有變化。這是幾千年來各
種口語分化交熔變遷,而漢字一直作為一種統一的文字被所有人認同的原因。
這一優勢甚至體現在當它被別的語言借用的時候:哪怕不懂日語的人也能讀懂
一半意思吧。漢字使操不同口語的人互相交流成為可能,而隔膜是統一的主要
障礙。

當然,從嚴格義意上說,漢字已不是純粹的表意文字,許慎『說文解字』中的
9353字裏麵,“形聲字”占了80%以上,“會意字”不到20%,而甲
骨文中形聲字僅占20%多。特別是近年來多音詞的比例急劇上升,漢字已向
表音文字方向發展。(關於“形聲字”、“會意字”,後麵還要提到)
現代漢語的文字仍有幾萬字之多,但是使用頻率極不平衡。據北京語言學院
1985年的統計結果,最常出現的前十個字及其出現頻率為:

的   4.16%    (你每說二十五個字就要說一個!)
一   1.84%
了   1.71%
是   1.52%
不   1.37%
我   1.28%
在   1.08%
有   0.98%
人   0.97%
這   0.93%

累計 15.85%

前100字的累計字頻已達47.34%,500字到了79.76%,
2000字覆蓋了98.07%,如果你認識4000字(就象我一樣),你
讀一萬個字隻有四個不認得(當然讀我寫的東西再多你也不會有不認得的字,
因為我認的字和你一樣多)。
語言學院還統計了詞:共計出31159個不同的詞,其中單音節詞(一個字
的)占12.2%,雙音節詞73.6%,三音節詞7.6%,四音節詞6.4%
五以上的占0.2%,平均詞長2.09。前100詞的累計頻率為41.7%,
2000詞為82.2%,9000詞為95.85%。不同漢字的構詞能力
(與別的字組成新詞的能力)也不一樣,最多的是“子”字,構詞668個。

●第七節

漢字是怎樣起源、怎樣演變的?據漢代緯書『春秋元命苞』:“倉頡生而能書,
及受河圖錄字,於是窮天地之變,仰視奎星圜曲之勢,俯察魚文鳥語,山川指
掌,而創文字。”文字雖美,實無所據。傳說倉頡為黃帝的史官,而黃帝的生
存年代及其事跡都屬傳說史的範圍,具體內容多不可究,“倉頡造字”實在太
玄了。又『易經』雲:“上古結繩而治,後世聖卜易之以書契。”,意思是說
從前的人結繩記事,後來有“聖人”把這改造成了文字。繩結與文字差距甚大,
不以為然也。

後世的漢文字學家一般持兩種看法:起源於原始氏族社會晚期的陶器符號,或
起源於原始圖畫。得到考古支持的商代甲骨文最早出現在三千三百年前,這比
古埃及的文字及兩河流域的蘇美爾文字都要晚近二千年,漢字學家因而不服,
他們認為最早的甲骨文被發現時已有了一定程度的會意和形聲成分,所以文字
的出現應當比那時早得多(範文瀾:『中國通史』,人民出版社1954),
因而推斷說例如山東龍山文化中的陶器符號可能是原始的文字(龍山文化據今

四至五千年)。這些目前仍缺少考古證據和足夠的研究。順便提一句,至今共
發現了五千個以上的甲骨文單字,其中可以認識的約有一千七百字。

總之不管從哪兒來、來了多久,從“帝盤庚遷殷”(約在公元前1312年)
時開始,漢字開始了它的長達三千多年的連續發展史,中華文明史也開始了連
續至今的文字記載。可以想象,一開始的象形文字(hieroglyphs)
工作得不錯。可是隨著漢語的不斷豐富,有些語言不能用形象表達了,怎麽辦?
古埃及人和蘇美爾人開始創造一些僅代表發音的符號來記錄這些語言;瑪雅人
(美洲印第安人)開始借用那些畫得出來的同音字來表達它們(例如,借用畫
得出來的“eye”來表示畫不出來的“I”,漢語中叫“通假字”);而中
國人則想出了一種叫做“形聲字”的“中庸之道”:用兩部分拚成一個字,一
半表示發音一半表示意思(屬性),象“中-盅-忠-鍾-種-腫,羊-洋-
癢-樣”之類。這真是一個好辦法:既能表達大量的新概念又與舊的文字體潔
“兼容”,於是大喜,到秦篆時形聲字大增,漢字總數已數萬,每當出現一種
新概念我就發明一個新字來對付你,一字一意,文章簡短,節約用紙。漢字的
表達能力大大增加,形成了一個完備的文字體係。春秋戰國時期的文化大發展
與此不無關係。

原來我們從小學習表意文字,覺得從象形文字演變到現在的漢字非常自然,覺
得從象形文字演變到拚音文字很不可思議:現在看來後者比前者好象更自然一
點。拚音文字的演變想在討論中、近東語言的時候再提。
作為語言發展曆史的一部分,會意字、表音字和通假字也不同程度地存在於漢
語中。會意字如“日+月=明,女+子=好”,這類字是在原始象形文字基礎
上意義的擴展,但是因為表達能力仍受限製,所以它們占的比例也不太大。通
假字在古漢語中出現得比現代漢語多得多(如“說-悅”),說明當時人們也
想從這方麵想辦法,後來認識到這不現實。試想,如果所有的抽象概念都用□
音異字表示,那文章讀起來大概是太累了,而且多半讀不懂。事實上沒有一種
文字能純粹用這辦法解決問題,最多是部分地采用這技術,多了就不靈了。漢
字也有少量的表音字,如“阿”,沒有任何意義,隻表示一個音節。由於形聲
字的發展超前(不知為什麽),又具有很好的表達能力,表音文字終於未能在
中國發展起來。

●第八節

在結束漢-藏語言的討論前,再看一眼我們的鄰居們。在中國境內的語言是多
種多樣的,北方的語言多屬阿爾泰語係,有屬阿爾泰語係突厥語族的維吾爾語、
哈薩克語、烏孜別克語、柯爾克孜語、塔塔爾語(韃靼語)、撒拉語(青海境
內的撒拉族);阿爾泰語係通古斯語族的滿語、錫伯語、鄂溫克語和鄂倫春語;
阿爾泰語係蒙古語族的蒙古語、達斡爾語、東鄉語和土語(青海土族的語言);
還有印歐語係的俄語和伊朗語族的塔吉克語等等。南方的語言多屬漢藏語係,
除了上文提到的漢-藏語係諸語言外,尚有屬南亞語係孟-高棉語族的佤語和
德昂語、布朗語,以及屬南亞語係印度尼西亞語族的高山語(台灣高山族)。

中國境內文字的種類同樣多種多樣。除了使用(或部分使用)漢字的語言以外,
還有許多使用羅馬拚音文字,如壯文。這其中又有不少是原本沒有文字的,
“新中國成立後,當地人民政府依照本民族人民的意願,為他們創造了以拚音
字母為基礎的文字。”還有使用梵語字母的如藏文,使用阿拉伯語字母的如維
吾爾文,使用“十三世紀維吾爾文”的蒙文、滿文、錫伯文(維吾爾人後來丟
了自己的文字用了阿拉伯文,嗚乎),有些民族使用自己的表意文字,如彝文。
還有用象形文字的納西文(可能現在已經不用了)。至今沒有自己文字的民族
都借用了就近的大語種文字。

朝鮮族用的朝鮮文是維一東方自己發明的“純粹”拚音字母。說它是“純粹”,
因為它有表達元音和輔音的完整音素集合。音素(phone)是人能分辨的
最小語音單位。與此相對的是日語的假名,雖然也是拚音文字,但是每個假名
表達的是整個音節(syllable)而不是音素。朝鮮語在語法結構上最
象日語,但是它們的詞匯並不相似,所以它們的關係仍有待於進一步研究。另
一方麵,朝鮮語又從漢語借走好多詞匯,但在語法結構上又非常不一樣。有人
認為朝鮮最早的居民是一萬年以前從北方移入的通古斯人一部。朝鮮文字母發
明於十五世紀中葉(相當我國明朝前期),共有二十五個字母——字母在哪兒?
你要是仔細看就可以看出,雖然它們看上去象一個個的“方塊字”,但每個
“方塊字”其實是由一些更小的“小零件”組成,這每個“小零件”就是一
個字母,它們的種類是有限的,對嗎?他們的字母不象其它拚音文字那樣排成
一條線,而是上下左右錯落有致地拚在一個方塊內,非常別致。象“眼淚”這
個詞,它們讀作nunmul(nun意為“眼睛”,mul意為“水”),
寫成從左到右兩個“方塊字”:
n m
u u
n l


在亞洲的東南部,不是還有菲律賓、馬來西亞、印度尼西亞等國嗎,他們的語
言是什麽樣子的?

他們的語言屬於馬來亞-玻利尼西亞語係,又有人把這語係與孟-高棉語係
(主要是柬埔寨的高棉語)和印度南部的蒙達語係合稱“南亞語係”。這一係
語言橫跨了半個地球:東起夏威夷諸島,西達非洲東南的大島“馬達加斯加”
(Madagascar),包括了幾乎所有的印度洋和太平洋島嶼(包括密
克羅尼西亞、美拉尼西亞和玻利尼西亞諸島,但不包括巴布亞新幾內亞和澳洲)。
它包括四種國語:馬來西亞語、印度尼西亞語、他加祿語(菲律賓語)和馬拉
加斯語(馬達加斯加),總人數有二億多。關於他們的祖先,有人類學家認為
是生活在中國大陸東南沿海地區,在公元前二千紀至一千紀之間漢族人開始南
侵的同時,他們的航海技術也發展到了一定的水平,開始向海外移居(不知是
不是受到了漢族的壓力),台灣高山人可能就是他們的後裔。在其後的二千年
間,他們遍布了如此眾多的海島,占據了如此遼闊的海域,這應當算一大奇跡
——盡管他們自己可能倒沒意識到。有人說,是航海、貿易與殖民造就了今日
的資本主義,那他們的航海要比西方的“厲害”得多,也早得多,為什麽一點
兒也沒有“發達”的意思?

●第九節

澳大利亞和巴布亞新幾內亞的語言和上麵講到的馬來亞-玻利尼西亞語言又有
很大不同。

所謂澳大利亞語言,當然是指生活在那兒的土著居民,白種人們自然是講英語。
今天在澳大利亞的土著人隻剩下數萬人,可是他們仍在講數百種語言!對這些
語言的研究進行得很不充分,連它們是否屬於一個單一的語係也沒搞清楚。由
於澳大利亞自人類出現時就已經成為一塊獨立的陸地,所以,所謂的“當地土
著”,肯定也是什麽時候從其它地方遷來的。澳大利亞本地的哺乳動物都是非
常原始的有袋類,離進化到人類還差十萬八千裏。現代許多人類學家認為當地
人是新石器時代某個時候從馬來亞——印度尼西亞渡海而來,可這還沒有找到
足夠的語言學方麵的證據支持(其它方麵可能有證據,我不清楚)。今天,許
多當地的語言都麵臨絕滅,可憐它們作為曆史的遺跡隻在英語中留下了象
kangaroo,koala等少數幾個詞匯。

在巴布亞新幾內亞的情況與此相似:三百多萬人說著五、六百種語言,從這不
難想到,有些語言肯定隻有很少的人使用,有的可能隻有一個村子,甚至一個
家庭。鄰村的人可能互相都聽不懂,許多人尚生活在石器時代。所有這些給獨
立後的政府提出了很大的難題:不可能找到一種(甚至幾種)當地語言作為官

方語言來發號施令。所幸的是,在幾百年的殖民統治以後,當地土著居民發明
了一種叫“洋涇□英語”的交流工具,它取得了官方語言的地位。

“洋涇□”是俗稱,正式的稱呼是皮欽英語(Pidgin English)。
“洋涇□”一詞來自上海原來的一條河,就是現在的延安路。當時在上海英租
界也有自己的“洋涇□英語”,“假洋鬼子”們常說“let me see
see”(讓我看看)或“no can do”(不能做)這樣不倫不類的
話。所謂皮欽語言就是指一種外來語言被當地人大大地簡化了語法和詞匯以後
用作交流工具,這種現象在不少殖民地都有。巴布亞新幾內亞的皮欽英語約有
1500個詞和非常簡單的語法,這使它很容易學會。而且許多詞匯還是由一
些更基本的詞匯組成的複合詞,如“house cook”意為“廚房”,
“house sick”意為“醫院”,“house paper”意為
“辦公室”等等。另外“belong”變成了一個常用詞,僅表示“of”
的意思,如“glass belong look-look”意為“鏡子”,
“smoke belong ground”意為“灰塵”,“light
belong cloud”意為“閃電”,“man belong
long-way place”意為“外國人”……。但是,你可不要以為
憑自己的英語可以去那兒獨闖天下——他們不會聽懂你的英語,你也讀不懂他
們的“英語”,因為畢竟語法和詞匯都有許多變化。

亞洲的語言還有一個極重要的成員尚未提到,這就是所謂的“亞-非語係”,
傳統上叫做“閃米特-含米特語係”,簡稱“閃-含語係”。這名字取自聖經
中諾亞的兩個兒子,一個叫Shem,一個叫Ham。亞-非語言分布於北非、
東北非、近東、中東和中亞的廣闊地域,包括有二億多人口和幾十個國家。

然而,亞-非語言之所以重要,原因還不僅限於此。那裏不僅是世界上最古老
文明的發源地,起源於那裏的拚音文字,更是當今世界上大多數主要文字的鼻
祖。

●第十節

就象漢-藏語係中的漢語一樣,亞-非語言中的阿拉伯語人口也占了將近四分
之三。其它較重要的語種還有:以色列的國語希伯來語、索馬裏語、西非/尼
日利亞的主要語言豪薩語,以及非洲北部的一些其它語言。

阿拉伯語是將近二十個國家的國語,另外全世界的穆斯林都多少懂幾句阿拉伯
語,這使它在1974年成了聯合國的第六種工作語言。它的字母係統更是被
許多其它語係的語言所采用。它的文字保留了幾個古代拚音文字的特點:從右
到左的書寫,以及隻有輔音字母沒有元音字母。還有一個現象是一個字母在詞
中的位置不同,寫法也不一樣。如果你在用X窗口的電腦,可以試試看把編輯
器的字體設置成阿拉伯文的字母,再看看把同一個字母放在詞中間與放在詞尾,
形狀是否一樣。你不需要懂得阿拉伯語就能看得出來。

阿拉伯文共有二十八個字母,都表示輔音。由於它們都寫成草體連書,所以看
上去一串串的,好象看不出一個個獨立的字母。那元音呢?你可能還注意到在
這些彎彎曲曲的連續曲線的上下還有不少小點點和短線條什麽的,那就是元音!
不幸的是,他們阿拉伯人在書寫一般文字時,是省略掉這些元音的,隻有在小
學課本和給外國人看的讀物上才注上元音。舉個例子,要寫“solid”這
個詞,他們大概會寫作“dls”(別忘了是從右往左寫),那你就很難猜這
是個什麽詞了……

阿拉伯文的古老特點是與近、中東文字的起源、演變相聯係的。古埃及和“兩
河流域”是世界上最先出現文字的地方,也是拚音字母的發源地。

大約在五千五百年以前,埃及就出現了文字和書寫的紙草。約公元前3100
年上下埃及統一,統一後的埃及開始有文字記錄可考(這比我國開始有文字記
載早了一千七百年)。最早的文字是圖形文字,後來有些文字逐漸變成音節符
號和指意符號,其後又有了一音一符的字母,共二十四個。所有字母都隻標輔
音不標元音。各種符號組成詞組,共有六百多個詞組。經曆這些發展的古埃及
文字,是用字母、音符和詞組組成的一種複合文字。到第八王朝(大約在公元
前2200)時期出現了一種草書體,到中王朝(公元前2000-170ㄟ
年)時草書體已廣泛流行,隻有正式文體和銘刻才用象形體。

所謂紙草是下埃及產的一種植物,將其莖幹剖為長條後,彼此排齊連成片,然
後壓平曬幹成紙。這種紙草後來成為古代地中海地區一種通用的紙,希臘人、
羅馬人以及往後的阿拉伯人都曾用它書寫。(不過,這還不能算是“正式的紙”,
因為“正式的紙”必須等到三千年後由中國發明。:-)

早在五千五百年前差不多與埃及人同時,生活在幼發拉底河與底格裏斯河(希
臘人稱為Mesopotamia——美索不達米亞,意即“兩河之間的地方”)
的蘇美爾人(Sumerian)也有了自己的文字。他們最早的文字也是圖
形符號,一符一義。以後發展為表音符號和指意符號,一起組成詞組。自從有
了表音和指義符號,字符孳乳增繁的傾向減少,到了約四千三百年前,字符減
少到了六百以下,其中約有一百個是表示音節的符號,但是沒有單獨表示輔音
的符號。這種文字用削尖的蘆杆、骨棒等刻寫在泥版上,曬幹或烘幹後成為可
以長期保存的文書,有一些保存到了現在,並被釋讀成功。蘆杆刻成的筆劃,
起劃粗而深,收劃細而淺,形如楔形,因而得名“楔形文字”。

楔形文字後來成為近東各國外交的通用文字,一直到先進的腓尼基拚音文字的
“傳人”阿拉美文(Aramaic)流行以後才逐漸棄而不用。阿拉美文在
近東各國的通行到了公元七世紀阿拉伯的伊斯蘭文化興盛時,又讓位於阿拉伯
文,直到今日。

腓尼基拚音文字是怎樣發明的?腓尼基人在公元前1500年時居住在現在的
以色列、黎巴嫩一帶。當時埃及和兩河流域的文字早就有一部分發展為音節符
號,埃及文字還由此出現標示輔音的二十四個字母。但是兩種文字中都有好幾
百個字符,埃及文字還保持象形體,結構複雜,使用不便。地處使用這兩種文
字的人之間的腓尼基人受到它們的共同影響,取埃及文的輔音符號而擯棄其象

形體,發明出了二十二個輔音字母。從此文字不再為祭司所壟斷,從而避免了
瑪雅文化那樣的命運。

與此同時的希臘人,正彷徨於早期從埃及學來的象形-表音混合文字中,到了
公元前一千年時,腓尼基文字傳入希臘,他們馬上放棄了原有的文字,並且又
在此基礎上進一步發明了元音字母,世界上第一套完整的拚音文字終於誕生了。

腓尼基人的字母係統,是對人類文明的重大貢獻。

●第十一節

拚音文字的優點在於它的普及性。一般來講,學會二三十個字母,就能見字讀
音。文字越複雜,掌握的人就越少,這對於社會文明的進步非常不利。就文字
的複雜程度而言,以象形文字為最,其次為表意文字,形聲字又次之,拚音文
字最簡單。到了現在信息時代,拚音文字因其一維的表達方式又有了一個新的
優勢(至少目前如此,以後的變化未可知也)。

但同時,拚音文字也有一個大問題,就是許多拚音文字,由於千百年來口語的
不斷變化,它的書麵文字與讀音往往相去甚遠。拿法語來說,它的書麵語言表
達的還是四、五百年以前的發音,不發音的元音彼彼皆是,象hommes讀
為um,aiment讀為em。這就是為什麽上文說“一般來講”。
順便說一句,昨天鍾先生和今天“老楊”的貼子裏都講,文字改革,至少大方
向是對的,我有同樣的看法。在『世界的語言(10)』裏曾提到古埃及複雜
的象形文字隻被少數祭司所掌握,這局麵後來被新拚音文字的出現所打破。事
實上埃及也不可能一直封閉,因為周圍有許多差不多發達的國家,一旦落後就
會被征服。而地處中美洲的印地安人就沒那樣幸運,下麵我們就來看看。

現在一般都認定印地安人來自亞洲。大約在二萬五千年前有一些亞洲人就開始
跨過冰封的白令海峽,逐漸向美洲內地遷移。這似乎不是有目的的移居,所以
這過程緩慢得在一代人中間都看不出來。但是到了十六世紀西班牙人到達美洲
時,他們已經布滿了整個美洲大陸,從阿拉斯加到智利南端的合恩角。據估計
那時的人口在一千四百萬到四千萬之間,操一千七百多種語言,所處的社會形
態從狩獵和采集的石器時代到具有高度文明的阿茲台克(Aztec)、瑪雅
(Maya)和印加(Inca)國家都有。

由於人們認定印地安人來自亞洲,所以自然地把他們的語言和各種亞洲語言作
比較。比較的結果,不僅沒有找到確定的聯係,而且他們內部也不是完全彼此
相象的。這說明,第一,二萬多年的漫長時光對於語言的變化來說是太長了,
我們現在已知的這些語言之間的聯係都僅限於數千年的分離;第二,印地安人
不是在同一時刻一起來到美洲的,互相之間可能分屬不同的民族。

在印地安人中,瑪雅人的文字係統是最發達的,瑪雅人在公元最初的幾個世紀
中就發明了文字,符號與解釋符號的圖形並列,包括很多圖形,也有音標和音
節符號。這些圖形文字看上去極其複雜,好象是一幅幅精致繁複的裝飾圖案。
西班牙人征服瑪雅後,大部分文字記錄都被銷毀,隻有極少數保存到了今天。
這給釋讀造成很大困難。不過釋讀研究已在近年取得進展,隻可惜文字資料太
少,我們對於當時社會情形不能了解很多了。

在瑪雅,隻有祭司才識字(所以當他們被消滅幹淨以後就沒人能懂瑪雅文了!),
因此祭司們擁有極大的權力,這導致了瑪雅人登峰造極的拜神狂熱:修建巨大
的神殿和祭壇,頻繁而繁縟的祭奠儀式,征用大量的人力物力,甚至把最健壯
的人用作犧牲。結果,社會生產力遭到很大破壞,加上當時加勒比地區風暴頻
繁,到西班牙人來到時,各城市已經荒涼破敗了……

●第十二節

關於非洲的語言我知之甚少,好在有差不多三十個非洲國家以英語或法語作官
方語言,會這兩種語言去非洲也就對付了。

這裏我們所說的“非洲”,指的是撒哈拉以南的“黑非洲”,北非和東北非我
們已經在討論亞-非語係時提到過了,他們的語言即便不是阿拉伯語的話,也
是它的近親。

非洲有好幾百種語言,除了亞-非語係以外,還有尼日爾-剛果語係
(Niger-Congo)、乍得-尼羅語係(Chari-Nile)、
科依散(Khoisan)和另外兩個小語係。其中最大的一個語係要數尼日
爾-剛果語係,有二億多人口,接近非洲人口的一半,覆蓋了撒哈拉以南的廣
大地區。尼日爾-剛果語係的一個最重要分支是班圖語(支),人口占了全語
係人口的一半以上。從西非的喀麥隆到東非的肯尼亞,可劃一條“班圖線”,
班圖語就分布在在這條線以南,同時這條線以南的非洲隻有一小部分彼此孤立
的地區講其它語言。

語言學研究的結果表明,持班圖語言的民族最開始是發源於二千多年前的喀麥
隆,也就是班圖語言區的最西北角。可能是因為他們從近東地區學會了種植某
種農作物後,由於這種作物的適應性,他們隨之逐漸朝東、南遷移,最終布滿
了由此往南的整個非洲大陸。

班圖語言中最重要的語種是斯瓦西裏語(Swahili),它現在已成為東
非最通行的語言,坦桑尼亞和肯尼亞更以它作為官方語言。

在南非(共和國),白人講的語言叫“阿非利肯斯語”(Afrikaans),
這是十七世紀的荷蘭殖民者帶來的,由於好幾個世紀的分離,它已經和荷蘭語
有了不小的差別,所以現在把它們看作兩種不同的語言;黑人講的語言主要是
祖魯語(Zulu)和科薩語(Xhosa),科薩語受附近的一個小語係影
響,有一種非常難發的“倒吸氣”音:一邊吸氣一邊把舌頭上下顫動——你要
能象這樣發出聲音我就服你。“xh”表示的就是這種音。

在現代非洲,和世界上的其它地方一樣,較少數人講的小語言逐漸讓位於少數
幾種大語言。因為對每個人來說,放棄自己的不通用的母語而講鄰近的多數人
講的主要語種,自然對生活會更有用些。

●結論

我們終於走完了世界的各個主要部分。在當今的世界上至少有二十個語係、數
千種語言,我們隻能談及極小一部分;但這“極小的一部分”已包括了很大一
部分人口:單是漢語就占了20%的人口,加上英語、西班牙語、印地語和俄
語就達到了45%;再加上阿拉伯語、日語、孟加拉語、葡萄牙語、德語、意
大利語和法語能達到60%;再加十來種語言就增加到75%……可以想象,
最後5%的人口一定講著上千種語言:美洲的印地安人中有一千多種語言,非
洲有近一千種語言,巴布亞新幾內亞這一個島上就有七百多種,印度有一百五
十多種,(前)蘇聯境內有一百三,中國境內有好幾十……

本文的主要目的是希望能對世界上的語言以及互相之間的聯係、區別作一個鳥
瞰,同時多少探討一下一些我們比較關心的語言的發源、發展演變過程。其中
著重討論了英語的變遷、漢語的特性,以及拚音文字在中/近東的產生。

在文章中包含了幾個主要觀點,規結一下看朋友們有什麽高見:

·語言學和人類學、曆史學緊密相聯,互為影響、借鑒;
·語言和文字有聯係,但是相對獨立。同種語言可用不同文字,反之亦然;
·英語是當今世界上最普及的語言;
·漢語文字的表意特性包持了語言(乃至民族)的統一性;
·漢語形聲字的引入使它走向拚音文字以外的另一條道路,這有利有弊;
·現代漢語已經不再增字而是增詞表意,這是漢語向拚音文字轉化的一個早期
 跡象;
·文字的簡化有利於它的普及,從而促進文明的進步;
·拚音文字是最易於普及的文字,但其通行性受到讀音的牽製;
·語言的發展趨勢總是小語種讓位於大語種,大語種的廣泛分布又逐漸形成新
 的語種。

謝謝朋友們對本文的肯定、鼓勵和意見!
[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.