本文為原創,引用或轉貼請私信。
過去和現在都有過許多語言,有些能夠成文字,有些始終存在於口語中。
當我們關注於語言的區別的時候,一些要素是判別的基礎。比如:
音素 - 最小的聲音單位,例如 “狗” 中 “g”,“ou” , 或者 “d“,”o“,”g“
音節 - 口語中比音素大的單位,例如 “狗”,“貓”, “鍋” , 或者”dog“, ”cat“
字 - 一個語義單位,能夠表達某種意思。如”鮮花“,”太陽“,或者”water“,”history“
圖片 - 要表達的意思的圖像。
書寫語言 - 當我們提到書寫的時候,首先要知道口語和字母表之間的差異。根據不同語言字母表的拚音,同一個意思我們可以寫出許多不同的語言。我們可以寫英語或法語,或印度語,或西班牙語,或任何語言。也有一些語言可以同時使用兩個不同的字母表書寫:例如,塞爾維亞語同克羅地亞語是一種語言,其中一個使用拉丁字母(書寫),另一個使用西裏爾字母(Cyrillic alphabets,俄語也屬於西裏爾語係)。
因此,如果想要發明一個新的文字係統,就應該包括:
標誌或圖案的係統 - 你的符號要能夠代表單詞或單詞的一部分。如:象形,就要像它們所代表的東西;你的符號也可以表示一個詞的聲音;也可以直接抽象表示要表達的東西。
音節係統 - 即音標,用於口語發音的符號,這用來表示這個詞的聲音。
字母係統 - 目前存在兩種類型,一類僅有輔音;而最常見的是同時具有輔音和元音。每個字母符號對應一個音素。
換一個角度再來表達上麵的意思:
字母、音節、語標、象形、表意文字、這些要素也可以這樣分類:
表音文字 - 每一個符號表示不同的發音,一般包括:
字母 - 比如拉丁語,希臘語,腓尼基語
音節 - 最基本的發音元素是一個音節,可以用一個或者一組符號代表一個音節
與此相反的是:
語素文字是代表一個字的含義,但並不能表明它的發音。現在仍然常用的比如有“¥”、“$”、代表金錢的單位;“%”、代表數學符號
象形是它們最初的表示方式之一,如簡化畫麵?為太陽
表意文字是用一個符號代表一個完整的意思,最常見的交通標誌就是一個例子。
此外,還有一種按照一定規律,但是多用於娛樂休閑場合的語素轉化:
畫謎體 - 又稱書迷體、神智體。是利用圖畫、符號和它們的組合來表達意思或者形象的書寫方式。比如:
“CCCSAILINGCCCC” 代表 Sailing in the seven seas
“LIE KING” 代表 Lion King(獅子王)
我國古代文學中也有類似的創意,比如:
桑世昌《回文類聚》卷三:神宗熙寧間,北朝使至,每以能詩自矜,以詰翰林諸儒。上命東坡館伴之。北使以詰東坡,東坡日:「賦詩,亦易事也;觀詩,稍難耳。」遂作《晚眺》詩以示之。北使惶愧莫知所雲,自後不復言詩矣。
這首詩讀出來是下麵的斷句:“長亭短景無人畫,老大橫拖瘦竹筇;回首斷雲斜日暮,曲江倒蘸側山峰。”
這裏還有一首神智體的民歌,代表的是什麽詩句呢?
決定符號 - 這是一種輔助符號,與主要符號組合在一起,輔助解釋主要符號的意思或者類別。中文中的部首就是一種決定符號。比如 “她” 中的“女”,“稻”中的“禾”;古埃及聖書體中也有類似的應用,比如:
另外赫梯語中也存在類似的情況,添加如詞匯中的某些符號並不代表發音,而是為了確定單詞的類別。比如,代表這是一個城市名稱;代表這是一個男人名字(類似Mr.)
下麵是一些有著悠久曆史的書寫語言的簡單背景。
埃及象形文字 - 由語素文字 + 音節文字 的組合,當然還需要配合發音的音標字符。但古埃及文字音標中沒有單獨的元音。埃及語言的發明者使用“決定符號”或者更原始的“形意符號”來明確要表達的詞的意思。
楔形文字 - 由語素文字 + 音節文字 的組合。最初是純圖形文字,進而經過長時間的不斷簡化,逐漸形成了成熟的楔形文字。成熟的楔形文字中也應用了一定量的“決定符號”。
漢字 - 基本上是純粹語素文字,每一個字符都代表特定的意思。古漢字的字符也代表發音(古漢語多用「讀若法」或「直注法」為漢字注音)。
為什麽現代世界上以字母為主的書寫係統占有數量上的絕對主流?是什麽把它與其它書寫係統區分開來?字母書寫係統組成的詞匯僅僅表示聲音,其中一個個字母符號也同現實世界沒有任何關聯。而上麵提到的語素文字係統中,其中一個符號則代表一個明確的事物或者行為;另外,字母係統也不像前文提到的音節文字係統(注1),需要對語言中每一種不同發音的音節賦予一個特殊的符號,這樣往往一門語言就需要幾百,甚至幾千種符號。字母書寫係統僅僅有20、30幾個代表不同發音的字母。對於一個事物,如果你知道它怎麽讀,你就能夠寫出來。這是不是比其它兩種文字係統的準入門檻要低好多?
注1:日語、漢語都大量使用音節文字。日語的平假名與片假名都代表日語中不同的音節;漢語在漢語拚音沒有發明之前,可以認為每一個漢字都是一個音節。另外,希臘邁錫尼文明的線型文字B、北美印第安人中的切諾基族、彝族的彝文、湖南女書都是純粹的音節文字係統。
世界上已知最早的字母文字係統是大概於公元前1700年出現的青銅中期文化字母Proto-Sinaitic,它與古埃及文字中僧侶體近似,學術界有觀點認為它們之間有繼承關係,但這個看法至今存在爭議。基本可以肯定的是,後期的迦南/腓尼基語Canaanite/Phoenician多半源自於這套字母文字係統。很可惜的是,古文字學家普遍認為它是一套僅僅有22個輔音字母的“醜陋”的發明。
字母文字係統的輝煌開始於古希伯來語Hebrew和古希臘語的發明,其它如拉丁語、伊特魯裏亞語Etruscan、古意大利語係都繼承自希臘語。盡管上古語言文字間的相互影響關係至今仍然不很明確,但人們普遍認為希臘語是絕大部分字母文字的始祖。這個原因大概與希臘語是第一個引入元音字母的文字有關。盡管如此,我們也要明確認識到希臘語也是受到腓尼基語的直接影響而發明的。
當今最流行的字母文字係統 - 英文是屬於古代的拉丁/羅馬字母語係,這個語言係統大致產生於公元前6世紀,由伊特魯裏亞語派生出來。
現今也有一些語言屬於上古語言係統的“活化石”,比如埃及的科普特Coptic文字係統。他是由仍然生活在埃及的古埃及人的後裔保存的語言。這些人是在阿拉伯穆斯林征服古埃及王國之後,存活的最後一批基督教信徒。他們語言的名字 - 科普特,也是阿拉伯語中“埃及”的含義。科普特語屬於古埃及語言文字的簡化版,從古埃及世俗體文字(注2)派生出來,由結合了後來希臘征服者的語言特性(它的字母體係由7個古埃及世俗體字母同希臘字母組合而成)。
注2:古埃及世俗體文字是由聖書體與僧侶體派生出來。古埃及文字係統從公元前4000年一直在埃及地區應用到公元11世紀,直到被阿拉伯人征服。
值得提到的一點是,上古的文字係統往往都不具備完善的語法結構。它們給現代人的印象多類似為一種“要點速記”,因為當時的所謂文章,你很難通順地一句話,接著一句話地讀下去。但你也要想到,畢竟上古人類生存在一個以口語為主的社會裏,隻有極少極少的人才會書寫,就更別提“文學素養”了。
最後再提出一個問題:為什麽出土的上古時期的石碑中的碑文都使用多種語言重複相同的內容?比如羅塞塔石碑Rosetta Stone 或者 波斯大流士墓碑the tomb of Darius(注3)。難道是為了讓後世的考古學家能夠更方便地破譯語言的秘密嗎?
注3:羅塞塔石碑上用希臘文字、聖書體和世俗體雕刻了相同的內容,這樣考古學家才能通過對照希臘文字與古埃及文字的關係,打開了破解古埃及文字的大門;波斯大流士墓碑也發揮了類似的作用。
未完待續
附上期答案:
夜長枕橫意心歪,斜月三更門半開。
短命到今無口信,肝腸望斷沒人來。
那麽古人最初發明文字的目的是什麽?通過觀察分析天馬行空的史前文字,我們又能讀懂什麽?
“文如其人”,沒錯!也讓我們通過文字看看史前的古人各自有什麽特點。大體來說,在絕大多數史前人類的觀念中,文字的起源很神聖。一個古人如果具備書寫的能力,會被他人認為具備強大的力量。要想解密史前文字中齊齊怪怪的符號,以下因素是必不可少的條件:
- 精確copy副本
- 一個熟悉的語言作為參照物
- 鄰近的、或者相交叉的文化圈內的名人、地名、以及其它專有名詞的描述(作為分析的突破點和參照)
- 雙語或多語石碑銘文(能找到這種碑文,是考古專家的運氣),就像下麵這2個例子:
但是,也要警惕這個習慣 - 一旦在石碑上發現不同語言的雕刻,就認為一定會是相同的內容。下麵這個石碑上分別用聖書體和世俗體表示了不同的事情(這塊碑曾經讓某些曆史專家鬧了大笑話)。
注1:圖片取自大英博物館,詳細信息請見http://culturalinstitute.britishmuseum.org/asset-viewer/stela-fragment-of-horiraa/XQHlc68EDsleqA?hl=en
很遺憾的是,瑪雅文字的破解是沒有任何“先入為主”的資料可供幫助的。
注2:圖片取自大英博物館,詳細信息請見http://www.britishmuseum.org/research/collection_online/collection_object_details.aspx?objectId=655434&partId=1
唯一的幫助可能就是錯誤百出的殖民地教士總結的瑪雅文字與西班牙語的字母對照表。
於是,經驗豐富的曆史,以及文字專家總結出了一個史前文字創造者們普遍采用的創作形式 - Rebus Principle書迷定律。因為象形文字能夠很容易表現現實的物體,比如:人、石頭、太陽、眼睛等等。但對於抽象的概念,或者人們不太熟悉的事物,象形文字就很難形象地表現出來。於是文字創造者們多借用“標誌符號” + “同音字”來解決這個問題。最常見的就是漢語中的許多應用,比如“蜘蛛”這個詞,就是借用了“知”“朱”這兩個字的發音,同時通過“蟲”這個標誌符號定義;另外,“霧”,“迷”,“鸚鵡”等等都是應用了這個定律。
同樣的例子在古埃及語言也比較常見,讓我們用英語發音來做一個近似的解釋,如下:
那麽稍微具體來說,史前語言的創造者是怎麽處理發明過程中的各種問題的呢?
古埃及文字:
開始的時候學者們認為是一係列象形符號組成的幫助記憶的提示,因為這些象形符號大部分形象地表現了各種植物、動物、工具等等;後來經過一係列巧合才發現,絕大部分的象形符號在埃及文字中並非代表圖像本身的意思,而是應用上文提到過的“書迷定律”,來借用發音;後來又發現,當古埃及人真的需要使用象形符號圖像本身的意思的時候,他們的語法是在符號之後加以“標誌符號”(前文以述);因為古埃及語言中沒有元音,所以現代人聽起來會感覺很奇怪,有一種沒有重音,並且很“虛”的味道(注3);另外,在古埃及語中,“標誌符號”僅起到“標誌”作用,不發音。
注3:古埃及語言的發音示範, “How to read Ancient Egyptian Language” https://www.youtube.com/watch?v=1jEdLNlhhi8
“Learn Ancient Egyptian Hieroglyphs!” https://www.youtube.com/watch?v=8QNcdxgjcBs
接下來,後人還發現了古埃及人對語言符號更複雜的使用方式:
- 發音符號, 包括字母,biliteral和triliteral(注4)
注4:biliteral和triliteral是閃米特語族的特殊語法概念。很遺憾,中國一直對其關注甚少,筆者沒有能夠找到合適的中文翻譯。
對它們大致的解釋是這樣:在古埃及語中,有一些符號能夠代表複數數量的發音組合(包括輔音組合、輔音與元音組合)。如果複數數量為2,這個組合的定義為biliteral;如果複數數量為3,這個組合的定義為triliteral.下麵是biliteral和triliteral的例子。
- 表意符號,包括語素文字和標誌符號(但是,如果隻是單獨的一個象形文字符號,除了作者,則很難判斷其是哪種符號,表示什麽)
- 審美因素,每個古老民族有其審美特點,像瑪雅人喜歡使用圓形,埃及人喜歡在自己的文字中使用矩形。同時,他們還在文字設計上盡量避免空白,他們會調整文字內容的大小,方位和細微形狀,使其感覺更漂亮。
- 另外,上古時期懂得書寫和閱讀的人很少,也沒有嚴格意義上的語法結構,所以,下圖表示的故事在遠古確確實實經常發生。不僅僅在古埃及,在瑪雅文明中也是如此。瑪雅文明後期的陶器上麵的文字多為製作者的胡編亂造,不知所雲。
瑪雅文字走的是與其它史前文字不一樣的套路。最核心的詞素符號往往不是這個詞的主要意義標識,就是這個詞的重音。然後使用上下左右的修飾符號來完善整個單詞的發音。由於瑪雅文章的閱讀順序是由左至右讀兩個詞,然後接下一行,再讀兩個字符,周而複始。所以瑪雅單詞中上下左右的修飾符號也多為最多兩個,以維持傳統的閱讀習慣。
瑪雅文字在組成方式上十分靈活,雖然具備一定規律,但書寫者不加限定,按照自身偏好組合的瑪雅字符往往給閱讀者造成不小的困難。比如下麵這位帕倫克君王的名字 - 帕卡爾就有6中不同的寫法(按照“標誌符號”組合、或者按照“發音符號”組合、或者兩者結合)
到目前為止,仍然有許多史前文字,因為各種原因我們無法破譯。比如下麵這些:
已知的古老語言是如何演化的呢?
注1:Athens - 雅典;Thera - 錫拉島; Crete - 克裏特島; Naxos - 納克索斯島; Corcyra - 克基拉島; Boeotia - 皮奧夏
注2:詳見大英博物館網頁 https://blog.britishmuseum.org/2014/11/19/3d-imaging-the-assyrian-reliefs-at-the-british-museum-from-the-1850s-to-today/
文字被古人認為是神聖的,每個民族都記載著自己文字的起源。
曾幾何時,書籍是如此尊貴。
下圖取自中世紀法國地區的插畫,裏麵寫到:
他偷走了這本書
他將在巴黎的絞刑架上晃動
如果他沒有被絞死
他會被淹死
如果他沒有被淹死
他會被燒死
如果他不被燒死
那麽他將會死得更慘
近現代以來,世界人口程幾何級數增長。相反的是,隨著全球化,世界上的語言種類與數量卻越來越少。這裏的“語言”指的是自然語言,即在曆史之中逐漸成型,依托於某個民族、或者文化群體,並且隨著時間演變的語言。19世紀以來,人為設計出來的人工語言開始層出不窮。其中最有名的大概要數“世界語”了,在20 -30年前的中國也曾經流行過。盡管其機構仍然宣稱目前有幾百萬人能夠熟練使用世界語,但筆者對這個數字表示懷疑。試問每一位讀者的身邊,記憶中還能找出懂得世界語的人嗎?
以世界語為代表的一係列人工語言的初衷是為了設計出一種語法結構簡單、嚴謹、同時易於學習領會的語言文字,用意是為了人與人交流更方便。但是語言是與民族文化深深凝結在一起的東西,這個思路經過證明沒有生存的土壤。現代以來,雖然有更多的語言被創造出來,但其中絕大多數並不以傳播作為主要目的,它們或者是語言學者為了證明自己的某個觀點的實踐;或者是某人的即興之作;其中影響最大的要數影視與文藝作品中出現的人工語言了,下麵詳細介紹。
比如電影Avatar中的納美語的設計目的主要從兩個角度出發:第一是發音,導演與語言學家以北美印第安人的發音為藍本,這是為了在潛意識中影響觀眾 - 納美人與印第安人一樣“熱愛大自然”同時“與白人對抗並處於弱勢”;第二是在語言中加入生活元素,比如納美人相互問候的第一句話是“Oel ngati kameie(我看見了你)”,這是不是像北京人說“吃了嗎?”一樣有著強烈的地方特色?;由於電影中納美人是一個注重心靈與自然和諧的種族,導演在納美語的文化特色上也下了一番功夫。比如納美語中對於“看見”就有2種說法。普通意義上的視覺“看見”是tse'a。而kame指的是心靈上的“看見”(相通)。對比女主角先後對男主人公說的“我看見了你”,你就會逐漸領會到納美人文化中獨特的哲學內涵;另外,漢語中常用發音的抑揚頓挫來表達情緒,但納美語中在這個基礎上設計了專門的語法項目:比如,同一個單詞“打獵”,被加入不同的詞綴就變成積極或者消極的含義。t‹ìrm›ar‹ei›on(剛才正在打獵噢!),說話者很興奮。t‹ay›ar‹äng›on(又要打獵了!),說話者很消極抵觸。這一點,筆者一直沒有想清楚它的用意是什麽,大概隻是語言設計者的偏好吧。
係列電影《星際迷航》中的克林貢語也很符合其民族特色。由於克林貢人是一個粗魯的“戰鬥的民族”,在他們的語言上也有配合的設計。克林貢語多應用了塞音、顫音和鼻音,在配合有些刺耳的嗓音;同時,克林貢語言使用人類語言中極少見的“賓謂主結構”,直觀上就給人以外星語言的感覺;另外在克林貢人的日常對話中,從不說“謝謝”、打招呼的用語是“你想要什麽?”、表示相互喜歡的話是“我不恨你”。這些都能幫助整個作品樹立出克林貢人的冷血、殘酷、實用主義的特點。
《魔戒》中的精靈語的設計中,更多的引入了清音和響亮的元音,這樣一段精靈語說下來,會給聽者一種舒緩流暢的韻律感,不禁聯想到精靈俊美的容貌和藝術氣質;而同一部電影中的半獸人語著重使用濁音與摩擦音,在配合粗重的嗓音,立刻會讓人感受到魔多統治下的黑暗與強暴。
係列小說《冰與火之歌》中,龍母丈夫的種族 - 多斯拉克人見麵的問候方式是“Hash yer dothrae chek asshekh?(你騎得好嗎)”。回答的套路是“Anha dothrak chek asshekh.(我騎得很好)”。祝賀生日要說“Asshekhqoyi vezhvena!(祝你擁有美好的血腥的一天)”。感謝要說“San athchomari yeraan!(榮譽歸於你)”。這些文字無不反映出多斯拉克人好戰、充滿榮譽感的遊牧民族特性。
同樣在這部小說中,無麵者見麵時相互用高等瓦雷利亞語問候,說的是“Valar Morghulis(是人都有一死)”和“Valar Dohaeris(凡人皆需侍奉)”,神棍氣質呼之欲出。
在影視劇中出現的人工語言之外,近些年語言學家和愛好者也設計過許許多多語言文字,不過其中絕大部分都是拚音文字。前文已經提到過,對於拚音文字,設計者在創造出有限的字母之後,簡單地說,隻要選擇性地沿用一係列現有的語法與拚寫規則就可以了。而語素文字(比如漢字),發明者要對常見的語素各自設計出獨特的符號,這個難度係數與拚音文字不可同日而語。
Reonji語言就是一個有意思的語素文字。
據稱它已經有了800多個不同的語素符號。經過這些符號的完美組合,形成了下麵源自《聯合國世界人權宣言》的一段話。
它的意思是“所有人生而自由,在尊嚴和權利上平等。 他們有理智和良心,應該本著兄弟情誼的精神相互行動。”
Oakscript雖然是一個字母文字,但它模仿樹枝椏的字體以及由上至下的書寫方式給人以耳目一新的感覺。
還有應該是國人設計的xliú Σgrén πzwén語言。通過了下麵2副字母表,形成了最後一篇《論語:學而時習之》
還有外星生命色彩濃厚的Rng'-Tera文。
古瑪雅文字的模仿者Sitelen語言。
看著像是模仿漢字的語素語言,但實際上是字母語言的Trantanese。
但以上所有語言的發音都依托於人類聲帶發音的基礎上,筆者很期待能夠出現一種超脫於人類發音基礎的語言出現。
文字起源的過程,本文將介紹幾個新的觀點和推測。
文字是人類經過長期積累,一點一點發展完善的嗎?
目前對文字的誕生方式似乎隻有一種定論。就是先出現象形符號,然後經曆漫長的時間,人們逐漸將象形符號有機地結合起來,用來記錄更複雜的信息,於是產生了完善的文字係統。
上述觀點的主要依據之一是兩河流域的考古成果。古時期,當地的貿易很發達。在貨物運輸的過程中,人們會在封口嵌入一塊泥巴,在上麵畫上帶有自己獨特標誌的“戳(印章)”。後來出現了專門從事運輸工作的商人隊伍,於是上麵提到的“印章”中就逐漸增加了更多的內容,除了“商標”之外,還會加入有貨物統計信息。比如,多少袋麥子、多少罐蜂蜜、多少頭牛等等。漸漸地,象形文字就濫觴於這種過程之中。後來,蘇美爾出現了大規模的土地私有化。大型土地擁有者,比如神廟或者國王,在管理這些土地的過程中需要記錄大量的信息。比如,土地的位置、丈量信息;租賃信息;農具管理;收成、入庫和交易信息等等。這些實際需求將原始象形文字推向實用化,同時也誕生了書記員這個職業。
在其它的人類文明起源地,文字很可能是在短時間內就發展成熟的,比如古中國。這個猜測誘發於先秦考古中一個很特殊的現象。安陽殷墟是已知中國最古老的文字 — 甲骨文的出土地。裏麵大量的龜甲與獸骨上存在著成段落的甲骨文。這些龜甲與獸骨都來源於占卜祭祀,用來記錄結果的。
奇怪的是,甲骨文似乎是在殷墟存在的這270多年間一下子產生並成熟起來的。之前的殷商遺址中並沒有發現過這種文字早期的形態。這引發了學者針對兩個不同可能性的猜測。
第一,如果繼續認可文字是長時期逐漸成熟的觀點,那麽甲骨文發展中缺失的這個環節很可能是在記錄媒介的轉換上。我們現在考古所能發現的古代文字記錄都是存在在能夠經久保存的材質上,比如,骨片、泥板、石碑等等。如果當時的古人喜歡使用樹皮作為書寫媒介,經曆了幾千年的潮濕氣候,這樣是很難給後人留下什麽書寫的證據的。如果說甲骨文屬於這種情況,其經過緩慢的發展逐漸成熟,直到在殷墟時期由於大量使用骨片和龜甲用於占卜,才為後人留下了作為文字的證據。
同時,部分史學家也提出了下麵的可能,就是中國古代的文字 — 甲骨文是在很短的時間產生的。準確的說,就是像傳說中的倉頡造字,甲骨文是由一個或者同一批人發明完善的。這個過程是理論上可行的。無論是表音還是表意文字,在口語語言已經完善的狀態下,隻要設計出口語所對應的不同書寫(詞匯或者字母),直接就產生了係統的書寫語言。
相反,人類社會口語語言的產生的的確確經曆了漫長的歲月。對比人類先祖的喉部發育情況,人類直到晚期智人時期的喉骨結構才允許發出類似於當代人類這麽多抑揚頓挫的音節。他們的顱骨底部變得拱起,形成一個蓋子形狀覆蓋在咽部之上,同時把直立人向外探出的麵部向裏麵拉過來,這個時候的人類才逐漸具備了口語語言的生理條件。這個時期是大致在3萬年之前。