有誌唐詩研究和對唐詩感興趣的讀者,可能產生過對某一語詞的使用頻率的關注,即一個語詞在一個詩人的作品中究竟出現過多少次,進而關心某個詞在唐詩中的使用情況。對前一個問題,想的人肯定要多一些,一些別集的“引得”也為人們提供了方便。而對後一個問題,則是一個不大敢想的問題。麵對5萬餘首唐詩,要統計某一個字或詞的使用情況,談何容易!再就是,在學習和寫作中,我們常遇到這樣的尷尬,對一句詩,尤其是不太熟悉的作品,要麽是記不全,要麽是記不起作者,要征引時十分不便。那時,我們就感歎,有一個方便的檢索係統是多麽的好啊!
就在我們感歎時,一批文化工作者早就在埋頭苦幹了。商務印書館國際有限公司研製出版,北京靈坷精藝電子技術有限公司製作的“中華文明係列”《全唐詩》(電子版)的出版,給我們帶來了驚喜!
這個大型軟件對《全唐詩》的檢索極為方便。讀者可以按卷數、詩人、篇名、體裁進行檢索。要而言之,讀者可以根據自己掌握的有限的條件進行檢索。即你可以從一個字查出你想要找的詩,進行快速的大海撈針。當然,你掌握的條件越多,檢索的時間就越短。如果你知道一句詩,要查出作者、篇名和全詩就比知道一個字或詞快,如果你知道一個詞或一句詩,又知道作者,要查出篇名和全詩就更快了。因為軟件設有多條件檢索功能。軟件的統計功能更是了得。可以對任何一個字進行某一作家或者全部唐詩的使用頻率的統計。這對唐詩研究來說,無異提供了一個新的研究領域。
筆者在1998年10月召開的唐代文學學會暨國際學術討論會上,購得這個軟件,回家之後,自然要試一試,在數百個常用字中,電腦軟件告訴我們,唐人最愛說的字是“不”!
在該軟件收錄的50836首唐詩(共2615215字)中,“不”字出現26520次。以篇數計,占50%,即平均二首詩說一次“不’;以字數計,則100個字說一聲“不”,占1O1.4066/萬。頻率之高,令人難以想象。唐人為什麽愛說“不”,在哪些場合說“不”,確實是一個值得研究的課題。
在其他詞匯中,有這樣一些數據:
在數字類,使用率最高的前5位是:“一”:15282次;“千”:6126次;“三”:6094次;“萬”:5773次;“十”:3507次。(其他數字的使用率排列為“五”:3294次;“百”:3202次;“九”:2599次;“四”:2744次;“二”:2070次;“六”:1285次;“八”:1142次;“七”:895次。)
在山水類,使用率最高的前5位是:“山”:16180次;“水”:11148次;“江”:7494次;“海”:4320次;“河”:2746次。
在天象類,使用率最高的前5位是:“風”:15780次;“日”:15011次;“雲”:13538次;“月”:11053次;“雪”:4500次。雪的使用率比想象的低。在“風花雪月”中,“雪”的排名在“月”後。
在季節中,四季排序為“春”:11126次;“秋”:8172次;“夏”:942次;“冬”:554次。春恨秋愁是唐人抒情的重要內容之一,從語詞上也得到反映。
在植物類,使用率最高的是“花”:11421次;其次為“草”:5451次;“樹”:5307次;“鬆”:3372次;“木”:2194次。
在情感類,使用率最高的前5位是“心”:9080次;“愁”:4331次;“情”:4209次;“樂”:2466次;“苦”:2266次。(“愛”:1980次;“恨”:1875次二)
在色彩類,使用率最高的是“白”:8499次;其次為“青”:6523次;“紅”:4119次;“黃”:3860次;“綠”:2774次。(“碧”為2784次,“紫”為2174次,“赤”為751次,“黑”的次數僅為531次,“藍”為171次。)
在人稱類,使用率最高的是“人”:21095次;其次為“子”:6254次;“我”:5482次;“你”的稱謂僅有34次,且從晚唐以後才出現,羅隱《代文宣王答》:“吾今尚自披蓑笠,你等何須讀典墳。”是《全唐詩》中的第一個“你”。(王梵誌的詩《全唐詩》未收,其中“你”亦不少。)之後,寒山的詩中有15個“你”。如“再三勸你早修行,是你頑癡心恍惚”。“你若不愛信,相逢不相遇。任你千聖現,我有天真佛。”多是勸善詩中的口語式的表達。“你”主要在通俗詩中出現。值得注意的是,初唐的王梵誌和中唐的寒山大量用“你”,而其間其他詩人“隻字不提”此字。這一現象耐人尋味。
在飲食類,使用率最高的是“酒”:5011次。酒之富有詩意,這是一個證明。其餘食品,似不宜入詩,如“茶”亦隻有410次,“肉”為369次,“飯”為323次,“米”為150次。
在動物中,使用率最高的前5位是“馬”:5008次;“鳥”:3532次;“鳳”:2134次(“鳳凰”376次,“凰”單獨使用僅14次);“魚”:2028次;“雞”:1015次。“馬”出現的頻率高過“河”、“紅”、“綠”、“川”及若幹表現情緒的詞,見出馬與人類生活關係之密切。牛、蟲、羊、犬等動物,均在700次至400次之間。
在一些反義詞組中,除了表達情緒的語詞是愁苦多於歡樂外,大多呈現出“正麵”的詞匯多於“負麵”的詞匯的現象。如“多”:6632,“少”:3000;“大”:3188,“小”:2517;“高”:7239,“低”:1184;“遠”:5928,“近”:2535;“長”:9214(“長”包括生長之長),“短”:742;“笑”:2223,“哭”:597;“好”:2778,“壞”:172;“上”:11193,“下”:7378;“真”:1962,“假”:320;“美”:1105,“醜”:129……這種現象可以使人思考一個問題,即詩,或者說唐詩,所表現的內容和所表達的情感是以“審美”而不是以“審醜”為主要傾向。
需要說明的是,本文的統計,範圍是有限的。讀者和研究者可以根據自己的需要來進行作家作品的檢索。這些數據至少可以幫助我們了解一個字被使用的基本情況。對同一個字的不同義項,這個軟件未能區別。這應該是辭典軟件設計者的任務。不過,我想,要是這個軟件(在升級時)以及商務印書館以後出版的係列軟件中,在檢索功能中增加一項不同義項的檢索內容,對讀者來說,又會多一份驚喜。當然,這又是需要設計者們付出許多辛勞的。
多謝二位師姐雅臨!日前武兄提出了寫詩的“三定律”引起一番討論,後由石蝶兄提出,找唐詩中最常用的字,咱們偏不用,以有所創新。於是就在網上找了這篇供大家參考。
現在的遊戲規則是,禁用最常見的“不”字和7個常用情感字:”心”;“愁”:“情”:“樂”:“苦”:“愛” “恨”,寫抒情律詩。: )