豆司令是也

回歸原始主義者兼動漫發燒友
個人資料
窈窕淑女司令 (熱門博主)
  • 博客訪問:
正文

現代方法考證《紅樓夢》作者

(2005-03-02 23:26:29) 下一個

【現代方法考證《紅樓夢》作者】窈窕淑女司令

去年某時在某朋友家作客時亂翻看到的一條消息,今天不知為什麽忽然湧現在腦海中,可能有些微誤差。

是說長期以來各界普遍承認曹雪芹隻寫了《紅樓夢》的前80回,後40回是高鶚所續。但在1981年威斯康新的一位名叫陳炳藻的學者,在於美國召開的首屆國際《紅樓夢》研討會上宣讀了一篇論文:《從詞匯上的統計 論《紅樓夢》作者的問題》。轟動了整個紅學界。

陳炳藻用計算機對《紅樓夢》中的字、詞的出現頻率進行統計處理分析,徹底質疑後40回是高鶚所續的說法,認為整個120全是曹雪芹一人所作 人的語言風格在表達時都具有個人特征,是人格在文字語言活動中的一種體現,而這種風格可以編程須用數量特征來反映出來。 

例如:句長、詞長的運用習慣,或字詞在文章作品中出現的次數,等等。大數量的統計分析發現人與人之間的風格都很不相同。這門學科有個新詞叫“計算風格學”

運用“計算風格學”也解決了不少所謂“佚名”作者或有爭議作者的公案,比如:很多人一直質疑《靜靜的頓河》的作者是不是肖洛霍夫(1965年獲諾貝爾獎),並說是他從一位名不見經傳的作家克留柯夫那兒抄襲來的。連索爾仁尼琴等許多有名作家都認為如此。理由是肖洛霍夫年紀太輕不可能有小說中的生活經曆。而肖洛霍夫本人也屬於“one hit wonder",這本書後就再沒寫出什麽有價值的作品了。 

於是有許多學者用計算風格學進行研究,把肖洛霍夫的《靜靜的頓河》與克留柯夫的作品進行分析,分析包括比較句子長短、詞類分析、詞類在句子中的不同位置、句子結構、結尾句子的用法等等。結果確定《靜靜的頓河》的確是肖洛霍夫寫的。

[ 打印 ]
閱讀 ()評論 (5)
評論
淑女司令 回複 悄悄話 化學鍵,你說的有一定道理
化學鍵 回複 悄悄話 感覺 false positive 和 false negative的可能性都比較大, 因為不同人的風格經過那種計算可能得出相同或者相似的結果,那就是說,在誤差範圍內,沒法區別。 這可能是所有的統計的本質,即任何統計結果都是說明某種結論的概率,而且都有個置信期間。
窈窕淑女司令 回複 悄悄話


夜林 回複 悄悄話 這個話題很有意思,我有個同事研究方向是 "text mining", 跟計算風格學多少相關,所以我聽說過一些。可惜司令貼本文在走廊時我正忙,現在都沉到第二頁了,就在這兒瞎跟兩句吧。用計算風格學來判斷作者,其精確度不難驗證。比如,把紅樓夢中確認是曹雪芹的前80章抽出來,再從中隨機選40章,統計出其風格,然後以此來判斷剩下的40章是否是曹雪芹的,看有多少章被錯誤的否決掉,這被稱作 false rejection rate(FRR)。又把<<三國>>,<<水滸>>,<<西遊>>中的章節拿來判斷,看看有多少被錯判為曹雪芹的作品,即 false acceptance rate (FAR). 如果FRR跟FAR兩項指標都很低,就證明這套理論確實可行,以此去判斷紅樓夢剩下的章節是否出自曹手,就比較有把握了。
登錄後才可評論.