個人資料
慕容青草 (熱門博主)
  • 博客訪問:
歸檔
正文

中譯英對人工智能的挑戰

(2016-11-16 15:37:57) 下一個

人工智能的一個熱點話題是能否讓機器象人一樣地進行思考和學習。前一段時間的一個中譯英的經曆讓我看到了這個問題的一個簡化版:能否讓機器象人一樣地進行中譯英。

不久前我將我的兩篇中文哲學文章改寫為英文,因為文章較長所以決定嚐試不同於以往直接改寫的習慣,而是一開始先偷懶用google translate來將我的原文直接譯成英文,然後再改寫。這樣一來所得到的英文文章的詞序基本是照搬我的中文文章的詞序。結果發現google translate的中譯英語句翻譯功能顯然還不夠理想,除少數地方不需要修改之外,即便是不改變語序,所翻譯的意思與原文也常相差較大甚至出現很多英語語法錯誤。

而語序不變及直譯錯誤這兩點中最大的問題恐怕還是語序的問題而不是直譯語義錯誤及相關的語法錯誤問題,一來因為我的那兩篇文章被google translate直譯後的意思出入較大可能是因為哲學文章直譯的難度較大因而不太容易翻譯,而這又間接地導致了出現語法錯誤幾率大的問題;二來隨著人工智能的發展,估計這種直譯的意思偏差及相應的語法錯誤可能會越來越少,畢竟這屬於是通過擴大搜索的數據樣本可以解決的問題。而要想解決因語序不變而帶來的問題,恐怕就不那麽容易,稍微深究一下或許會歸結到機器是否能象人一樣地學習和思考的問題。

這裏有兩點需要特別注意:首先,這裏很重要的一點是,與小說和詩篇不同,哲學文章的意思的表達與它的可讀性密切相關。一篇可讀性差的文章不但可能讓人很難理解(比如黑格爾的文章),而且可能因為它的語序的問題而造出對讀者的誤導。第二,之所以說中譯英是簡化版的機器能否象人一樣思考的問題是因為在下麵的討論中可以看出,讓機器象人一樣地進行中譯英的難點的根本之處在於讓機器象人一樣地理解原文的意思,而如果機器能夠象人一樣地理解原文的意思的話,它基本上就能象人一樣地學習和思考了

以前因為英譯中做的比較多,而把中文原文寫成英文主要是改寫自己的文章,因此不存在作為專業翻譯的所講究的“忠實原文”的顧忌,而是怎麽順怎麽寫。這次用google translate先翻譯一下就發現中譯英時如果為了忠實原文而完全按照原文的語序來翻譯會出現這樣幾個大問題:

  1. 句子長短不妥。這主要是因為中文每個字是一個長度固定的獨立體,一般兩三個字最多四個字可以組成一個詞,很多時候單個字就是一個詞,但是英語單詞的長度很不確定,從三個字母到十三個字母都是常見的,而在中譯英的時候,每個中文單詞對應的英文單詞的長度是事先未知的,所以中文裏本並不複雜的一句話直譯成英文可能就會是跨越三四行的一個念起來很費勁的一句話,由於哲學文章的涵義複雜,一篇譯文中這樣的情況會很多。如果是人去翻譯自然會將其分解開來或幹脆將該句所在的前後文都重新整理,但是機器隻會直譯,這樣譯出的結果不但讀起來很費勁,而且根本不會被任何出版物接受因為它讀起來不像正常的英語。
  2. 與上麵的1)相關的是句子及段落組分長短搭配失調。一個在中文裏長度搭配很漂亮的句子或段落經過機器的直譯之後其長短搭配可能非常混亂;
  3. 對於哲學文章來說,常會有些不言而喻的前提,而這些不言而喻的前提又常常是與所用的語言的文化背景密切相關的,當人進行這樣的翻譯時會想辦法找到適合於目標語言環境的方式將原文中隱寓的意思表達出來,而機器的直譯根本無法將原文所在的語言環境裏不用說的意思表達出來。
  4. 與3)相應地,中英文環境下論述問題的習慣也不同。中文因為其語句的簡短及象形字所具有的意義集成的特點使得人們容易先接受結論然後再看原因。而在英文中除非在結論與理由之間另加專門的修辭過渡,如果你先給結論再給理由別人會難以接受。但是,在直譯的過程中,除非能讓機器象人一樣地理解原意,根本不可能讓機器額外地加入過渡性的修辭或者幹脆將結論與理由的次序顛倒過來,而隻有人為的翻譯才能做到這點。
  5. 雖然真人翻譯別人文章時由於要尊重原文的表達一般不會輕易對段落順序或段落內的語句順序進行大的改動,但實際上由於前麵1)2)3)提到的情況,很多時候將原文的段落順序及段落內的語句順序進行大手術才能不但更好地表達原文的意思而且在目標語言環境中的可讀性也更高,因此在將自己的中文改寫成英文時就可能常會進行這樣的大幅度改動,而除非機器能象人理解原文意思,它是做不到這一點的。。。

 

所以,這次的中譯英實踐讓我感到,如果機器能象人一樣地進行中譯英,真的就需要讓它能象人一樣地理解原文並熟悉原文語言及目標語言環境的文化背景才行。而英譯中雖然會有類似的問題,但是嚴重性恐怕小得多,因為英文語句長而中文語句短而且中文語法相對簡單。我本人做過很多英譯中,基本上不需要對原文語序做什麽調整就能讀起來很順。雖然我還從沒用google translate做過英譯中,但是我想如果沒有語序調整的問題,而基本上隻是詞對詞的直譯,那麽隨著搜索的數據樣本的增大,機器的英譯中的水平還是應該比較容易提高的。所以,如果誰要選擇翻譯的職業,應該做好中譯英的功夫,因為英譯中的飯碗被機器搶走的可能性比較大J。。。

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.