擺脫蹩腳中式英語,有 5 億詞匯的美國當代語料庫幫你

本帖於 2016-01-11 20:47:24 時間, 由超管 論壇管理 編輯
去年底,我在電腦玩物介紹了兩個網絡上的語料庫搜尋引擎,造成了不少反響與傳播。
但在這麽多的反響裏我也聽到了一些不同的意見。上麵兩個語料庫搜尋引擎的來源都是「網絡上的用語」,但是網絡上的流行語法不一定經過嚴謹的編輯,不一定能代表「相對正確」的英文用法(雖然我相信也沒有所謂的絕對正確)。
那麽,有沒有其他的語料庫或翻譯搜尋引擎,可以幫我們找到相對正確的現代英文用語方法呢?這就是今天要介紹的「COCA 美國現代英文語料庫」,她的全名是:Corpus of Contemporary American English。
 
1. 來自專業正式文本的美國當代英語語料庫
「COCA 美國現代英文語料庫」是由美國楊百翰大學 Mark Davies 教授所開發的一個免費的語言資料線上搜尋引擎,他自稱是當今世界上最大的語言資料庫,而且他的語料來自於美國英語使用情境下的這些文本:
  • 口語演講
  • 小說書籍
  • 雜誌報紙
  • 學術期刊
也就是說比起搜尋網絡用語素材,「COCA 美國現代英文語料庫」的語料來自於有更多嚴謹檢查與使用的專業或正式文件,所以相對起來更能避開有爭議的方法,而更接近正式的語法。
這對有「英文文稿翻譯」、「英文正式報告」、「英文職場書信」需求的使用者來說,提供了更專業正確的查詢管道,並且查詢時可以找到各種詞匯在這些文件裏的使用方法參考。
 
2. 持續更新,搜尋快速,包含去年最新語料
值得一提的是,「COCA 美國現代英文語料庫」從 1999 年創立至今依然持續更新,每年都要更新大約 2000 萬的詞匯數量,目前到 2015 年年底為止已經擁有 5 億 2000 萬的龐大詞匯語料。
即使有這麽龐大的語料庫,但「COCA 美國現代英文語料庫」搜尋的速度依然很快,瞬間就可以找到結果。
在不需登入的情況下,每個用戶每天可以使用 10 到 15 次的搜尋,或者你可以注冊免費帳戶,可以無限製的使用搜尋功能。
 
3. 如何開始利用「COCA 美國現代英文語料庫」搜尋?
基本的使用非常簡單,進入「COCA 美國現代英文語料庫」網站後,隻要找到左方的搜尋欄位,在「Words」中輸入你要查詢的英文單字或詞匯或句子,就可以找到相關的語言資料。
你可以在來自小說、演講、期刊等資料中,看到一個詞匯或一段用語被如何使用的方式,找到更正式或更正確的變化。
 
4. 如何搜尋一個字可以搭配哪些詞匯用法?
更進一步,很多時候我們要寫報告、寫書信時,需要的是找到一個還不確定的英文詞匯的使用方式,例如在一個特殊名詞之前應該接什麽動詞?應該使用什麽語法來描述一個事件?這時候要怎麽利用「COCA 美國現代英文語料庫」查詢呢? 這時候就要用到「Collocates」上下文查詢的功能。
在「Words」裏輸入我的核心單字,例如「beach」(海灘),我想查詢要如何用正確與文雅的句子來描繪前往海灘的英文語法。
接著在「Collocates 」裏輸入上下文我想查詢的相關詞匯詞性,例如下圖中代表的意思是我想查詢「前文」的「一個字範圍內」可以接什麽「動詞」在海灘這個單字的前麵。
如果我在 Collocates 欄位改成輸入「V*」「4」「4」,那就會變成查詢在「beach」這個單字的前文四個字內、後文四個字內如果要使用動詞,可以使用哪些動詞變化。
你可能會說,還要自己輸入詞性嗎?其實也不用,因為你可以利用下方的「pos list」清單,找到你需要的詞性,直接點選,就能輸入在前方欄位中。
透過這樣的查詢,我們就可以去找出在一個單字的前後文裏,可以使用哪些動詞或名詞或形容詞,來構成一個正確的句子語法。
而點選一個你感興趣的結果,右下方就會顯示他的各種例句。
 
5. 如何搜尋一個詞匯的所有變化型態?
如果不是要查詢語句的用法,而是要找某一個單字的各種變化型態,這時候我們可以用 [eat] 這樣的語法,去找到這個單字的所有變化型。
 
6. 如何查詢同義字?
而要找到這個單字的其他同義字,以及相關同義字在各種文本上的使用方式時,我們把搜尋語法改成: [=speak] 就可以找到一個單字的各種同義但或許更專業的用法。
透過上述簡單的方法,我們就能好好利用「COCA 美國現代英文語料庫」龐大的五億語料庫,從這個美國現代文本資料裏,找到當代英語更準確的使用方法,推薦有需要的朋友試試看。

所有跟帖: 

thx! 擺脫蹩腳, my中英語奧秘幫助更透徹 -走馬讀人- 給 走馬讀人 發送悄悄話 走馬讀人 的博客首頁 (0 bytes) () 01/12/2016 postreply 05:27:29

寧願一tou滿足 secret found -走馬讀人- 給 走馬讀人 發送悄悄話 走馬讀人 的博客首頁 (0 bytes) () 01/13/2016 postreply 04:52:42

謝謝介紹。 -井龍和- 給 井龍和 發送悄悄話 井龍和 的博客首頁 (0 bytes) () 01/13/2016 postreply 11:28:29

Thanks! -~葉子~- 給 ~葉子~ 發送悄悄話 ~葉子~ 的博客首頁 (0 bytes) () 01/14/2016 postreply 13:19:27

去看過了,很不錯。存了,謝謝分享! -肖莊- 給 肖莊 發送悄悄話 肖莊 的博客首頁 (0 bytes) () 01/16/2016 postreply 20:44:36

請您先登陸,再發跟帖!