正文

科技文獻檢索與分析的方法(第二部分:專利檢索)

(2010-05-02 19:36:50) 下一個

第二部分

對於專利這塊,將會介紹很多與專利相關得重要數據庫及其特色,希望對大家的工作學習有所幫助,我會盡可能得客觀評價數據庫和軟件,可能會有一些個人偏好,請大家見諒。

因為專利畢竟是法律文件,受法律保護,有嚴格的格式。同樣,在專利領域中,檢索專利的目的有很多種。做研發的,想了解目前的技術情況,看是否有人已經申請了專利;自己能否在被人的基礎上加以改進,以繞過別人的專利保護圈;可能是為了進行專利戰略分析,尋找新的發展機會;可能是為了尋找侵權者;無形資產評估等等方麵。

不同的人對於檢索專利有不同的要求。因此,目前在專利市場上有免費的數據庫,例如各個國家的知識產權局,有收費的專利數據庫,例如Delphion, Aureka,Dialog,STN,Questl-Orbit,Micropatent的PatentWeb等等。收費有收費的好處。免費的東西畢竟還是有些問題的,例如EP的專利檢索,大家都喜歡到歐洲專利局去檢索,但是去那裏檢索主要兩個問題:

  1. 檢索係統太糟糕,檢索的結果有很多垃圾。為什麽呢,在EP網站上檢索,對於主題檢索而言,可利用的字段就是標題和文摘,而很多專利的標題和文摘並不能完全反映專利技術的重點,因此在做檢索的時候,會產生很大的漏檢或是垃圾;
  2. 有500篇限製,即V2 和V3的區別。這些都極大的限製了用戶對專利的獲取。可能有人這時就會出來說,美國就很好啊。確實,這點我們要承認,畢竟美國有錢,做出來的東西確實不一樣。而且還曾經獲過大獎。但是有一點是沒有錯的,就是在專利申請時,為了避免被競爭對手發現自己的技術路線,會盡可能的將自己的專利用非常模糊的語言去改寫,從而達到避免被人檢索出來的目的。因此,就算在美國這麽好的地方,在商用上,還是有問題。

在這,收費數據庫有了市場。畢竟在商業社會,免費的東西有那麽多的問題,用的讓人太不放心了。比較好的收費數據庫主要是指那些對專利經過深加工的數據庫。專利數據領域內很有名的就是Thomson公司的 Derwent數據庫,針對所有的專利,覆蓋了全球幾十個國家和地區專利,是世界上最好的專利數據庫,還有美國的CA,主要針對化學,法國的 PharmPat藥物數據庫,中國在這方麵也有一些比較不錯的,例如國家知識產權出版社作的中醫藥數據庫,北京東方靈盾科技有限公司作的世界傳統醫藥數據庫(好像還沒有上市,網上有介紹)。

下麵,我重點介紹一些Derwent數據庫一些很好的特性。

這個數據庫在Delphion,WOK(即在Web of Knowledge數據庫中的DII),DIALOG(Dialogweb, Dialogone, Dialogclassic),STN(web和easy),QUESTEL-ORBIT。上述幾個數據庫,對於不同檢索能力的用戶可以選擇不同的數據庫,一般而言,DIALOGclassic,STNWEb,QUESTEL-ORBIT(這個國內用的人很少,偶也沒有用過,無法評論),適合於專業的檢索人員,用指令式檢索。而Delphion,DII,Dialogweb則適合各個層次的用戶。Dialogon,Stneasy則適合初學者。

Derwent對每條專利記錄的標題和文摘都重新進行了改寫,用更加簡明易懂的語言,便於檢索人員能夠檢索到這條記錄。此外,Derwent還增加了很多字段,有申請人代碼,Derwent手工代碼(MC),Derwent分類(DC)等等。申請人代碼非常有用,是Derwent匯集了世界上專利申請量很大的大公司,並對其進行分類得到的代碼表。

你可以在下麵這個網址進行在線查詢你所需要的申請人代碼http://scientific.thomson.com/support/patents/dwpiref/reftools/companycodes/lookup/ 。例如,IBM有很多分公司,其代碼是IBMC,通過查找就可以得到如下IBM公司的列表:
IBMC CIE IBM FRANCE
IBMC IBM BRASIL IND MAQUINAS & SERVICOS LTDA
IBMC IBM CANADA LTD
IBMC IBM CORP
IBMC IBM DEUT GMBH
IBMC IBM DEUT INFORMATIONSSYSTEME GMBH
IBMC IBM INST MIKROTECHNIK MAINZ GMBH
IBMC IBM INT BUSINESS MACHINES CORP
IBMC IBM ISRAEL LTD
IBMC IBM JAPAN LTD
IBMC IBM KK
IBMC IBM NEDERLAND NV
IBMC IBM OESTERREICH
IBMC IBM PATENT OPERATION
IBMC IBM SEMEA SPA
IBMC IBM SEMEA SRL
IBMC IBM SVENSKA AB
IBMC IBM UK LTD
IBMC INT BUSINESS MACHINES CORP

如果在普通數據庫中進行檢索,很難保證一次性就把所有的IBM公司的專利檢索全,但是你用Derwent的公司代碼表,即可盡大可能的保證你的檢索精度

Derwent手工代碼(MC)則可以看作是專利領域中的IPC。IPC過幾天就升級到第8版了。但是出發點不一樣,一個是從功能角度,一個是從應用角度。舉一個簡單例子(引自《中外專利數據庫檢索指南》P199-203),現在要檢索一個課題,名稱是:一種裝置,在錄像機上能根據用戶眼睛凝視的方向自動對物體定位(自動聚焦)。用正常的方法,關鍵詞,自動對焦,錄像機?檢索結果有很多垃圾,在這個例子中用關鍵詞很難描述這個裝置,但是在IPC中也沒有什麽合適的分類可以利用。

這時可以考慮用Derwent手工代碼,在初檢索中所有與錄像機測距和聚焦有關的記錄相關的代碼是W04-M01D2C,而 S05-D01C5A則包含了非醫療用物體的電氣或電子測量,可用於檢索依靠手指按壓控製或依靠飛行員眼睛運動以控製飛機的方麵的課題。將上述兩個代碼進行邏輯組配,即得到了非常相關的結果。從這個例子可以看出,用Derwent手工代碼可以得到一個很滿意的結果。

在專利檢索中,檢索的思路和科技文獻大致相同。但是由於專利的一些特點,其檢索的自由度可能會更大些。在這,假設你已經對專利有了解了,不懂就去看書吧。

偶的一般做法,了解課題,看需要檢索什麽,而後就開始初檢,找到一些很合適的紀錄,找IPC,MC,DC,到處撒網,然後找到一些合適的,同時也排出一些垃圾,再次進行檢索,有的時候還會用上一些統計分析方法,找到最合適的MC,DC。這些步驟可能來回好幾次,最終才能確定一個很好的檢索式。有人覺得很麻煩,但是如果你的數據是用來做分析的時候,就非常有必要的。Rubbish in,Rubbish Out。

在Derwent中還有一個很好的功能就是引證專利檢索。可以找到一篇專利所有引證他人或是被引證的數據。這個功能好在,可以看到那些公司引證了這篇專利,你就大概可以做出如下判斷:

  1. 技術是否從這篇專利所有人那裏流失,即別人在上麵作了很多開發,改進;
  2. 是否後來人有授權可能性;
  3. 技術走向,這時可以參考IPC,MC,DC等等。

專利引證這個在專利評估領域非常複雜,可以寫本書了,偶也研究不深,不敢亂發言,到此為止。
這些引證數據可在Delphion和Aureka中以非常直觀的圖形顯示。在Delphion還有一些其它功能可以幫助你更好的檢索和分析數據。例如文本聚類,還有一個統計功能。這些回頭貼圖。
在Aureka中,專利檢索,分析,管理的功能更強大。可以做出非常好的文本聚類分析,形成直觀的專利地圖,很強。太強了。

說明:文中“我”指的是原文作者。文章來源於互聯網,作者不詳,在此表示感謝。

[ 打印 ]
閱讀 ()評論 (5)
評論
目前還沒有任何評論
登錄後才可評論.