後SCI時代,拿什麽來評價人才和科技成果 精選
| 推薦到群組
後SCI時代,拿什麽來評價人才和科技成果
李俠
炎熱的七月,對於中國學界而言,最火爆的事情不是天氣而是科技評價體係可能麵臨的變革。這個事情的直接導火索就是,2016年7月11日湯森路透公司(Thomson Reuters)正式宣布將於未來幾個月內以 35.5 億美金出售旗下的知識產權與科技業務,其中就包括中國科學界最為熟知和敏感的 SCI業務 。至於接手的新東家(Onex Corp 和霸菱亞洲投資)將如何處理與定位SCI,一切尚不為人知?僅就商業並購而言,這是一次很普通的商業事件,之所以引發人們的熱議,是因為以SCI作為科研考評手段已經滲透到中國科技管理體製的血液中,經此一變,管理部門與從業者真不知道未來該如何去評價與做科學了?
SCI(科學引文索引的簡稱)原本是美國科學計量學家加菲爾德(Eugene Garfield,1925-)於20世紀50年代首先提出的設想,並於1964年首次發布SCI。客觀地說,SCI首先是作為一種檢索工具開始被認知與發揮作用的,時至今日,這個功能也是非常強大的;其次,才衍生出科技評價功能。SCI設想的出現,源於加菲爾德敏銳地意識到:隨著二戰結束後美國加大科技投入,科技產出必將快速增加,此時信息的收集、檢索與評價就成為非常緊迫的任務,由此推動他開發SCI的檢索係統,事後證明這項工作極大地推動了科技的發展,並衍生出很多新的功能,如影響因子(IF)等,而這些新的功能直接影響了科技工作者的研究偏好與研究方向的選擇。在此基礎上,加菲爾德提出著名的文獻集中定律,即80%的有價值的學術文章發表在20%的學術期刊上,由此,也開啟了學者對於著名期刊的崇拜情結。
SCI作為科技評價工具在中國科技界的登場,始於上個世紀80年代末,南京大學是始作俑者。客觀地說,當初的引進目的有二:其一,避免人情對於科技評價的幹擾,還科學評價以客觀性;其二,樹立一種路標,起到導向作用。改革開放之初,國內科技水平很低,也沒有像樣的評價體係,引入SCI也相當於借船出海。因此,就SCI引進初衷而言,這些設想雖然不完善但基本上還是合理的。問題在於,中國的改革是單邊改革,即隻關注狀態改革,而不去關注體製結構的改革,管理者一旦擁有這個法寶,並取得一些可見成績後,就肆意擴大化。這就造成科技管理部門的進步速度遠遠趕不上科技發展的速度,為了掩蓋這種認知上的落差,管理部門隻好越來越依賴SCI作為科技評價工具。
由此而來,文章越來越多,而真正解決實際問題的研究卻越來越少。科技界又是聰明人紮堆的地方,一些人開始意識到這套遊戲規則背後的秘密,然後開始充分利用這套規則的缺陷,去套取由之而設的獎勵。在短期內,數據非常漂亮(短短三十年的時間,中國已是世界上第二大SCI論文生產國),這份成績單既滿足了管理者的政績要求,又滿足了公眾的自豪感,同時還讓科技界那些腦袋靈光者賺的缽滿盆滿的,一派繁榮景象,這真是一個多贏遊戲。這期間偶爾也會出現一些學術不端事件,然而在群情亢奮中,這些缺陷總會被善意地辯護。直到某些突發事件出現以後,竟然發現沒有合適的應對之策。那座曾經宏偉的科學大廈竟然不能解決來自生活中的諸多不是“難問題”的問題,這一刻,公眾開始意識到,那座看起來很美的科學城堡原本是金玉其外,敗絮其內,中看不中用。這個時候人們開始去反思如何評價科技成果和人才是合適的?一個會寫文章的醫生和一個會動手術的醫生哪一個是病人最需要的?治理鹽堿地和一篇不鹹不淡的SCI論文哪一個對於國計民生意義更重要?回想新世紀的這十五年,SCI已經成為中國科技界的通行證和萬能鑰匙,擁有它可以順利畢業、可以晉升職稱、可以申請到項目、可以結題,還可以獲得眾人仰慕的各類稱號,贏者通吃已不是傳說。在科技界的江湖,SCI就是倚天劍和屠龍刀。為了它,科技界衍生了多少恩怨情仇,正所謂:少年子弟江湖老,紅粉佳人白了頭。
坦率地說,時至今日,SCI的評價標準已經潛移默化為中國科技共同體行動的無形指揮棒,根深蒂固,短期內很難去除。一個最初作為評價手段引進的工具,在三十年後終於搖身一變成為研究目的。在見證如此滄海桑田之變的時刻,不妨回顧一下:我們造就了無數SCI英雄,但就是沒有創造出一些引領世界的重大創新成果。這種評價模式造成的科技界的扭曲狀況是不能令人接受的。那麽,在後SCI時代,我們將怎樣評價科技成果與人才呢?
後SCI時代,如何約束管理者的自由裁量權?
如果說引進SCI有什麽深遠影響的話,那麽,它唯一的益處就是基於公平並最大限度上約束了管理者在科技評價中的自由裁量權問題。所謂公平是指,它看重雜誌本身(以及衍生出來的影響因子)而不看重研究者的身份與地位,這相當於羅爾斯提出的“無知之幕”,由此導致評價結果從程序上是公平的。由於程序公平,它實現了最大限度上遏製權力對於評價過程的幹擾與影響。在一個盛行官本位的社會,這套模式之所以能被廣大科技工作者熱捧與認同,並被奉為圭臬,其原因皆在於此。問題是,科研成果並不僅僅是論文可以完全覆蓋的,科技是一個非常龐大的建製,其涉及的領域千差萬別,其成果產出形式也是千差萬別,僅憑論文是無法完全代表的。那麽,那些無法用論文代表的科研成果與人才該如何評價呢?坦率地說,這是一個世界性的難題,時至今日,並沒有形成一個全世界公認的評價範式。
由於我們的科學研究的根基比較淺,還沒有形成一個自律感較強的共同體與科學文化,再加上這些年科技管理部門的懶政,目前並沒有一套得到公認的現成辦法,其中最大的困難仍舊是不知道該評價什麽?在這個模糊區間,管理者的自由裁量權又可以肆意越界。這就是為什麽人們都知道SCI評價存在問題,但一直容忍它存在的深層原因。畢竟,相比於管理者的自由裁量權而言,SCI的標準雖然狹窄,但其公平,這是共同體成員在兩害相權取其輕的內在偏好主導下的一種不得已的選擇而已。其實,評價科技成果和人才的困難在於我們不了解科技成果的智力屬性,從而造成評價的困境。
道理很簡單,不同的科技成果是由人類的不同智力要素實現的結果。因而,隻需要把人類的不同智力要素揭示出來,然後針對這些特定要素再製定有針對性的評價規則即可。現代心理學以及認知科學等的研究成果已經能夠證明人類智力的多元要素結構。如哈佛大學心理學家加德納(Howard Earl Gardner,1943-)在1983年提出多元智力論(theory of multiple intelligences),他認為智力不是單一的概念,而是多元的,而且各種智力之間是相對獨立的,他通過研究認為通常人有8種智力(語言智力、數理-邏輯智力、空間智力、音樂智力、身體-運動智力、社交智力、自我認識智力、自然觀察者智力)。不論加德納的這些智力要素集合是否完備,但是有一點是可以肯定的,即智力是由多要素構成的。以不同智力要素為主產生的成果也不能一刀切采取一個評價標準,比如音樂和體育的評價標準就是不一樣的。我們再來看一個與之類似的簡化版本,這就是美國心理學家斯坦伯格(Robert Sternberg,1949-)在1985年提出智力三元論(Triarchictheory of intelligence),在斯坦伯格那裏智力包括分析能力、創造能力與實踐能力。結合這些成果,我們可以清晰發現以分析能力為基礎的科技成果是可以采用SCI這類評價標準來評判的,但是以創造能力為基礎的科技成果就不能完全采用論文這種評價模式,可以輔之以專利等市場標準來評判,要知道市場對於創新是最敏感的。對於以實踐能力為基礎的科技成果可以采用經濟指標與市場認可為評價標準。如文藝作品的評價,完全可以采用市場模式來評判,工程技術類(包括文史哲類)產品可以采用市場與專家的綜合評價。對這些存在區別的評價標準不能厚此薄彼而要給予同等承認。這樣一來就會最大限度上避免SCI評價範圍擴大化的問題,而且這種模式也可以最大限度上約束管理者的自由裁量權帶來的混亂與尋租現象。隻要想想經過市場評價的鄧麗君歌曲,這麽些年過去了,我們仍然覺得很美、很動聽,這就是市場評價帶來的客觀結果,相反,當年那些被權力的自由裁量權幹擾評審出來的獲獎歌曲,如今早已被人們丟進曆史的垃圾堆,其原因就在於此。
一旦SCI評價範圍被限製與被弱化後,如何重新設立有效的激勵機製,並使科技進步與社會福祉最大化成為可能,就是後SCI時代的科技管理者必須解決的問題。
後SCI時代的鑒別成本與激勵機製
管理者之所以喜歡采用SCI作為評價標準,不是因為他們不知道其中存在的局限與困境,而是因為采用SCI所具有的潛在收益巨大,因而無法舍棄而已。拋開這些收益(管理者的政績訴求、公平的口碑、操作簡單等)不談,采用SCI的一個明顯優勢就是降低整個社會的鑒別成本,換言之,成果的鑒別被變相地委托給了期刊、雜誌,而管理者不用費心就可坐享其成。何樂而不為呢?再加上西方的科技水平比我們普遍高,因而這個結論遭到質疑的風險也比較小。綜合這些因素,SCI的流行是管理者為主,科技共同體有意配合的一次合謀行為。千萬別小瞧這個問題,在大科學時代,專業化分工如此深入,鑒別一項成果是極其昂貴的行為,對於整個社會而言,這個鑒別成本是非常巨大的,甚至是整個社會無法承擔的。隻要看看當下社會對於人才出身的變態性關注,不也反映了在鑒別成本約束下所導致的節約型選擇模式嗎?基於統計學規律,隻要你是好學校畢業的,那麽你的水平和能力就是有保證的,也是可信賴的。就如同成果發表在高影響因子期刊上被認為重要一樣,因為學校(期刊)為人才(成果)提供背書。盡管這種鑒別方式存在很大的誤差,但符合節約成本原則。那麽,在後SCI時代,如何降低鑒別成本呢?在筆者看來,對智力成果進行分類,然後利用市場接受與專家共同體的評判相結合是一條可行的道路,因為市場鑒別的成本是由社會承擔的,而且社會的鑒別比較客觀。一項技術成果的好壞,市場對它的檢驗是比較苛刻的,也是高度敏感的。以往對研究的分類所采用的:基礎研究、應用研究與試驗發展研究,仍是基於小科學時代的簡單認知框架做出來的,並沒有反映出各類成果產生的主要智力要素。在今天這種分類已經造成評價的困難。
降低鑒別成本隻是問題之一,還有一個老問題也需要解決,即SCI評價模式擴大化蘊含著潛在的道德風險問題。這裏的道德風險可以簡單地看成:為了獲得發表SCI的獎勵,可以采用一些技術性措施,如把一篇文章拆分成幾篇文章來發表(學術界把這些做法稱為最小出版單元或薩拉米香腸式的發表),以此獲得最大收益,而這種做法是與科學的精神氣質不符的,這時就會出現道德風險。道德風險的出現責任不僅僅在於個人,更在於製度設置出現了問題。在信息不對稱的背景下,作為理性的個體去追求利益最大化本無可厚非,但是這裏存在一個問題,即這些聰明的個體所獲得的多餘收益是由全體納稅人買單的,這是不可接受的。隻要管理部門有興趣可以到SCI網站上去找一些發表記錄超級強悍的作者,看看他們的文章解決了什麽科學問題?又取得了哪些突破或者創新,以及通過這些文章個人又獲得了什麽收益(項目、稱號等),以及兩者之間是否相稱,相信會有一些讓人震驚的發現。更為嚴重的是,這種現象延長了歧視性政策的生命周期,而歧視性政策通過累積作用會扭曲群體的認知,這個後果早已被社會心理學的研究所證明。
道德風險的蔓延揭示出科技管理中長期存在的“委托——代理”關係中存在問題,我們設定管理部門是委托者,那麽科技共同體就是代理人。由於雙方之間存在信息不對稱現象,以及成果鑒別的困難,委托者如何激勵代理人去努力工作呢?簡單的去數SCI,顯然無法激勵代理人投入巨大精力對解決真正重大的科學問題,隻會尋找付出最少的簡單問題去做。由此可見,靠SCI去進行科研管理存在很大的道德風險,而且真正的損失都是國家買單,這是懶政行為。為了避免這種危險,管理部門傾向於采取過多、過頻的檢查,以此對代理人形成激勵,但這種做法又會造成對研究的幹擾,那麽合理的解決辦法在哪裏呢?
後SCI時代,委托-代理的關鍵在於,激勵代理人的努力供給。換言之,讓代理人的努力付出有超過以往數SCI時的收益。作為委托人的管理者不能太摳,一分價錢一分貨,這是市場的鐵律。筆者以前曾提出對優秀成果實行事後贖買製,其實質也在於對努力供給的一種補償與激勵。另外,對於那些不肯付出相應努力的代理人實行懲罰。胡蘿卜和大棒都是必要的,缺一不可。前些年筆者一直批評那些所謂的重大項目,原因就在這裏:縮水嚴重。沒有一個重大項目不結題,但又沒有多少重大項目取得重大成果。
【博主跋】這篇小文章是上個月放假前寫的,現發在《今日科苑》2016(8),與曹老師和許老師合作愉快,是為記!
2016-8-27於南方
說明:文中圖片來自網絡,沒有任何商業目的,僅供欣賞,特此致謝!