中國醫院占據前三名
近日,《自然》雜誌發布了一份研究報告,首次從機構層麵對全球論文撤稿現象進行係統性分析。
在《自然》統計的“撤稿率最高機構”中,中國山東濟寧市第一人民醫院以超過5%的撤稿率(2014-2024年)成為世界上撤稿率最高的科研機構。該院平均每發表20篇論文,就有1篇被撤回,撤稿率超過全球平均水平50倍以上[1]。
濟寧市第一人民醫院早在數年前就出現大規模的學術不端事件。2020年,加州學術誠信調查員伊麗莎白·比克(Elisabeth
Bik)發現了400
多篇內容高度雷同,疑似來自統一論文工廠的論文,這些論文幾乎全部來自中國的幾十家醫院,其中濟寧市第一人民醫院的論文最多,超過100篇[2]。
在事件曝光後,據《澎湃新聞》報道,濟寧市第一人民醫院從2021年9月7日到2022年1月21日陸續發布10份通報,涉及107篇論文和107起學術不端事件,對相關責任人分別給予院內通報批評、科研誠信誡勉談話、黨內警告、行政警告、免職等處理措施[3]。
在自然的新研究中,分列撤稿率榜單二三名的是河北滄州市中心醫院、河南大學淮河醫院,撤稿率約為3.5%左右。在撤稿率前十的機構中,中國機構占據七席,均是醫院以及醫學院。除上述三家醫院,濰坊市人民醫院、臨沂市人民醫院、新鄉醫學院第一附屬醫院、齊齊哈爾醫學院也進入了前十。其他三席由巴基斯坦的加齊大學、埃塞俄比亞“亞的斯亞貝巴”(Addis
Ababa)理工大學、印度KPR工程技術學院占據。
《自然》的撤稿分析基於三家研究誠信公司提供的數據:Scitility的Argos、Research
Signals的Signals,以及Digital Science的Dimensions Author
Check。這些公司通過整合Retraction
Watch(撤稿觀察)的數據庫、Crossref的出版數據、PubMed的索引以及期刊網站信息,構建了全球撤稿數據集。
雖然不同數據來源得出的結果有差異,但機構撤稿仍有一些共性規律,中國小型醫院和醫學院始終占據著主導地位。
根據Dimensions的數據,在撤稿率超過1%的136家機構中,大約70%為中國機構,其中接近60%為醫院或醫科大學。Argos數據庫統計的186家撤稿率1%以上的機構,也呈現出相同的規律。對不同類型機構的分析還顯示,中國醫院的撤稿率普遍高於高校,屬於撤稿率最高的一類機構。
醫院是學術不端的重災區。2023年國家自然科學基金委第一批不端行為案件處理結果通報中,8起案例有7起當事人都是來自各醫院、醫學院、醫科大學。2023年第二批通報中,也有三分之一案例和醫院、醫學院相關。基於2015年至2020年國家自然科學基金委員會通報數據的一項研究也顯示,被處理的人員中專業為生物醫藥類的占比約75.9%[4]。
一項通過人工智能算法識別論文工廠論文的研究顯示。論文工廠最初產量隻有每年幾篇,至2014年已達每年上百篇,而自2018年起更是躍升至每年上千篇。在SCI收錄的論文中,醫院是論文工廠產出論文的主要來源,占比高達67.5%。進一步分析全球醫院發表的SCI論文發現,幾乎所有的論文工廠論文均出自中國的醫院[5]。
這些醫院暴露的問題高度相似,年輕醫生為滿足職業晉升的論文要求,不得已從“論文工廠”購買偽造數據或直接發表偽造的論文。伊麗莎白·比克指出,這些醫生承受著巨大的壓力,因為他們必須發表論文才能獲得工作或晉升。
在《知識分子》過去關於撤稿問題的文章中,一位青年研究人員曾經介紹,很多省份的衛健委都規定評職稱需要論文,而且有很嚴格的計分的方式,不隻是篇數的問題,還要考核影響因子。近年來隻有廣東等少數地區不再把論文作為評職稱的必要條件。
“很多人斥責掠奪性期刊,但很多醫生沒有辦法,必須要發論文才能評職稱,所以甘心被掠奪。根本性的原因可能還是逼良為娼的製度。”這位學者說[6]。
誰是撤稿大國
統計過去10年的撤稿數量,排名前列的不少中國機構。但值得注意的是,隻統計過去5年(2020—2024)撤稿數量,印度和沙特阿拉伯的幾家科研機構主導了榜單,這是因為它們在2023年Hindawi的撤稿潮中受到了更大的影響。
2023年,Hindawi發布了超過9,600篇撤稿聲明,撤稿數量史無前例。本次《自然》研究報告也顯示,Hindawi是撤稿的重災區,旗下4種期刊自2014年以來的撤稿率超過20%,另有4種超過10%,占據了期刊撤稿排行榜的最前列。
這些撤稿論文也有部分中國科研人員參與。受到此次撤稿事件影響,2024年初,教育部科學技術與信息化司發布通知,要求各高校開展撤稿論文自查工作。全麵檢索中英文科技文獻數據庫,對過去3年來本單位、本人署名(第一作者、通訊作者)的科研論文被撤稿情況進行全麵梳理,核實論文撤稿的原因,並嚴懲學術不端行為。
教育部的撤稿自查通知指出,這些撤稿行為以及其他出版商的撤稿行為“已對我國的學術聲譽和學術環境產生了不利影響”。
不過撤稿數量很大程度上和機構和國家的體量有關,排在前列的撤稿概率未必突出。從撤稿率看,2014至2024年間,在全球範圍內過去十年中發表的
5000 萬或更多篇文章中,有大約 4 萬篇(不到
0.1%)被撤稿。中國學者參與的撤稿論文占比近60%(逾2萬篇)。目前中國整體撤稿率約為0.3%,三倍於全球平均水平。
埃塞俄比亞與沙特阿拉伯的撤稿率甚至比中國要更高,根據不同的數據源,伊拉克與巴基斯坦以及俄羅斯撤稿率也與中國的水平相當。相比之下,美國、英國等國的撤稿率約為0.04%,遠低於全球0.1%的平均水平,許多國家甚至更低。總體來看,中國的撤稿率大致排名在第3到第5之間。
撤稿的原因,也有可能是無心之失或者編輯上的錯誤,但證據表明,大多數案例與學術不端行為相關。《自然·人類行為》今年年初的一篇評論文章調查顯示,20.5%的中國撤稿論文和論文工廠有關[7]。
仍在增長的撤稿
盡管撤稿並不是一個大概率的事件,但在2014到2024年間,撤稿聲明(期刊宣布論文撤回的公告)的增長正在加速,公告數量從2014年不到2,000,增長到2023年超過12,000。這一方麵是由於論文工廠的興起,另一方麵是學術偵探發現了更多的問題。
從2014年到2022年,論文撤稿率呈現出顯著上升的趨勢,2022年發表論文的撤稿率已達約0.2%。2023年和2024年的撤稿數據看起來比較低,但可能是因為這兩年發表的論文還沒有經過足夠的時間來暴露問題。通常情況下,論文的撤回需要一段時間,比如幾年後才會被發現和撤回。
盡管全球撤稿率持續上升,但已曝光的問題可能僅是冰山一角。法國圖盧茲大學計算機科學家紀堯姆·卡巴納克(Guillaume
Cabanac)認為,一些領域或機構之所以擁有較低的撤稿率,可能僅僅是因為它們避免對存在的問題進行調查。
在去年發表在《自然》上的評論文章中,紀堯姆介紹了自己開發的用來檢測學術論文中“扭曲短語”(Tortured
phrases)的工具。人工智能生成或者多次翻譯以逃避抄襲檢測的論文中,可能會有一些無法理解的短語出現。
比如人工智能(Artificial intelligence)被翻譯成偽造意識(Counterfeit
consciousness)或者人造腦力(Man-made
brainpower)。前段時間,中國一篇把摘要(Abstract)翻譯成抽象(Pumping
elephant)的撤稿論文也犯了這類錯誤。因為Abstract在一些翻譯軟件上會被譯成“抽象”,抽象兩個字拆開來翻譯到英文就出現了Pumping
elephant這種看不懂的詞。
如果一篇文章出現多個這類錯誤,那造假的可能性可想而知相當高。截至 2023 年 8 月 20
日,紀堯姆開發的工具已經發現16,000 篇引用了 5 個或更多此類扭曲短語的論文,但被撤稿的隻有18%[8]。
催生畸高撤稿數量和比例的,可能是鼓勵發表的短視政策。
印度的自由數據科學家、印度研究觀察組織(IRW)創始人阿查爾·阿加瓦爾(Achal
Agrawal)發現,印度高撤稿率機構幾乎全部集中在教育重鎮泰米爾納德邦的私立院校,這符合他的分析。在他看來,印度公立大學和政府機構的研究人員麵臨的發表壓力小於私立機構,私立機構不僅鼓勵學生和教師多發論文,某些情況下還為發表論文提供獎金。
在2024年1月發布的預印本論文中,阿加瓦爾曾對撤稿觀察數據庫中25個國家的撤稿數據進行簡單的研究,發現過去五年論文出版數量和撤稿聲明率有著高度正相關,發文數量大量增長的國家往往撤稿率也迅速提升。雖然相關不代表因果,但不健康的激勵製度很可能是高撤稿率的元凶。
“這讓人對目前重數量輕質量的激勵製度提出質疑,”阿加瓦爾寫道[9]。
參考文獻:
[1]Richard Van Noorden. (2025). Exclusive: These universities
have the most retracted scientific articles. Nature.
[2]麻省理工科技評論.(2020).驚天學術造假!400餘篇論文或來自同一“論文工廠”,涉及數十家中國醫院.
[3]賈利略.(2022).濟寧市第一人民醫院10月被撤6篇論文:編造研究過程、代寫代投.《澎湃新聞》
[4]陳賓賓 &
薛建龍.(2022).高校科研誠信總體情況實證分析及治理建議——基於國家自然科學基金委員會2015—2020年通報案例.今日科技(09),66-68.
[5]邸利會.(2022). 中國醫療界為何治不了自己論文造假這個 “病”?.《知識分子》
[6]張天祁.(2024). 中國掀起撤稿自查風暴的背後.《知識分子》
[7]Xu, S. B., & Hu, G. (2025). Combating China’s retraction
crisis. Nature Human Behaviour.
[8]Cabanac, G. (2024). Chain retraction: how to stop bad science
propagating through the literature. Nature, 632(8027), 977–979.
[9]Agrawal, A. (2025). Country-wise Retraction Analysis from
2022-2024. Increased Publishing Leading to Higher Retraction
Rates.