近日,英國劍橋晶體學(xué)數(shù)據(jù)中心(CCDC)發(fā)現(xiàn),來自810篇論文中的近1000個晶體結(jié)構(gòu)數(shù)據(jù),竟是出自同一家論文工廠制造生成。
這打破了該數(shù)據(jù)庫可疑條目的歷史紀錄。更嚴重的是,這可能只占“虛假數(shù)據(jù)總數(shù)中的很小一部分”。目前CCDC正在審查中。一些在研究中經(jīng)常使用該數(shù)據(jù)庫的科學(xué)家表示,涉嫌欺詐的規(guī)模讓他們感到震驚。
(資料圖片僅供參考)
經(jīng)查證,這些文章的作者幾乎都來自中國。其通訊單位包括清華大學(xué)、浙江大學(xué)、同濟大學(xué)、廈門大學(xué)、西安交通大學(xué)等高校的附屬醫(yī)院,作者中不乏副教授、科室主任、副主任等。
隨后,施普林格?自然、愛思唯爾、威立、泰勒-弗朗西斯4家出版商對涉事期刊和論文展開調(diào)查。可以預(yù)見,調(diào)查完成后將迎來批量文章撤稿。
歷時8年,810篇均產(chǎn)自一家論文工廠
事件發(fā)端于4月15日,預(yù)印本平臺Research Square上發(fā)出的一篇文章。
該文確認,同行評議網(wǎng)站PubPeer上由評論者標記的810篇論文來自同一家論文工廠,發(fā)表時間跨度為2015-2022年。
該篇預(yù)印本的作者、退休的心理學(xué)研究員大衛(wèi)·比姆勒(David Bimler)指出,這家論文工廠專門研究虛構(gòu)出來的金屬有機晶體,并據(jù)此發(fā)明出治療方法。其特點是對已有圖像的再利用,古怪的短語措辭,可疑的電子郵件地址,在參考文獻部分引用來自與其相隔甚遠領(lǐng)域的、不相關(guān)的研究。
美國哈佛醫(yī)學(xué)院生物化學(xué)家Jon Clardy表示,“論文工廠將金屬有機結(jié)構(gòu)與癌癥免疫療法等醫(yī)學(xué)應(yīng)用結(jié)合起來‘非常聰明’,因為人們深入研究這兩個主題的可能性很小。”
值得注意的是,這些論文的作者幾乎都來自中國。據(jù)作者及通訊地址信息,這些作者來自全國各地的醫(yī)院,其中有不少來自清華大學(xué)、浙江大學(xué)、同濟大學(xué)、廈門大學(xué)、西安交通大學(xué)等知名“985”高校附屬醫(yī)院,其余的還有南通大學(xué)、青島大學(xué)、河北醫(yī)科大學(xué)、安徽醫(yī)科大學(xué)等的附屬醫(yī)院,不乏副教授、科室主任、副主任等。
預(yù)印本文章提到,中國的政策要求醫(yī)生進行研究,或者至少發(fā)表研究結(jié)果。這種壓力帶來的一個可預(yù)見結(jié)果是“論文工廠”的出現(xiàn),即建立學(xué)術(shù)代筆的生產(chǎn)流水線,批量制造論文手稿,賣給那些由于時間、資源、培訓(xùn)或能力不足而無法進行研究的客戶。
或?qū)⒋蚱艭CDC撤稿歷史
這篇文章發(fā)出后,很快引起了CCDC的重視。
4月28日,CCDC發(fā)布通知稱,已經(jīng)開始調(diào)查“潛在欺詐數(shù)據(jù)”,工作人員正手工檢查每個條目。相關(guān)負責人Suzanna Ward表示,“早先,例行檢查時,我們已經(jīng)對某些結(jié)構(gòu)產(chǎn)生了懷疑,后來了解到預(yù)印本文章后,展開了更大規(guī)模的調(diào)查。”
截至目前,CCDC已對預(yù)印本中涉及的992個數(shù)據(jù)條目發(fā)出關(guān)注,有9篇論文及相關(guān)的12個晶體結(jié)構(gòu)已被撤回。
CDCC作為晶體學(xué)數(shù)據(jù)庫,可追溯至1965年。一直以來,該數(shù)據(jù)庫致力于搜集整理有機小分子和金屬有機分子的晶體結(jié)構(gòu)數(shù)據(jù),目前已列出近120萬種數(shù)據(jù)條目。該領(lǐng)域的許多期刊要求研究人員將其結(jié)構(gòu)數(shù)據(jù)存入CCDC,這家數(shù)據(jù)庫也是化學(xué)和生物化學(xué)研究者尋找晶體結(jié)構(gòu)信息的首選。
當個別論文被撤稿時,數(shù)據(jù)庫中的相應(yīng)條目隨之撤回。在此之前,總共只有不到300個數(shù)據(jù)條目被撤回。該數(shù)據(jù)庫上一次較大規(guī)模的撤回發(fā)生在2010年,撤回了70個虛假數(shù)據(jù)條目。顯然,此次的標記和可預(yù)見的撤回,將會打破CCDC的歷史紀錄。
虛假的結(jié)構(gòu)數(shù)據(jù)會造成真實危害。大量研究人員使用CCDC數(shù)據(jù)庫來開發(fā)藥物,虛假數(shù)據(jù)最終會浪費科研時間和經(jīng)費。
4大出版商展開調(diào)查
涉事的期刊出版商也對預(yù)印本的指控展開了調(diào)查。
施普林格?自然誠信研究總監(jiān)Chris Graf表示,該公司正在調(diào)查至少5種期刊上發(fā)表的157篇論文,但現(xiàn)在得出結(jié)論為時過早。他說:“如果這些擔憂被證明是有根據(jù)的,期刊將非常支持出版業(yè)合作解決論文工廠的問題。”
出版商威立表示,已經(jīng)撤回預(yù)印本文章中列出的2篇文章,均出自《中國化學(xué)學(xué)會雜志》。目前正在調(diào)查另外50篇發(fā)表在至少15本期刊上的文章,這比預(yù)印本上標記的25篇文章還要多。
其余涉及的期刊出版商還包括愛思唯爾,其在至少4本期刊上發(fā)表了88篇問題論文。該公司表示正在進行調(diào)查,并將適時報告調(diào)查結(jié)果。
另外,出版商泰勒-弗朗西斯在至少2本期刊上發(fā)表了204篇可疑論文。其發(fā)言人表示,正在積極調(diào)查這些文章。“我們的調(diào)查始于2021年的一次內(nèi)部審計,在研究人員向我們表達擔憂后擴大了調(diào)查范圍。”該發(fā)言人說。
CCDC數(shù)據(jù)庫相關(guān)負責人Suzanna Ward說:“這可能是一個警鐘。幸運的是,在晶體學(xué)方面有一種普遍用于發(fā)布數(shù)據(jù)的標準文件格式,而不是隱藏在PDF中。”
他表示,目前正在討論,能否開發(fā)更自動化的篩查系統(tǒng)、幫助團隊識別和優(yōu)先考慮更需關(guān)注的內(nèi)容。
參考資料:
1.https://www.nature.com/articles/d41586-022-02100-4#ref-CR1
2.https://retractionwatch.com/2022/07/26/crystallography-database-flags-nearly-1000-structures-linked-to-a-paper-mill/
3.https://www.researchsquare.com/article/rs-1537438/v1
4.https://pubpeer.com/publications/42520B45C588B92FE2E5E0D3A70920#
5.https://docs.google.com/spreadsheets/d/1bfgWotMOQALFbeqccIkOMLbJODfrBwK-JHQ78zEu2ZQ/edit#gid=1739681459
標簽: