說起PubMed,很多小伙伴都非常熟悉,這應(yīng)該算是國內(nèi)最常用的生物醫(yī)學相關(guān)SCI文獻檢索數(shù)據(jù)庫,實驗室的小白們一開始用的基本都是它。
最近,Nature的一篇報道文章稱,就是這樣一個廣受好評的文獻檢索集大成者,被一款名為Papermill Alarm的軟件工具查出,至少有1%的論文可能出自論文工廠。
(資料圖片僅供參考)
1%是個什么概念呢?根據(jù)PubMed官網(wǎng)顯示,該數(shù)據(jù)庫收錄了超過3400萬篇生物醫(yī)學文獻,“至少1%”就意味著有超過34萬篇論文可能涉嫌造假。
“這個數(shù)據(jù)太高了,令人擔憂。”學術(shù)打假人Smut Clyde感嘆道,“這些垃圾論文確實會被引用,人們利用它們來支持自己沒有出路的研究項目。”
另一位學術(shù)打假人Elisabeth Bik則認為,PubMed上出自論文工廠的文章真實數(shù)量可能更高,“這些論文會損害科學的聲譽和我們對研究論文的信任。”
近年來,被期刊撤銷的論文數(shù)量不斷增加,這些撤稿數(shù)據(jù)背后,論文工廠扮演了重要角色。日漸規(guī)模化、工業(yè)化的學術(shù)作假手段正在侵襲科學界,打擊論文工廠迫在眉睫。
與“論文工廠”的持久戰(zhàn)
有學術(shù)造假行為,就有打假人的出現(xiàn)。他們與論文工廠之間展開了一場持久戰(zhàn)。
多年來,Clyde一直在追蹤學術(shù)不端行為的證據(jù)。與其他學術(shù)打假人一起,他標記了數(shù)百篇可能是論文工廠生產(chǎn)的文章。這些論文工廠大量生產(chǎn)假學術(shù)論文,然后賣給有需要的研究人員。
出版商已經(jīng)撤回了許多可疑論文,并采取措施阻止期刊接收論文工廠生產(chǎn)的投稿。但問題仍然存在。
Clyde只是從事這種打假工作的眾多研究人員中的一員。他們通常是把學術(shù)打假作為主要工作之外的一種消遣,所以喜歡用化名進行打假。而有些人則不同,比如Bik和分子腫瘤學家Jennifer Byrne,他們選擇實名打假。
今年4月,Clyde的電子郵件地址出現(xiàn)在Research Square服務(wù)器上的一篇預印文章中,文章描述了一家論文工廠。這篇文章的作者名叫David Bimler,他是一名退休的心理學家,曾在新西蘭梅西大學工作。
在確認Clyde和Bimler是同一個人后,Nature采訪了此人,談?wù)撽P(guān)于論文工廠等問題。
這篇發(fā)表在預印本的文章引起了軒然大波。Bimler在文中指出,從2015年到2022年間,有800多篇可疑的化學領(lǐng)域的論文出自同一家論文工廠,這些論文有圖像重復、奇怪的措辭、可疑的電郵地址、無意義的引用等特點,并且都聲稱金屬有機框架材料具有殺滅癌細胞或抑制炎癥等作用。
“我很驚訝,居然有那么多論文都是關(guān)于高級化學和醫(yī)學應(yīng)用交叉的。”Bimler表示,金屬有機框架確實有一些奇妙的物理特性,所以人們才會對它們?nèi)绱藷嶂?。但是,認為它們可能具有醫(yī)學特性的想法是極其牽強的,而這些期刊卻接收了數(shù)百篇關(guān)于它們的論文。
近年來,大規(guī)模學術(shù)造假事件正在影響著出版商。
比如2021年初,Royal Society of Chemistry Advance期刊撤回了69篇涉嫌學術(shù)造假的論文,這些論文都沒有共同的作者或機構(gòu),但是文中的圖標和標題卻驚人地相似。官方聲明表示,該期刊也是這場“規(guī)模學術(shù)造假”騙局中的受害者。
該期刊執(zhí)行主編Laura Fisher意識到,一些論文工廠正在大量生產(chǎn)偽科學文章。
Nature的一項分析發(fā)現(xiàn),自2020年1月以來,各大期刊已經(jīng)撤回了至少370篇與論文工廠有關(guān)的論文,預計未來還會有更多的論文被撤回。
之所以出現(xiàn)這種文獻清理行動,很大程度上是因為學術(shù)打假人公開標記了他們認為來自論文工廠的可疑論文。
編輯們非常重視這一問題。以至于2020年9月,倫敦的出版?zhèn)惱砦瘑T會(COPE)舉辦了一個論壇,專門討論關(guān)于“論文工廠系統(tǒng)性地操縱出版過程”這一話題。
Bik是論壇主講嘉賓,她曾在美國斯坦福大學醫(yī)學院工作了15年,后來成了一名職業(yè)學術(shù)打假人,專門調(diào)查各類論文圖像重復問題以及可能存在的學術(shù)不端行為。Bik認為,在文獻中還有數(shù)千篇這樣的論文。“這么多論文都是假的,太令人嘆息了。”
根據(jù)Nature的統(tǒng)計,到2021年3月,被這些學術(shù)打假人列為可疑論文的名單加起來總共有1300多篇。大概約有26%的文章已被撤回或貼上了密切關(guān)注的標簽,還有許多依然在被調(diào)查中。
醫(yī)學是論文代寫的重災區(qū)
在大多數(shù)撤回的論文中,醫(yī)學領(lǐng)域是重災區(qū)。
Nature統(tǒng)計,2020年1月以來,被學術(shù)打假人聲稱出自論文工廠的370多篇撤稿,其作者都來自醫(yī)院。
2021年7月,Journal of Cellular Biochemistry撤回了129篇來自中國的論文,甚至還專門出了一期增刊Supplement Retraction Issue——一本撤稿論文的合集。尤其令人震驚的是,這里面的所有論文都來自醫(yī)院群體。
該期刊主編、德國美因茨大學教授Christian Behl甚至還特意寫了一篇社論,來解釋這次的增刊行為,并對論文工廠表示譴責。“最近,論文工廠成了熱議話題,出版商、編輯、評審人等都對這個話題非常關(guān)注。論文工廠已對科研誠信造成巨大的威脅。”
美國布拉德利大學的圖書管理員Xiaotian Chen說,醫(yī)生是一個特殊的目標市場,因為他們通常需要發(fā)表研究論文來獲得晉升,但他們在醫(yī)院太忙了,真的沒有太多時間做科學研究和寫文章。
這也是為什么醫(yī)學領(lǐng)域成了論文造假的重災區(qū)。
問題論文的普遍存在,導致一些期刊編輯懷疑中國醫(yī)學研究人員提交的論文。2021年2月,Molecular Therapy的一篇社論說,“這種‘問題論文’的數(shù)量不斷增加,正在嚴重破壞中國學者從事科研的可信度,并日益使人們對該地區(qū)的科學規(guī)范性產(chǎn)生懷疑。”
全球最大的科學出版商Elsevier出版服務(wù)部門負責人Catriona Fennell指出,出版行業(yè)有組織的造假問題并不新鮮,也不僅僅局限于中國。
她對Nature說,“我們在其他幾個國家也發(fā)現(xiàn)了工業(yè)化造假的證據(jù),包括伊朗和俄羅斯。這已經(jīng)是一個全球性的問題。”
造假“克星”來了
出版商一直在與學術(shù)造假作斗爭。許多出版商也會使用軟件和其他方法來幫助檢測欺詐行為和發(fā)現(xiàn)造假論文。例如,用一些手稿處理系統(tǒng)就可以檢測并標記出來自同一臺計算機的許多投稿。
Papermill Alarm的開發(fā)者、英國倫敦學術(shù)數(shù)據(jù)服務(wù)公司Clear Skies的主管Adam Day則表示,“它分析文本的方法是最新的。”
Papermill Alarm可以海量分析科學論文的標題和摘要,并檢測出與造假文章中相似的文本內(nèi)容,簡直就是造假“克星”。
該工具使用一種深度學習算法,將所投文章標題和摘要中使用的語言與已知來自論文工廠的文章進行比較。這一比較是基于由Bik和Bimler(也以化名Smut Clyde聞名)等研究科研誠信的人匯編的論文工廠文章列表。該工具使用交通信號燈模式,給與已知論文工廠文章有很多相似之處的論文分配紅色旗,給那些有個別相似之處的論文分配橙色旗,給那些沒有相似之處的論文分配綠色旗。
“它不是釣魚竿,而是像一張漁網(wǎng)。”Day如此評價這款文本分析工具。
其出色功能引起了一些出版商的注意。目前有六家出版商表示,有興趣使用Papermill Alarm來篩選提交的投稿,其中就包括知名獨立學術(shù)出版公司SAGE,Day在那里擔任數(shù)據(jù)科學家。
輕松將潛在的造假論文“一網(wǎng)打盡”正在變成現(xiàn)實。這樣一款論文檢測工具的確讓期刊編輯受益,但要說明的是,該軟件并不能明確指出一篇論文是否造假,但能夠篩選出需要進一步調(diào)查的有問題的文章。
參考鏈接:
https://www.nature.com/articles/d41586-022-02997-x
https://www.nature.com/articles/d41586-022-02099-8
https://www.nature.com/articles/d41586-021-00733-5
https://www.nature.com/articles/d41586-020-01363-z