首頁(yè) > AI資訊 > 最新資訊 > 文本相似?圖片重復(fù)?AI生成?萬方文察:論文一站式綜合檢測(cè)工具

文本相似?圖片重復(fù)?AI生成?萬方文察:論文一站式綜合檢測(cè)工具

新火種    2023-11-12

圖片

科研誠(chéng)信是科技創(chuàng)新的基石,是科研工作者開展科學(xué)工作所需具備的最基本道德基礎(chǔ),也是管理工作人員和政府監(jiān)管部門必須遵守的行為準(zhǔn)則。

五花八門的科研不端案例屢被曝光

近年來,隨著學(xué)術(shù)出版機(jī)構(gòu)、科研管理機(jī)構(gòu)等相關(guān)部門進(jìn)一步加大了科研誠(chéng)信的查處力度,各種科研不端案例不斷被曝光:在2021年教育部高校碩博士學(xué)位論文的回溯抽檢工作中發(fā)現(xiàn),有4.74%的論文相似比超過30%;2022年,國(guó)家自然科學(xué)基金委先后通報(bào)四批查處的學(xué)術(shù)不端行為案件處理結(jié)果;2023年3月,廣東省科技廳公示了已終止的283個(gè)涉及嚴(yán)重科研失信的項(xiàng)目??蒲胁欢诵袨榈穆于厔?shì)引起了科技界和社會(huì)的廣泛關(guān)注,成為社會(huì)焦點(diǎn)問題之一。僅從論文撤稿角度而言,當(dāng)前學(xué)術(shù)不端行為的亂象也可見一斑:基于萬方數(shù)據(jù)科研誠(chéng)信監(jiān)測(cè)大數(shù)據(jù)的統(tǒng)計(jì),近5年來論文撤稿持續(xù)高位增長(zhǎng),年均撤稿超4800余篇。截至2023年10月,過去15年中全球范圍內(nèi)撤稿論文57000余篇,其中涉及學(xué)術(shù)不端的撤稿占62.62%,國(guó)人撤稿比例占“半壁江山”,高達(dá)45.7%。其中又以抄襲剽竊、圖片重復(fù)、虛假同行評(píng)議、偽造或篡改等不端行為比較突出,占整體比例約為90%。

圖片

數(shù)據(jù)來源:萬方數(shù)據(jù)科研誠(chéng)信監(jiān)測(cè)大數(shù)據(jù),2023年10月

圖片

數(shù)據(jù)來源:萬方數(shù)據(jù)科研誠(chéng)信監(jiān)測(cè)大數(shù)據(jù),2023年10月

圖片

數(shù)據(jù)來源:萬方數(shù)據(jù)科研誠(chéng)信監(jiān)測(cè)大數(shù)據(jù),2023年10月

學(xué)術(shù)論文中的圖像造假問題尤為突出

圖像造假(包括不當(dāng)圖片重復(fù)使用)是科技期刊論文造假的重災(zāi)區(qū)。根據(jù)相關(guān)研究推測(cè),PMC上現(xiàn)有收錄的科技期刊文獻(xiàn)中1.5%的論文包含可疑圖像,0.6%的論文存在圖像造假情況。早在2020年初,中國(guó)生物醫(yī)藥領(lǐng)域近600篇發(fā)表在知名期刊上的論文被追溯到由論文工廠產(chǎn)出,這些論文中各種顯微照片、流式細(xì)胞儀圖及個(gè)別蛋白質(zhì)印跡圖均由代筆者從圖形庫(kù)中截取拼湊。針對(duì)圖像造假問題,國(guó)際上的科技出版發(fā)行機(jī)構(gòu)最先作出反應(yīng),明確圖像篡改以及復(fù)用屬于不端行為,并成立相關(guān)工作組,如:2020年,Elsevier, Wiley, SN和T&F出版巨頭合作成立“跨出版商工作組”,為查核論文圖像軟件制定標(biāo)準(zhǔn)。此外還有以Pubpeer為代表的發(fā)表后論文同行評(píng)議論壇、專注于學(xué)術(shù)打假的Bik團(tuán)隊(duì)等。在國(guó)內(nèi),為加大對(duì)論文造假的查處力度,科技部建立了主動(dòng)發(fā)現(xiàn)機(jī)制,開發(fā)了智能工具,對(duì)近年發(fā)表的學(xué)術(shù)論文開展監(jiān)測(cè)分析,及時(shí)發(fā)現(xiàn)論文中的學(xué)術(shù)不端問題線索,特別是論文圖像問題,并交相關(guān)主管部門和單位依規(guī)調(diào)查處理。

圖片

AIGC的應(yīng)用對(duì)科研領(lǐng)域帶來新型挑戰(zhàn)

2023年初,AI技術(shù)的崛起及AIGC的應(yīng)用在學(xué)術(shù)科研界引發(fā)了一系列涉及原創(chuàng)性、學(xué)術(shù)誠(chéng)信、倫理法律問題等方面的爭(zhēng)議和討論。截至2023年9月1日,Retraction Watch已收錄1010篇因“隨機(jī)生成的內(nèi)容”原因被撤稿的論文,其中,僅2023年7月即有23篇相關(guān)撤稿記錄。

針對(duì)AIGC在學(xué)術(shù)過程中被濫用的現(xiàn)狀,國(guó)內(nèi)外出版機(jī)構(gòu)與學(xué)術(shù)共同體紛紛采取措施應(yīng)對(duì)。2023年9月20日,中國(guó)科學(xué)技術(shù)信息研究所與愛思唯爾(Elsevier)、施普林格·自然(Springer Nature)、約翰威立國(guó)際出版集團(tuán)(Wiley)三家國(guó)際出版集團(tuán)共同完成的《學(xué)術(shù)出版中AIGC使用邊界指南》正式發(fā)布。此前,國(guó)家互聯(lián)網(wǎng)信息辦公室、國(guó)家發(fā)展和改革委員會(huì)、教育部、科學(xué)技術(shù)部等也已聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》。今年8月提交審議的學(xué)位法草案對(duì)AI代寫論文同樣提出了規(guī)制。

圖片

文本查重服務(wù)存在一定的局限性

在過去的十余年中,科技信息服務(wù)領(lǐng)域構(gòu)建了以科技論文文本內(nèi)容為檢測(cè)對(duì)象的文字相似性檢測(cè)工具,用以支撐投稿、學(xué)位論文提交等環(huán)節(jié)的查處工作。但隨著學(xué)術(shù)論文不端問題的日益復(fù)雜與隱蔽,誠(chéng)信風(fēng)險(xiǎn)早已不僅僅只是文本上的抄襲,在期刊論文發(fā)表階段的一稿多發(fā)、虛假同行評(píng)議乃至論文工廠,作者不當(dāng)署名,失信懲戒,基金資助的虛假標(biāo)注,圖像的重復(fù)使用,篡改造假,參考文獻(xiàn)虛假標(biāo)注或引用問題論文等都需要認(rèn)真甄別、仔細(xì)核對(duì),避免可能存在較大的失信風(fēng)險(xiǎn)。

圖片

萬方文察論文科研誠(chéng)信風(fēng)險(xiǎn)綜合篩查服務(wù)新時(shí)期,圍繞著科研失信行為的各類表現(xiàn),構(gòu)建多樣化、立體化的軟件工具支撐查處尤為重要。在此背景下,面向論文學(xué)術(shù)不端治理需求,萬方數(shù)據(jù)公司基于文本相似性檢測(cè)、圖像檢測(cè)等核心技術(shù)及科研誠(chéng)信大數(shù)據(jù)資源基礎(chǔ),研發(fā)推出了科技論文科研誠(chéng)信風(fēng)險(xiǎn)綜合篩查服務(wù)——萬方文察,通過一站式綜合服務(wù),實(shí)現(xiàn)對(duì)論文文本相似性、圖像復(fù)用、AIGC風(fēng)險(xiǎn)、引文及作者等多要素的一次提交,多維檢測(cè),幫助教育、科研、出版、管理等誠(chéng)信監(jiān)管機(jī)構(gòu)及早發(fā)現(xiàn)風(fēng)險(xiǎn)線索并采取相應(yīng)的措施。

圖片

A 高效、準(zhǔn)確、專業(yè)的文本、圖像檢測(cè)技術(shù)萬方數(shù)據(jù)自主研發(fā)的“句子級(jí)正交基軟聚類倒排”專利檢測(cè)算法,支持高準(zhǔn)確性、高效率的文本檢測(cè);AIGC文本識(shí)別深度學(xué)習(xí)模型,則利用神經(jīng)網(wǎng)絡(luò)的強(qiáng)大表達(dá)能力,判斷人機(jī)生成文本之間的差異,可識(shí)別目前較為通用的AI寫作模型;基于圖像特征點(diǎn)的檢測(cè)匹配算法,針對(duì)論文內(nèi)的條帶圖、造影圖、染色圖等多類型圖片進(jìn)行復(fù)用情況檢測(cè),并將圖像之間的相同區(qū)域通過連線的方式輸出匹配結(jié)果;科研誠(chéng)信風(fēng)險(xiǎn)大數(shù)據(jù)監(jiān)測(cè)與核查技術(shù),通過大數(shù)據(jù)深度分析和挖掘,實(shí)現(xiàn)對(duì)科研實(shí)體風(fēng)險(xiǎn)監(jiān)測(cè)預(yù)警與核查鑒證服務(wù)。B 業(yè)界領(lǐng)先的大數(shù)據(jù)資源底座一方面依托公司收錄的授權(quán)期刊論文、學(xué)位論文、會(huì)議論文、報(bào)紙、專利、標(biāo)準(zhǔn)等資源建設(shè)體系,構(gòu)建形成了權(quán)威的比對(duì)資源庫(kù);另一方面,圍繞著論文圖像、科學(xué)數(shù)據(jù)、風(fēng)險(xiǎn)信息等,構(gòu)建學(xué)術(shù)論文圖像比對(duì)庫(kù)、科學(xué)數(shù)據(jù)庫(kù)、科研誠(chéng)信風(fēng)險(xiǎn)大數(shù)據(jù)資源池,形成了種類齊全、信息完備、支撐有力的數(shù)據(jù)資源底座。C 便捷的操作使用流程萬方文察操作簡(jiǎn)單,用戶只需填寫基礎(chǔ)信息后,將論文提交至系統(tǒng)中即可, 系統(tǒng)會(huì)自動(dòng)對(duì)論文各項(xiàng)數(shù)據(jù)進(jìn)行分析和比對(duì),察驗(yàn)風(fēng)險(xiǎn)問題,并提供詳實(shí)的察驗(yàn)報(bào)告。

圖片

D 綜合性展示察驗(yàn)結(jié)果以指標(biāo)形式展示論文文本相似比、AI生成文本比、圖片復(fù)用情況、作者風(fēng)險(xiǎn)情況、基金風(fēng)險(xiǎn)情況、參考文獻(xiàn)風(fēng)險(xiǎn)情況等多維度結(jié)果指標(biāo),以及論文本身撤稿、學(xué)術(shù)質(zhì)疑等情況。

圖片

萬方文察綜合性察驗(yàn)報(bào)告萬方文察服務(wù)入口:https://cx.wanfangdata.com.cn/verification

CNRIS

萬方數(shù)據(jù)科研誠(chéng)信服務(wù):

科研誠(chéng)信服務(wù)平臺(tái) · 科研失信風(fēng)險(xiǎn)監(jiān)測(cè)預(yù)警 · 萬方文察 · 萬方檢測(cè) · 科研誠(chéng)信學(xué)習(xí)系統(tǒng) · 科研誠(chéng)信培訓(xùn)系統(tǒng)

QQ截圖20231106174521.png

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章