前言:一篇好的文章需要精心雕琢,小編精選了8篇識別技術論文范例,供您參考,期待您的閱讀。
期刊編輯防范學術不端的必要性
國際科技期刊屢次曝光震驚學術界的學術不端論文撤稿事件,引發國人對學術不端行為的極大關注;但相較于引人矚目的國際期刊撤稿事件,國內期刊的撤稿顯得悄無聲息。比如郭佳楠剽竊論文在CNKI消失,刊載刊物連撤稿聲明都欠奉。張培福等統計發現,《近代中醫》期刊“一稿多刊”的作者占全部樣本作者的73.1%,重復刊發的文章數占樣本作者發文總數的10.4%。某作者2015年2月15日和20日分別在《江蘇理工學院學報》《中州大學學報》發表了題名同為《數字化出版視域下傳統科技期刊的發展思考》的文章,內容幾乎完全相同。事實表明,國內科研出版環境并非天朗氣清,也存在大量剽竊、抄襲、偽造篡改、自我抄襲、重復發表的稿件。107篇學術不端論文撤稿后,中國科協約見SpringerNature出版集團大中華區總裁指出:期刊與編輯對學術不端撤稿事件負有責任。科技期刊編輯作為學術論文出版最終的把關者,既肩負著科研成果出版的重任,又肩負著維護科研誠信的使命,是阻止學術不端行為的最后一道防線,工作舉足輕重。很多科技期刊編輯在工作實踐中摸索、思考、總結了大量高價值防范學術不端的技巧和方法,然而,沒有刻意的培養和訓練,再有價值的技巧和方法也僅限于文獻。筆者工作之初,由于沒能及時樹立學術不端防范意識,又缺乏工作經驗,對返回審稿意見迅速、評價正面的審稿專家充滿感激,不曾意識到其間可能存在學術不端;因此,本文中,筆者闡述培養和加強期刊編輯防范學術不端行為意識和能力的必要性及策略的一些淺見,以期對與筆者一樣的新編輯順利成長為更好的學術守門人有所幫助。
1收益巨大,學術不端行為難以根除
學術論文作為科研成果的載體之一,是許多國家科研規劃機構、高校和科研單位都認可的、可以明確界定科研工作者的能力和水平的要素之一。發表足夠的學術論文能使作者進入“充裕的科研經費、大筆的獎金、迅速地晉升、各種頭銜及名譽的獲得和更充裕的科研經費、更大筆的獎金、更迅速地晉升、更多的頭銜和名譽的獲得”的良性循環,發表學術論文已成職業剛需。馬克思在《資本論》中說:“一旦有適當的利潤,資本就膽大起來……有百分之五十的利潤,它就鋌而走險;為了百分之一百的利潤,它就敢踐踏一切人間法律;有百分之三百的利潤,它就敢犯任何罪行,甚至冒絞首的危險。”依靠抄襲、剽竊、篡改數據無異于“空手套白狼”,利潤何止300%,必然誘導學術不端行為發生;因此,我國科技部、教育部、基金委等部門對撤稿事件的徹查和雷霆手段,一定程度上可以抑制學術不端。但國內期刊界應有悲觀而冷靜的認識:只要學術論文依舊是衡量科研能力的剛性條件,的巨大利益回報就不會結束,就不應心存學術不端能徹底消除的幻想。阻止學術不端行為將是一場持久戰,每位期刊人都有責任和義務增強防范的意識和能力。
2學術不端檢測系統并非萬能
調研結果顯示,很多科技期刊利用中國知網的學術不端檢測系統來防范投稿者抄襲、剽竊等學術不端行為。該系統強大的識別重復字段的功能確實極大地提高了期刊編輯排除抄襲論文的效率,但同時也有人指出這項技術目前對圖表和重義篡改還無能為力。吳昔昔等指出,很多低重復率的文章源于作者有意識“修飾”“加工”和“改裝”,或者剽竊他人觀點、套用他人設計思路等。趙秋民、陸宜新發現,只要作者改換抄襲剽竊內容和觀點的描述次序、句式等,即可在學術不端檢測系統中“隱形”。筆者曾利用學術不端檢測技術定量測試一段篡改的文字,在沒有原文作為“觸媒”的條件下,即便是簡單的字序更改都能避過學術不端檢測系統的檢測[23]。學術不端檢測系統技術逐步成了一柄“雙刃劍”,在正直的人手中是幫助凈化科研出版環境的工具,在別有用心的人手中是規避期刊學術不端防范工作的利器。很多作者利用付費學術不端檢測系統提前檢測論文,根據結果精確修改來規避期刊的學術不端檢測;所以,期刊編輯在防范抄襲行為上過度依賴該系統而降低對稿件內容的警惕不可取,必須時刻保有防范意識,才能當好學術傳播的守門人。
3學術不端行為日益隱蔽
出版物數字化和網絡化以及學術不端檢測系統使用之后,原文復制粘貼的學術不端文章基本能被期刊拒之門外,但技術的更新使得造假伎倆越來越多樣化,越來越難以識別。比如:機構和作者利用期刊網絡采編系統漏洞操縱期刊同行評審,通過虛假郵箱頂替專家為自己的論文審稿,提供有利的評審意見;利用翻譯平臺(Google翻譯、Baidu翻譯等)將復制的中文翻譯成英文,再將英文翻譯成中文,略做修改以規避學術不端檢測系統的檢測;利用釋義工具查找一個詞的解釋或同義詞對原詞進行替換,造成不重復但重義的抄襲;將他人論文中的文字描述繪制成圖片和表格瞞天過海。識別這些學術不端行為不僅需要期刊編輯警覺的防范意識,還需要期刊編輯過硬的識別能力。隨著國家對學術不端行為責任人懲罰力度的加大,以及防范學術不端行為手段的更新,學術不端還會更加隱蔽和復雜。期刊編輯必須從一開始就樹立防范意識,掌握識別技巧,以應對日益艱巨的防范工作。
學術期刊發展與人工智能融合
一、引言
隨著數字時代的到來,網絡技術、傳媒技術和大數據的蓬勃發展,傳統期刊的內容編輯和運營方式都受到了極大的沖擊。人工智能的熱潮更是為改變和重構新聞出版業的格局、創新學術期刊和文化業態帶來了前所未有的機遇。通過與人工智能的融合,學術期刊的寬度、廣度和深度都將得到更大的擴展,其發展將迎來全方位、多層次的變革和創新。其實,不管在國外還是在國內,人們已經在嘗試將人工智能應用在新聞媒體界。早在2010年,一家名為NarrativeScience的服務公司就推出了一款名為Quill的寫作軟件,它能將數據轉化為有故事情節的敘述文,由于擁有超強的自我學習能力,在一段時間之后便能從大數據中研究出寫作模式及風格。《華盛頓郵報》等多家新聞媒體組建了“人工智能編輯部”,首先利用大數據技術獲取多種信息,然后利用機器學習對信息進行分析和判斷,并且最終能夠將有效信息進行合成、輸出,形成高質量的多媒體新聞稿件[1]。
二、人工智能的發展及在數字出版領域的應用
人工智能意味著機器可以在各種應用中實現人類大腦的功能,例如解決數學問題等。約翰•麥卡錫于1956年在達特茅斯的一次會議上首次創造了“人工智能”一詞,從那時起,人類對于人工智能的興趣呈指數級增長[2]。人工智能技術的發展和應用,經過了邏輯智能、感知智能和認知智能三個階段。在邏輯智能階段,人們重點關注的是計算機的存儲、記憶和計算、搜索的能力。無人駕駛汽車是感知智能的一個重要代表。在這一階段,計算機可以與外界進行交互,感知外界的環境。認知智能目前還處在研究階段,其強調的是計算機從機器向“人類”的發展,也就是凸顯計算機的自我意識。神經網絡和深度學習正是目前這一階段,是人工智能的研究熱點。數字時代,越來越多的國內外數字出版機構都在積極關注最新的科學技術,并努力探索與之結合的創新方法。互聯網時代,人工智能所帶來的革命性新技術將進一步激發數字出版在產品開發、資源建設和用戶服務方面的智能性的潛能。目前,將人工智能技術引入數字出版領域,主要是在學術期刊系統中提升大數據收集、處理、分析和應用的智能化水平。
三、數字時代學術期刊發展與人工智能融合的重要性
數字時代,學術出版業正在日益受到人工智能的深刻影響。2014年,有約250萬篇以英文出版的科學在28種不同的期刊上。隨著大量期刊文章的,人工智能可以成為出版商提高效率的利器。通過使用人工智能,出版商可以很容易檢測到學術期刊中是否存在欺詐性數據,也有利于避免出現學術抄襲現象。通過精準的算法,人工智能可以在較短的時間內判斷論文和研究的質量,從而決定論文是否適合出版。世界經濟論壇稱,“人工智能將擾亂科學界———這是一件好事”。學術研究發展到現在,在很多研究領域中,學術文獻的發表數量已經呈現過于繁多的現象。例如,僅關于p53蛋白的學術論文就發表了超過70000篇。過多的學術論文迫使學者們努力跟上關于這一主題的各類研究和成果,但如此多的研究及成果對普通大眾來說,他們很難找到最新、最前沿的研究內容。在人工智能的幫助下,公眾對于已經發表的學術論文能夠方便、快捷地搜索和篩選。例如,SemanticScholar是一個由人工智能研究所創建的搜索引擎,它利用數據挖掘技術,能夠幫助公眾快速定位和分類已發表的研究。可以肯定的是,人工智能可以而且將使科學界受益。人工智能將顯著改善學術的研究方式和論文的發表方式。首先,它可以揭示對科學研究而言至關重要的研究趨勢:它可以使論文得以根據內容而不是標題進行提煉,使研究人員能夠快速識別研究趨勢和研究前沿。其次,人工智能可以幫助確定新的同行評審員:人工智能可以從期刊編輯可能沒有考慮過的在線資源中找出潛在的同行評審員名單。并且人工智能在打擊學術抄襲方面有著突出的優勢:使用自然語言處理,人工智能可以放棄傳統的檢測抄襲的算法,轉而使用可以識別整個句子或已經改寫的段落軟件。另外人工智能能夠快速高效地識別有缺陷的報告和統計數據:人工智能可以確定是否缺少研究的重要組成部分以及所應用的統計數據是否存在缺陷。最后,它可以檢測數據是否被修改以達到期望的結果。綜上所述,在數字時代,將學術期刊的發展與人工智能融合,有著非常大的價值和意義,它將改變學術期刊的發展方向,提高研究者使用學術期刊的效率,也能夠極大提高學術期刊的質量,改善學術領域的環境。
四、數字時代學術期刊發展與人工智能融合的策略
基于RFID的煙草倉儲管理論文
1RFID技術
RFID的中文是射頻識別技術,也叫做“電子標簽”。人們通過該技術能夠識別特點的信息,同時讀取相關的數據并進行相應處理。作為一種新興的技術,該技術具有許多優點:具有很強的穿透性、很大的存儲空間、更快的讀取速度以及更高的安全性能。RFID一般由以下幾個部分組成:天線、標簽、讀寫器以及中間件等等。
2基于RFID的煙草倉儲管理方案
本論文設計的煙草倉儲系統,主要業務是對卷煙的出入庫管理。采用RFID技術,可以使得每個環節的信息更加透明,使得管理者和操作人員能夠更方便及時地了解煙草的數量、位置等狀態,從而實現了信息流和物流的融合。
2.1系統整體架構
基于RFID的煙草倉儲管理系統的主要工作原理是:所有的卷煙都存放在托盤上,每個托盤都貼有相應的電子標簽。數據庫通過相應處理,將每個托盤上電子標簽的信息整合在一起,同時一一對應。采集到相應的電子標簽的信息,就可以獲得相應的各種條碼信息。
2.2系統流程設計
教育人工智能產業發展比較研究
摘要:人工智能新的浪潮正在教育領域引發深層次的變革,技術正在重塑教育的形態。教育人工智能的發展問題歸結為處理誰來研究、在哪研究、研究什么、研究成果等問題的4W模型。通過對2017—2019年公開的論文和專利等文獻的檢索與分析,反映出教育人工智能的學術研究和科技創新總體上成果頗豐,在關鍵技術上側重于學習算法的研究,而在應用領域更加關注智能機器人和教育游戲;相較于企業,高校的研究占據了主導地位。
關鍵詞:教育人工智能;文獻分析;4W模型;產業發展
人工智能的概念是1956年在美國達特茅斯學院確立的,指讓計算機像人那樣思考、學習和認知,即用計算機來模擬人的智能[1]。大數據智能的出現、群體智能引起的關注、混合智能在人機一體化技術中的引入、跨媒體智能的興起、無人系統的迅速發展等都初步嶄露了新一代人工智能技術的鋒芒。
一、研究背景
人工智能已逐漸滲透到社會的各個領域,多個國家已將人工智能提升為國家戰略,出臺了相關政策和規劃,力爭搶占科技的制高點。2017年,國務院首次將人工智能寫入政府工作報告,同年了《新一代人工智能發展規劃》,部署了我國發展人工智能的重點任務。工業和信息化部隨即印發《促進新一代人工智能產業發展三年行動計劃(2018-2020)》,全力助推人工智能的發展。2018年,教育部印發《高等學校人工智能創新行動計劃》。旨在進一步提升高校人工智能領域科技創新、人才培養和服務國家需求的能力。人工智能新的浪潮正在教育領域引發深層次的變革,技術正在重塑教育的形態。在此背景下,研究如何應用新技術推動教育事業的發展具有重要意義。
二、發展概況與文獻綜述
2006年Hinton等人提出的深度學習技術拉開了新一代人工智能的序幕。ImageNet競賽代表了計算機智能圖像識別領域最前沿的發展水平,2015年基于深度學習的人工智能算法在圖像識別準確率方面第一次超越了人類肉眼,人工智能實現了飛躍性的發展。伴隨著機器視覺的研究獲得前所未有的成功,深度學習在語音識別、數據挖掘、自然語言處理等不同研究領域相繼取得突破性進展。2016年,微軟將英語語音識別錯詞率降低至5.9%,可與人類相比肩。如今,人工智能已由實驗室走向市場,無人駕駛、智能助理、新聞推薦與撰稿、搜索引擎、機器人等應用已經走進社會生活的各個角落。教育人工智能領域已經涌現出一批相關研究,閆志明團隊概括了人工智能的內涵、技術與應用等內容,側重對美國政府兩個人工智能報告的解讀,分析了教育人工智能的內涵、關鍵技術與應用趨勢;探索了機器學習在教育中的應用[2];賈積有探討了人工智能教育應用的熱點問題[2];唐燁偉團隊分析了人工智能與STEM等課程的融合[4];吳永和團隊構筑了人工智能+教育的生態系統[5]。
期刊影響因子人為操縱識別
自影響因子廣泛應用于學術期刊評價以來,對影響因子科學性和合理性的質疑從來就沒有間斷過,爭議最大的莫過于影響因子的濫用和誤用,如用影響因子評價單篇論文、評價研究者個人,甚至應用于職務任命、資金分配和項目評審。許多研究者認為,影響因子的設計存在明顯缺陷,如引證時間窗口(2年)過短、分子和分母納入的文獻類型不統一、沒有考慮期刊論文被引頻次的偏態分布、無法應用于跨學科評價等。盡管如此,影響因子依然被廣泛應用于期刊評價和研究績效評價。正像匈牙利學者Brody所說的那樣,影響因子并不完美,但依然無法替代。澳大利亞學者Bradshaw等也指出:無論你喜歡還是厭惡,用文獻計量學指標評價學術期刊及相關研究績效它就在那里;無論正確與否,學術組織評價申請人業績、學者選擇期刊投稿、學術期刊選擇出版公司合作它都無所不在。正因如此,許多學術期刊的主編和編輯熱衷于人為操縱期刊的影響因子。希臘學者Falagas總結了人為操縱影響因子的10大行為,國內學者徐海麗、鄭毅、鞠秀芳等也對人為操作期刊影響因子的現象進行了研究。強制作者引用某期刊、小集團(甚至組成期刊聯盟)內部期刊互引成為學術期刊界的潛規則,抑或是公開的秘密。因此,如何從期刊的文獻計量學指標識別可能的人為操縱就顯得尤為重要,讓人為操縱影響因子的行為無可遁形,以進一步加強期刊內涵建設、規范辦刊行為。馬崢近期撰文,明確提出了通過計量指標分析發現操縱期刊評價結果的行為。他主要論證了通過期刊自引、他引的統計分析,揭示期刊過度自引、集團互引現象。目前,國內外研究主要集中在對人為操縱行為的揭示和理論分析、通過對期刊自引率的研究判斷期刊的人為操縱等方面,很少涉及其他指標在識別期刊影響因子和被引頻次人為操縱中的作用。本研究將對自引率、擴散因子、被引半衰期、開放因子、互引指數等文獻計量學指標在識別期刊影響因子人為操縱行為中的作用進行詳細分析。
1自引率與影響因子人為操縱的識別
1.1自引率的分類
期刊自引率是指期刊總被引頻次中自引次數所占的百分比。根據自引率適用對象的不同,我們將自引率分為2類,一是總被引頻次中自引所占的百分比(self-citedratefortotalcites,RSC,TC),二是計算影響因子的分子中自引所占的百分比(self-citedrateforimpactfactor,RSC,IF)。學術界普遍關注的是RSC,TC,對RSC,IF研究較少。《中國科技期刊引證報告(核心版)》中的是RSC,TC,清華同方的《中國學術期刊影響因子年報》中給出了他引影響因子,未給出RSC,TC。根據影響因子和他引影響因子可以計算出RSC,IF。2015年新版《JCR》(InCitesJCR)里新增的3個指標中就包括他引影響因子,這樣就能很方便地計算自引和他引對期刊影響因子的貢獻度以及RSC,IF。
1.2自引率在影響因子人為操縱識別中的應用
影響因子是指某期刊前2年發表的所有文獻在統計當年的被引頻次與該刊前2年發表的可被引文獻數量之比。顯然,提高影響因子最根本的方法是增加期刊前2年發表的論文在統計當年的被引頻次。其他期刊是否引用自家期刊不易控制,期刊自引就成為提高影響因子最直接、最有效的手段;因為,在的全過程涉及3類行為主體,即主編(編輯)、審稿專家、作者,其中作者是弱勢群體,主編(編輯)起決定性作用。主編(編輯)要求作者引用某期刊時,作者為了能夠順利在該刊,一般沒有勇氣也沒有必要拒絕主編(編輯)提出的引用要求,盡管有時候可能僅僅是建議。過度的人為操縱必然導致期刊自引率過度升高。一般來講,期刊自引率應小于20%,異常增高一定存在人為操作的可能。為了遏制期刊通過提高自引量人為操作影響因子的行為,美國湯森路透在1997年版的《期刊引證報告》(JournalCitationReports,JCR)里就加入了期刊總被引頻次中的自引率(RSC,TC)和影響因子構成中的自引率(RSC,IF)。中國科學技術信息研究所在1999年出版的《中國科技期刊引證報告(核心版)》中專門增加了RSC,TC指標。國內消化病學領域某刊(英文版),曾經因為RSC,IF和RSC,TC過高一度被《JCR》剔除(2008年恢復),眼科學領域某中文期刊也曾因為RSC,TC過高一度被《中國科技期刊引證報告(核心版)》剔除。為了最大限度地發揮自引對影響因子的貢獻,還不至于使自引率(實際上僅指RSC,TC)明顯增加,部分辦刊人開始強制或引導作者僅引用該刊前2年發表的論文作為參考文獻,也就是馬崢文中提到的“通過在影響因子時間窗口內外調節自引操縱指標的行為”。這種行為一定會導致RSC,TC小幅增加而RSC,IF過度增加。通常情況下,同一期刊的RSC,TC和RSC,IF應該大體相當,如果RSC,IF遠遠大于RSC,TC,則可高度懷疑該刊存在人為操作行為。
2擴散因子與影響因子人為操縱的識別
學術不端防范意識和能力培養方法
筆者初入期刊編輯部時,對學術不端行為的認識僅停留在學術不端檢測系統的檢測結果中,直到看到大量中國學者稿件被撤的消息,聽到朱邦芬院士擲地有聲地說“科研失去誠信,亡科學亡天下,維護科研誠信,科技期刊編輯義不容辭”,才發現學術不端行為竟如此多樣,驚嘆自身對學術不端行為及其危害認知淺薄之際,有意加強了對學術不端行為表現和防范措施的學習。回顧個人一步步了解學術不端行為并應用到工作中的經歷,筆者認為可以從以下4個方面培養并增強科技期刊編輯防范學術不端行為的意識和能力。
1入職培訓,樹立意識
學術不端行為不但破壞正常的科研出版活動,而且造成人力資源和社會資源的浪費,扼殺科研創新活力。如果等著靠編輯新人自己突然發現學術不端行為再開始防范就為時已晚。防范意識通過一次培訓即可建立,因此,對新入職的編輯進行系統的學術不端行為認知培訓是樹立防范意識的極佳時機,也是不可或缺的關鍵環節。期刊編輯部有必要幫助他們在工作起步時就樹立防范學術不端行為意識。
2定期宣傳,強化意識
期刊應定期宣傳學術不端行為的危害性,以防止編輯因職業倦怠而放松警惕,否則,懈怠稿件初審工作,就會使信息審查變成一種形式。不斷強調編輯防范學術不端工作對科研出版活動秩序、科研進展、國家的富強乃至人類生存具有重要意義。積極引導、鼓舞編輯不應因工作只是“為人作嫁”而自苦。期刊應發揮宣傳工作的核心價值,充分激發編輯的職業使命感,以促使編輯從被動工作到積極主動去研究學術不端,尋找對策,進而達到強化編輯防范學術不端意識的目的。
3注重傳承,提高能力
期刊應重視期刊人應對學術不端的經驗,歸納前人遇到的各種學術不端現象,組織編輯系統學習學術不端的特征、識別方法和應對策略,共同探討,出謀劃策,取精華棄糟粕,不斷傳承下去,以指導期刊編輯的工作。跟進國際出版倫理委員會(COPE)對出版問題的信息更新,不斷研究學術不端新現象和防范對策,掌握應對變種學術不端行為先機,化被動為主動。要注重編輯專業知識的積累,鼓勵編輯多參加學術會議、跟進學術進展、廣泛閱讀學術論文,提升對學術論文的判斷能力,才能在排除學術不端行為中走得更遠。期刊編輯部還可以適時分離科學編輯與技術編輯的工作內容,讓科學編輯有更充足的時間審查稿件,履行防范學術不端的職責。
科技期刊編輯部的學術不端行為
近年來,國內外科研造假事件頻發,如何打擊學術造假、維護科研誠信成為學術界、編輯學界非常關注的問題。2018年5月,中共中央辦公廳、國務院辦公廳印發了《關于進一步加強科研誠信建設的若干意見》,明確要求教育、醫療、學術期刊出版等單位完善內控制度,加強科研誠信建設。本研究通過對30多家學術期刊編輯部進行問卷調查、座談等形式,對出現較頻繁、較隱蔽的學術不端的新花招和編輯部新對策進行總結歸納,現報道如下。
1基金文件造假
本研究涉及的各家編輯部均表示,近年來基金文件造假的比例有所上升,造假形式為:(1)偽造基金申請文件、基金批復件。(2)掛靠他人相符或不相符課題。(3)單位協助證明虛假立項課題。究其原因,在于在對期刊進行評價、考核的過程中,基金文章占比是一個重要的指標,故很多期刊編輯部對基金文章會優先考慮錄用。對期刊的評價考核參考基金論文比重,固然有一定的道理,因為科研項目能通過立項,其創新性、科學性、實用性等是經過了一番論證的。而投稿作者利用這一審稿規律,為提高論文錄用的可能性,不管自己是不是基金文章,都掛上基金的頭銜,甚至出現偽造基金文件等學術不端行為。而作者所在單位一味為了刊發論文數量,也不顧事實,幫助造假。編輯部應加大基金文件真實性的審核和甄別,一般規范的基金項目申報書應有項目基本信息,包含立項依據、項目情況、計劃安排、經費預算、項目組負責人、成員基本信息,申報書末尾還應有申報單位簽章、主管部門審核意見及蓋章。很多作者偽造的基金申報書僅為基金申報書的封面,僅有申報單位的蓋章,且上傳的電子版申報書單位蓋章亦為photoshop軟件所做。其次,編輯可以在相應的基金批復單位對基金項目進行查詢,如國家自然科學基金即可在國家自然科學基金委員會官網結果公布、項目查詢中進行查詢。目前部分省級、市級、縣級科研項目尚無法在網上進行相應查詢,希望后期科研管理部門能加強科研項目的查詢和公示工作。編輯在處理這類文章時,如基金屬實,作者是可以登錄科研管理網上系統的,可向其索要相關截圖對基金真實性進行核實。與此同時,編輯部對基金文章的取舍,也應嚴格按照文章質量。優質文章優先錄用,而不是基金文章優先錄用,以此打破作者對基金文件造假的學術不端行為。
2數據造假
數據是科學研究的核心,也是學術論文的核心,是作者論點成立與否的基礎,但試驗并從中搜集整理數據也是一個極其繁重的工作,故有的作者通過編造、篡改、抄襲數據企圖蒙混過關。但憚于數據庫系統,作者在編造、抄襲時有使用了一些小的“花招”,需要編輯擦亮眼睛仔細分辨。劉勝利等[1]將數據造假分類歸納為三類:(1)故意采用必然產生誤導性數據的研究方法/方案;(2)偽造、篡改和歪曲試驗記錄的數據;(3)研究數據的虛假呈現和運用。綜合各編輯部在實際工作中遇到的情況,數據造假類的稿件還有以下特點:(1)多為對計數資料的描述和比較,因對計量資料的正常和異常范圍是更為專業,編造起來更為麻煩,容易露出馬腳。而計數資料多為率的比較,編造數據更為容易。筆者所在編輯部就曾收到過關于盆底功能障礙疾病治療的相關文章,文章內只對治愈率進行了比較,編輯對作者提出要補充計量資料的要求,作者就再未返回。發現此類造假尚較為容易。(2)參考已發表相關論文的數據,進行數據編造。此類數據編造是“有理有據”的編造,在識別時更為困難。為使數據合理,有的作者在數據編造時,在已發表文章數據的基礎上進行小的改動,數據庫系統也不易發現。(3)對數據表述方式進行改變的抄襲,如已發表文章數據為表格的,抄襲文章內用文字描述,或利用他人的數據制作成柱狀圖、餅圖等。數據庫系統對這類抄襲也無能為力。那么編輯部如何尋找分辨出這些新型的更加隱蔽的抄襲的“蛛絲馬跡”呢,建議為:(1)不能過度依賴數據庫系統。在之后,應比對類似文獻,對文章數據存疑時要求作者提供原始數據。(2)利用統計方法與規律發現論文數據造假。劉青海[2]提出,可以用excel對統計結果進行驗證,同時利用“其他變量固定時,隨著統計檢驗量絕對值的增加,P值相應變小”等統計學規律,發現論文數據造假的痕跡。(3)成立專門的數據編委會對數據進行審核。《科學》雜志為了應對逐漸增多的數據造假,在原有審稿規則的基礎上,加入了專業統計學家對論文數據審核這一環節。2013年,雜志還正式公布了第一批數據標準清單,供投稿者和研究者與自己的研究數據進行對照,以追蹤數據偏差的根源和進行可重復性驗證[3]。如果編輯部囿于實際情況的限制,無法設立專門的數據編委會,也應加強對編輯統計學基礎知識能力的培訓,提升其數據審核方面的能力。
3圖片造假、抄襲
圖片造假、抄襲也是一種數據造假,但由于其特殊性,故本文將其單列出來進行討論。隨著數據庫系統的使用,單純的文字抄襲能得到較好的識別。但國內的不端文獻檢測系統大多是將圖片自動剔除后進行的,故圖片造假、抄襲成為近年來論文造假的重災區。葉青等[4]將圖片學術不端行為分為3類:圖片偽造、圖片篡改、圖片剽竊。因目前圖片處理軟件非常多,且使用方便快捷,作者將圖像進行調色、飽和度改變、裁剪、拼接等操作后,編輯僅靠肉眼是很難進行真實性判斷的。針對這一類較為隱蔽的圖片學術不端行為,編輯部可以從以下方向進行應對:(1)注意圖片像素:剽竊他人的圖片一般為下載、在論文中截取、重新拍攝、掃描等方式獲得,圖片像素不高,可向作者索要原始圖片。(2)查看圖片的文件屬性:余菁等[5]通過使用MagicEXIF軟件查看圖片EXIF信息,“XMP數據”和“Pho-toshop資源”,發現如果是小的改動一般也要幾千到一萬字節,從而鑒別是否進行了圖片篡改。(3)注意對圖片的文字描述的:作者為了應對同行評議,在圖片抄襲時往往使用類似文章中的圖片,編輯可查找對圖片進行文字描述類似的文章原文,再進行圖片比對。(4)利用數據庫中的圖片庫:通過在學術圖片庫中進行關鍵詞檢索,對類似圖片進行比對。此外,除了從編輯部內對圖片學術不端進行控制,還應加強專家外審與主編復審階段的圖片審核。專家和主編在本行業和專業領域中,見多識廣,對圖片真實性存疑的稿件,編輯應和專家多溝通,征求他們的意見。徐晶等[6]還提出,在出版后,數據庫應對圖片加密,使他人不得從下載的pdf或caj文檔上拷貝圖片,以防止圖片抄襲。
學術期刊的數字化傳播
人工智能(ArtificialIntelligence)是研究、開發用于模擬、延伸和擴展人的智能行為的綜合性學科[1]。人工智能正在改變數字媒介,為學術期刊的數字化傳播帶來新的知識譜系和更富個性化的內容,并使得跨平臺共享成為可能,其優勢主要是信息與受眾間圍繞信息內涵和外延的交互性增強。人工智能技術有助于解決中國學術期刊在傳播過程中普遍存在的受眾定位不清、傳播形式缺乏吸引力、與受眾互動不足、用戶黏性和活躍度較低等問題。學界對人工智能技術在學術期刊傳播中的應用已有初步探討。主流的研究視角是概述性地討論人工智能在期刊傳播中的作用,例如:劉闖[2]指出人工智能可以積極分析用戶需求,通過對用戶靜態/動態屬性的分析構建知識圖譜,從而優化用戶瀏覽效果;陳鴻等[3]指出人工智能對期刊發展可起到政治支持、技術支持、觀念支持和行為支持的作用;向颯[4]指出人工智能可加速學術出版的流程再造,實現選題策劃便捷化、生產印刷按需化、營銷發行精準化和知識服務智能化等愿景。部分學者分析了人工智能在期刊傳播中的應用困境,如范軍等[5]和劉平等[6]認為阻礙人工智能與出版業融合的關鍵因素有弱智能限制出版自動化、專業出版人才建設乏力、版權和責任風險大、生產方式觸及倫理法律邊界。還有學者分析了人工智能時代期刊傳播的發展趨勢,如張耀銘[7]指出建設國家級數字化學術傳播平臺是學術期刊傳播轉型的關鍵進路。海外學者的研究以2010年為界,此前的研究聚焦于知識管理和專家系統,以對基礎理論和概念的探討為主,此后更多關注集群優化算法。在人工智能領域論文的數量上,美國是主力軍,中國位居第二,印度和歐洲國家緊跟其后[8],全球人工智能研究排名前10的國家占該領域全球出版份額的74.32%[9]。Wade等[10]指出通過人機交互所發現的用戶意圖,能讓學術服務商更深入地了解研究人員在尋找什么;學術出版商可使用學術知識API(AcademicKnowledgeAPIs)來理解學術用戶搜索的內容,并從微軟學術圖(MicrosoftAcademicGraph)軟件中發掘更多相關信息。他們同時指出,由于技術過于復雜且靈活性不足,語義Web方法(SemanticWebapproach)發展緩慢。總體來看,學界對人工智能在學術期刊傳播中的應用已從理論和實踐方面展開了探討,但仍存在以下不足:(1)大部分研究是概述性地討論人工智能對出版業態整體的影響,而專門探討人工智能應用于學術期刊傳播的研究很欠缺;(2)在少有的探討人工智能與學術期刊傳播融合的研究中,鮮有學者提出流程如何嵌合、平臺如何運行的系統性設想;(3)幾乎沒有學者結合我國的具體案例,剖析人工智能在學術期刊傳播中應用的難點和對策。本研究基于人工智能在出版業應用的現狀,解析人工智能在中國學術期刊傳播中應用的優勢和存在的問題,勾勒基于人工智能技術的中國學術期刊傳播平臺,并結合方正出版大數據平臺,探討本研究設想的平臺的創新性、可能遇到的瓶頸和對策,以期填補當前學界同類研究較少的空缺。
1人工智能應用于學術期刊傳播的現狀與問題
學術期刊的數字化傳播能掌握受眾特征,將傳播主體與受眾匹配,增強傳播效果。當前,中國學術期刊傳播中需解決的關鍵問題即提升傳播效果。
1.1人工智能在學術期刊傳播中應用的現狀
在學術期刊出版領域,人工智能已開始發揮重要作用,主要表現在4個方面。(1)辨別洗稿式論文抄襲。例如,對于形容詞替換、語序調換等修改語句類的抄襲,可利用自然語言處理技術(NaturalLanguageProcessing)識別近義詞,并基于時間遞歸神經網絡技術(LongShort-TermMemory)的記憶特征,識別被改動的語句結構。(2)發掘學術資源和潛在審稿專家。如,美國非盈利機構泰德(TED)旗下的話題分析工具彩虹人工智能(iRis.AI),通過對用戶輸入的語段或論文摘要進行機器學習(MachineLearning),從中提取包含語義背景的關鍵詞,并基于此為用戶推薦與被檢索話題高度相關的資訊和論文。(3)辨別論文數據的可信度,輔助編輯制訂用稿決策。如,通過掃描論文的關鍵信息點(實驗環境、統計方法等),甄別數據篡改的可能。(4)通過算法自動向潛在讀者推送學術資源。如,國際學術出版推廣工具趨勢(TrendMD)能實現論文跨平臺自動推薦,不僅增強了期刊的顯示度,還能精準定位目標讀者群,已被愛思唯爾(Elsevier)、電氣和電子工程師協會(InstituteofElectricalandElectronicsEngineers,IEEE)等采用。具體到學術期刊傳播流程,許多國際出版集團已實現與人工智能技術的融合。如,施普林格-自然(SpringerNature)的關聯開放數據平臺科研圖譜(SciGraph)借助NPG本體(NPGOntologies)進行語義建模,通過數據融合、知識發現、內容計算和語義圖形數據集,提升論文在傳播過程中的可獲得性,為編輯、學者、會議組織者提供知識服務和數據工具[11];愛思唯爾收購了伯克利電子出版社(Bepress)的標志性產品———基于云的機構存儲庫平臺數字共享(DigitalCommons),該平臺具備提供存儲庫、元數據結構、訪問接口和跨機構聚合與發現等功能,有助于愛思唯爾掌握更多論文引證、論文傳播效果方面的數據[12]。部分中國出版商也已運用人工智能技術提升學術期刊的傳播效果。如,世紀超星公司推出的域出版平臺,它具備學術期刊數據庫搭建、移動出版、社交共享等功能,能通過智能畫像了解用戶特征,用算法實現動態精準推送,通過智能社交增強用戶間的聯系[13]。
1.2人工智能在學術期刊傳播中應用的優勢
實現論文呈現多媒體化,優化內容分發,增強傳播效果。一方面,學術期刊可通過智能語音和知識圖譜技術,用適配多種設備的方式對論文進行再加工,增強論文的可讀性,為論文增添音頻和視頻傳播形式;另一方面,采用人工智能技術對用戶研究領域、教育背景、閱讀喜好、閱讀完成度進行分析,可優化內容聚合和分發機制,解決信息過載與用戶個性化需求間的矛盾。如,數據搜集公司圖譜(Graphiq)已開發出語義搜索引擎知識圖譜(KnowledgeGraph),它允許用戶根據話題展開搜索,獲得相關主題的數據集,還能生成與報道內容匹配的可視化圖表[14]。辨別讀者觀點,評價和反饋傳播效果。一方面,采用人工智能技術對用戶閱讀時長、用戶社交分享等信息進行解析,可了解論文影響讀者的具體方面和程度;另一方面,通過自然語言理解(NaturalLanguageUnderstanding)、語音識別、深度神經網絡(DeepNeuralNetworks,DNN)等技術,學術期刊能從讀者在社交媒體上對論文的評價中,辨別讀者觀點,掌握比論文瀏覽量、下載量和被引頻次更精準的學術反響。如,威盛電子研發的人工智能平臺“歐拉密”,其能實現對90%的語言的語義理解,從而實現提問、信息記憶、知識輔助理解和歧義消除等功能[15]。