前言:尋找寫作靈感?中文期刊網用心挑選的期刊有效信息密度測度研究,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
1引言
近10年來我國CSSCI核心期刊載文量出現了持續下降現象(見圖1).自CSSCI核心期刊產生以來,我國人文社會科學論文大致呈現了兩個發展階段:第一階段是1998-2009年,其特點是載文量總體處于上升態勢,從1998年的67805篇增加到2009年的150069篇,平均每年增長7.49%;第二階段是從2010年至今,載文量持續下降,2019年載文量為119866篇,平均每年下降2.22%.經濟管理類論文發展規律與人文社會科學所有期刊基本相同.經濟管理類論文也分為兩個階段:第一階段是1998-2009年,載文量總體處于上升態勢,從1998年的21607篇增加到2009年的48102篇,平均每年增長7.55%;第二階段是從2010年至今,載文量持續下降,2019年載文量為32397篇,平均每年下降3.88%.在人文社會科學研發經費和研發人員持續增加的情況下,載文量下降是不正常的.根據教育部中國人文社會科學信息網公布的數據,2009年我國人文社會科學研發經費為54.63億元,研究人員為425939人,2018年研發經費為190.54億元,研發人員為764235人,平均年度增長率分別為13.31%和6.02%,均處于高速增長狀態.由于廣大高等院校是人文社會科學研究成果產出的主要力量,在人文社會科學投入不斷增加的情況下,無論是CSSCI期刊論文還是經濟管理類期刊論文均同步下降,這進一步說明其中包含著人為的因素,是一種異常現象.研究學術期刊的信息密度及其測度問題非常重要.所謂學術期刊的信息密度,就是單位版面內期刊學術論文知識和信息量的平均大小.在學術期刊版面相對不變的情況下,載文量下降意味著論文篇幅變長,總體上反映了期刊信息密度的下降.當然對于這個問題的分析只局限于宏觀層面,對于微觀而言,決定單篇論文信息量的完全是其內容,與篇幅長短并沒有太大的關系.在載文量下降背景下,研究期刊的信息密度測度問題具有十分重要的意義:(1)有利于補充完善現有學術期刊信息密度測度指標的不足;(2)分析信息密度指標與其他文獻計量指標之間的關系,豐富學術期刊評價理論;(3)有利于防止人為降低信息密度現象,穩定載文量,促進學術期刊健康發展.學術期刊的信息密度最早是指每個印張的平均論文數量.1994年國家科學技術委員會頒布五大類科技期刊質量要求及評估標準,其中信息密度是指每個印張刊載結構、概念完整的文章數量的多少,規定信息密度在5篇/印張以上才可評為優,低于3篇/印張則列為不合格.這項規定當時對于期刊載文量增加有顯著影響,隨著這項規定逐漸被廢除,一直到2009年前后,這種影響才逐漸消除.當時對信息密度的界定確實存在不少問題.何英、李育琪等通過對版心尺寸進行修正進一步優化了版面信息密度評價指標[1].孫景峰認為學術期刊的信息密度是測定期刊輸出能力和生產率的一個基本依據,是評價期刊有用性的主要指標之一,但每印張論文數量并不科學[2].李曉紅、馮保初指出過分強調信息密度,限制論文篇幅,影響論文完整性,不利于閱讀和引用,對學術風氣也有不良影響[3].趙均認為信息密度不能作為學術期刊評價指標中的定量指標來使用,但是用作定性指標還是非常有意義的[4].王蔚良、陳詠梅認為文章的長短與其學術質量沒有一個必然關系,不同學科和不同體裁的論文篇幅也有差異[5].針對近年來學術期刊出現的載文量下降現象,李睿認為論文的核心在論證,所以應該關注論證質量,而不是刻意增加篇幅[6].許力琴、顧黎等認為載文量減少而頁碼不變,會使期刊的信息密度減少,從而漸漸演變成虛腫的、隱形的“亞健康”狀態,一些期刊通過壓縮載文量、做小分母來增加影響因子是不對的[7].鑒于信息密度存在的問題,方潤生提出了科技期刊有效信息密度的概念,分析了科技期刊有效信息密度、期刊目標、讀者需求之間的關系[8].史春薇、趙杉林等根據我國科技期刊的現狀,介紹了有效信息和無效信息的概念,分析了產生無效信息的原因,主要有中英文摘要過長、推導過程太詳細、專業應知應會的知識介紹過多、科研背景介紹過多、參考文獻過多和圖表加英文標題[9].李世濤認為論文的學術水平高,出版周期短,可讀性強,信息含量就高,編輯的責任感和高素質是擴大信息量的保證[10].曾紹倫、陳于后等研究了信息密度指標與已有期刊評價結果之間的關系,結果表明信息密度指標與期刊影響因子、平均引文數和篇均頁數均呈現負相關關系[11].從現有的研究看,關于信息密度問題的相關研究主要是早年國家提出信息密度考核規定后不久,一些學者開展的相關領域的研究,隨后此類研究逐漸淡出人們的視野.隨著近年來期刊載文量的下降,學術界重新開始關注這個問題.對于單純用每印張論文數量衡量信息密度的作法,學術界總體上持反對態度,認為其不能很好地反映信息密度,其負面效應較大.還有一些學者從廣義有效信息密度的角度進行了一些分析,但缺乏定量研究.總體上在以下方面有待進一步深入:(1)擯棄每印張論文數量作為信息密度指標,卻沒能提出更好地反映信息密度或有效信息密度的指標;(2)在載文量異常下降的背景下,迫切需要引入期刊有效信息密度考核指標,以防止載文量異常下降現象日趨嚴重;(3)如果設計出期刊有效信息密度考核指標,有必要分析其與其他文獻計量指標之間的關系,從而對該指標的適用條件和注意事項作進一步的討論.本文以CSSCI經濟學期刊為例,基于中國知網(CNKI)的引文數據,根據期刊擴散情況、關鍵詞數量和載文量,提出一個新的反映期刊有效信息密度的指標———期刊信息密度因子,然后分析其與其他文獻計量指標的關系,并對其適用條件進行了討論.
2期刊信息密度因子提出的原因及其原理
2.1近年來期刊載文量下降原因及危害分析
期刊載文量持續下降的原因,很大程度是為了提高期刊的影響因子.影響因子的計算公式是用學術期刊過去兩年在統計年度的被引次數除以載文量.由于分母是載文量,因此人們誤認為只要篩選出優秀論文,另外適當降低載文量,就能提高影響因子.這是影響因子操控現象之一,是不道德的.法拉加(FalagasME)和阿萊克西歐(AlexiouVG)系統歸納了影響因子操控的行為,包括學術宣傳、引用干涉、拒絕消極研究、增加綜述論文、喜歡合著者多的論文、拒絕隱藏摘要研究、發表熱門話題論文、喜歡名家論文等等[12].俞立平、宋夏云等基于情報學期刊的研究發現,載文量與影響因子無關[13].劉晨霞、張昕等對涉農類科技期刊的研究發現,對載文量較小或較大的期刊而言,影響因子與載文量正相關,對載文量中等的期刊而言,影響因子與載文量呈負相關,但擬合優度并不高[14].降低載文量是否能提高影響因子,本質上取決于學術期刊是否能夠篩選出優秀論文.如果學術期刊因為載文量的限制剔除的那些論文已經達到了發表要求,那么降低載文量不僅不能提高影響因子,反而有可能降低影響因子.如果人文社會科學研究水平提升很快,期刊稿源非常豐富,那么這種情況出現的概率就非常高.而我國目前即是這種狀況,作為具有一定研究質量的CSSCI核心期刊,其論文錄用率總體偏低.撇開載文量與影響因子的關系不談,人為降低載文量還會帶來其他負面效應:(1)迄今為止,通過載文量操控影響因子的行為主要存在于中國,國外尚未見報道,這極大地影響了我國學術期刊的聲譽;(2)在相同版面下,人為降低載文量犧牲了期刊的知識和信息含量,不利于人文社會科學的健康發展,也是學術期刊缺乏社會責任的體現.對于單篇論文而言,在保證論證完整性的前提下,論文篇幅加長并不能增加信息量,信息密度反而會降低;(3)我國人文社會科學期刊辦刊資源和辦刊能力總體上比較豐富,如果說2009年論文達到高峰時辦刊資源尚顯不足的話,那么經過10年的發展,這個問題也得到了根本改善.人為降低載文量,本質上是對辦刊資源的一種浪費.
2.2簡單用論文篇幅來衡量信息密度的缺陷
傳統采用每印張論文數量衡量期刊信息密度之所以受到學術界反對,主要有以下原因:(1)學術論文的信息量或者知識含量主要是由其內容決定的,論文篇幅雖然某種程度上能反映一定的問題,但畢竟有限;(2)人為限制信息密度的方式大致有以下幾種:一是人為延長論文的長度,降低信息密度;二是將長篇論文分為兩篇,同樣降低信息密度;三是縮小論文長度,表面上能提高信息密度,但可能導致論文論述不夠全面,影響論文質量.不管什么方式,都是強行用形式來影響內容,均不可取;(3)期刊信息密度受學科發展速度影響,此外不同學科期刊的信息密度也存在較大差異,不宜一概而論;(4)用傳統論文篇幅指標衡量信息密度,信息密度并非越大越好,如果精簡過多,導致論文難以看懂,這也影響了信息和知識傳播,本質上還是會降低信息密度;(5)我國學術期刊屬于準公共物品,論文篇幅本質上應由作者和學術共同體決定,作為期刊主管部門,本不應加以干預,除非學術期刊出現市場失靈現象.綜上所述,不宜直接采用載文量、論文平均篇幅、每印張論文數量等簡單指標衡量學術期刊的信息密度.
2.3期刊信息密度因子的原理
(1)期刊關鍵詞視角對于某一學術期刊而言,關鍵詞數量越多,說明其涉及的領域越廣闊,擁有的信息密度越大.當然不同期刊的辦刊風格不同,有的期刊在某一相對較窄的領域內展開研究,擁有較少數量的關鍵詞,有的期刊在相對較寬的范圍內研究,擁有更多的關鍵詞.從研究問題和話題的角度,一般而言,擁有更多關鍵詞的期刊信息密度較大.當然,關鍵詞也只是衡量信息密度的一個方面,兩篇論文關鍵詞相同,長度相同,信息密度也可能相差較大,完全取決于論文內容,由于尚沒有很好的指標能直接反映內容,所以本文暫時從關鍵詞的視角進行一些探索.本文提出一個新的指標———關鍵詞指數KW,即用期刊關鍵詞數量除以載文量.需要注意的是,對于一些專業性比較強的期刊,其關鍵詞數量總體上偏少,在這種情況下,只要做到同類可比,即在評價時注意必要的細分,就可以有效地防止這個問題.(2)期刊論文擴散視角期刊后,從被引用期刊角度也可以反映其信息密度.弗蘭森(FrandsenTF)提出新擴散因子(NewJurnalDffusionFctorsoia,NJDF),即用期刊被引用刊數除以期刊載文量[15].一般而言,期刊后,引用其論文的往往是同學科的期刊,此外還有一些相近學科的期刊.對于人文社會科學而言,由于中國學科分類相對較細,因此引用期刊所跨學科相對就會多一些.比如美國將經濟管理學科分為一個學科———經濟學與商學,而我國分為理論經濟、應用經濟、工商管理、管理科學與工程、公共管理、農林經濟管理、圖書館情報與檔案管理等許多分支學科.不同期刊的辦刊風格、選題范圍、重點內容相差較大,某一期刊論文被引用刊數越多,說明該期刊覆蓋的學科領域越大,研究內容越廣泛,相對而言就擁有更高的信息密度.之所以不用擴散因子表示信息密度,因為擴散因子是期刊每100次引用所涉及的期刊數,從引用角度看,許多引用信息是重復的,難以衡量信息密度.(3)期刊信息密度因子的提出基于以上分析,采用關鍵詞指數、新擴散因子與載文量同時衡量信息密度是一個較好的選擇.本文基于并聯電路的原理,采用調和平均數來計算期刊信息密度因子.關鍵詞指數、載文量和新擴散因子均可以用來測度信息密度,前兩個是來源指標,第三個是引用指標,三者的共同作用決定了期刊信息密度因子的大小,但是其作用機制并不清晰,傳統加權匯總的評價方法并不合適,因此采用并聯電路計算電阻的原理來計算其共同效果即期刊信息密度因子的大小是合適的.由于期刊信息密度因子計算時,原始指標關鍵詞指數、載文量和新擴散因子的量綱并不相同,因此,首先要進行歸一化處理,采用極大值方法進行標準化:
3研究數據與實證結果
3.1研究數據
本文以2019-2020年版CSSCI核心期刊中的70種經濟學期刊作為研究對象.研究數據來自中國知網(CNKI)的引文數據,可以檢索到一定時間范圍內的期刊關鍵詞數量、被引刊數、載文量,這樣可以計算關鍵詞指數和新擴散因子,進而計算出期刊信息密度因子.為了分析期刊信息密度因子與其他文獻計量指標的關系,進一步檢索出影響因子、h指數.需要注意的是,為了使數據具有可比性,必須界定同一時間范圍,因此本文載文量時間范圍為2016-2017年,被引量即統計年度為2018年.
3.2實證研究結果
3.2.1期刊信息密度因子的計算
經濟學期刊信息密度因子的計算結果如表2所示,排在前面的期刊是«經濟縱橫»«農業經濟問題»«經濟研究»«現代經濟探討»«中國工業經濟»等.作為經濟學領域公認的權威期刊«經濟研究»排第3位,主要原因是其新擴散因子排第8位,載文量排第10位,但關鍵詞指數不高,僅排66位.在傳統的CSSCI評價中«經濟研究»肯定排在第一,但這主要是從期刊影響力角度進行排序的,本文排序不一致,恰好說明信息密度因子提供了期刊的一些新的信息.期刊信息密度因子描述統計如圖2所示,其均值為0.149,極大值為0.205,極小值為0.083.有趣的是,在許多文獻計量指標并不服從正態分布的情況下,期刊信息密度因子的JarqueGBera檢驗值為1.147,p值為0.564,不能拒絕正態分布的原假設,即期刊信息密度因子服從正態分布,這是作為評價指標的一個較好性質.
3.2.2期刊信息密度因子構成要素之間的關系
首先,期刊信息密度因子指標,綜合了關鍵詞指數、新期刊擴散因子和載文量3個指標,而這3個指標又都與期刊的載文量直接相關,在一定程度上可能導致對“載文量”數據的過度性(或冗余性)使用依賴,有可能會降低期刊信息密度因子的評價效果.如果載文量指標統計比較復雜,這個問題當然需要重視.但是載文量作為文獻計量學的基礎指標,界定清晰,統計相對簡單,不會帶來統計誤差,因此不會帶來對關鍵詞指數、新期刊擴散因子統計的影響。其次,有必要分析關鍵詞指數、新擴散因子和載文量的關系,或者其原始信息提供能力.在期刊信息密度因子的構成要素中,關鍵詞指數、新期刊擴散因子中的載文量都在分母上,與關鍵詞指數、新期刊擴散因子負相關,而載文量指標作為一個單獨的指標,是正向的.這樣兩個指標負相關,一個指標就是載文量自身,是正向的,正負指標共同作用會產生一定的稀釋效果,從而降低了期刊信息密度因子與載文量之間的關系,總體上是值得肯定的.關鍵詞指數和新擴散因子之間正相關,相關系數不高,為0.153,關鍵詞指數與載文量負相關,相關系數也不高,為-0.348,新擴散因子與載文量也是負相關,相關系數也較低,為-0.369.相關系數同時有正有負,總體相關度不高,說明這3個指標均能提供獨立信息,冗余信息較少,是理想的評價構成要素.
3.2.3文獻計量指標與期刊信息密度因子的關系
期刊信息密度因子與影響因子、h指數、載文量的關系如表4所示.期刊信息密度因子與影響因子的相關系數為0.419,與h指數的相關系數為0.707,與載文量的相關系數為0.633.信息密度與影響因子相關度較低,說明其能夠提供除了期刊影響力以外的其他信息.h指數是一個兼顧影響力和質量的指標,其與信息密度相關度較高,說明信息密度一定程度上反映了期刊的質量和影響力.信息密度與載文量相關度中等,這是因為信息密度計算時已經包括了載文量因素.
3.2.4獨立樣本t檢驗
(1)影響因子高低對期刊信息密度的影響
將影響因子由高到低排序,最高的為«經濟研究»,影響因子為18.793,最低的為«世界經濟與政治論壇»,影響因子為2.643.大致根據30∶70的比例進行分類,影響因子高于7的期刊有20種,據此將期刊分為高影響因子期刊與低影響因子期刊.高影響因子期刊信息密度因子的均值為0.159,低影響因子期刊信息密度因子的均值為0.144,兩者相差不大.獨立樣本t檢驗值為1.928,p值為0.058,不能拒絕原假設,因此影響因子與期刊信息密度因子無關,這一點和回歸分析的結果一致.由于影響因子在學術期刊評價中所占地位比較重要,而期刊信息密度因子與其不相關,這是作為評價指標的一個非常好的性質.
(2)h指數高低對期刊信息密度的影響
將h指數由高到低排序,最高的為«經濟研究»,h指數為66,最低的為«勞動經濟研究»,h指數為11.同樣大致按照30∶70的比例進行分類,h指數高于30的期刊有21種,據此將期刊分為高h指數期刊與低h指數期刊.高h指數期刊信息密度因子的均值為0.173,低h指數期刊信息密度因子的均值為0.138.獨立樣本t檢驗值為5.446,p值為0,拒絕原假設,說明高h指數期刊的信息密度均值大于低h指數期刊.
(3)載文量高低對期刊信息密度的影響
將載文量由高到低排序,繼續大致根據30∶70比例進行分類,發現2016-2017年載文量超過300篇的期刊共有18種,最高的是«稅務研究»,載文量為615篇,最低的為«世界經濟文萃»,載文量僅為76篇.18種高載文量期刊的平均期刊信息密度因子為0.175,剩下的52種低載文量期刊信息密度因子均值為0.139.獨立樣本t檢驗值為5.410,p值為0,拒絕原假設,說明高載文量期刊的平均信息密度要高于低載文量期刊的平均信息密度.
4結論與討論
4.1學術期刊信息密度問題應該引起足夠的重視
最近10年來我國CSSCI核心期刊和經濟管理類期刊的載文量出現持續下降的現象,這在人文社會科學經費投入快速增加的背景下是不正常的,其主要原因是影響因子操控問題.學術期刊試圖通過控制載文量來提高影響因子,但這樣做犧牲了期刊的知識和信息量,浪費了辦刊資源,而且目前通過載文量操控影響因子現象主要出現在中國,這非常不利于我國學術期刊界的整體形象,對于這個問題必須引起足夠的重視.
4.2信息密度因子可以用來測度期刊的信息密度
本文采用新擴散因子、關鍵詞指數、載文量3個指標標準化后進行調和平均來反映信息密度,這3個指標之間相關度較低,能夠提供獨立原始信息.基于經濟學期刊的數據,綜合采用相關系數、回歸分析、獨立樣本t檢驗的研究表明,期刊信息密度因子與影響因子不相關,與h指數和載文量正相關,能夠提供除期刊影響力以外的信息密度信息,并且期刊信息密度因子服從正態分布,是一個較好的期刊評價指標.
4.3期刊評價指標設計應該具有動態防人為操控功能
影響因子操控現象在學術期刊中并不鮮見,載文量下降僅僅是其中的一種.文獻計量指標的設計應該隨時跟蹤學術期刊的宏觀發展動態,針對其中存在的問題進行動態設計.期刊信息密度因子的推廣有利于防止載文量異常下降,在目前應該作為期刊的評價指標,如果學術期刊信息密度發展逐漸恢復正常,學術質量得到有效保證,那么期刊信息密度因子在評價中的權重可以適當降低。