前言:尋找寫作靈感?中文期刊網用心挑選的網絡直播評論動態預警系統設計,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
摘要:通過分析網絡直播的發展現狀,指出目前直播行業存在的諸多亂象,網絡直播的大環境亟需有效改善。通過對網絡直播用戶評論進行采集,構建基于評論文本和情感詞典的情感分析語料庫,利用SnowNLP算法進行情感分析,據此進行可視化輸出和預警提醒,進而設計出網絡直播評論動態預警系統。該系統的設計可以實現對網絡直播中不良信息的實時監管與預警,并加強對直播過程中網絡輿情的正確引導與管理,有利于維護良好的網絡環境與社會秩序。
關鍵詞:網絡直播;情感分析;動態預警
1研究背景
隨著互聯網技術的日益發展和對大眾生活的滲透,網絡直播這一交互性極強的新型媒介出現并得到了迅速發展。據統計,截至2018年6月,我國網絡直播用戶規模達到4.25億。然而,網絡直播行業在蓬勃發展的同時,也存在諸多亂象。部分主播為了博眼球和快速“吸粉”,甚至進行“平臺造娃娃”“生吃蛆蟲”等低俗表演,還有直播掐死女兒、直播自殺、直播騷擾女生等,負面事件層出不窮,造成惡劣的社會影響。同時,由于直播平臺用戶的匿名性以及直播的強大互動性,廣大觀眾在發表言論時隨心所欲,很多人出口成臟,網絡直播彈幕評論中存在著各種污穢下流、詛咒的詞匯,嚴重影響網絡直播環境,誤導用戶的思想價值觀念。這既不利于網絡直播行業的持續發展,也會對網絡環境與社會秩序產生不良影響。面對網絡直播存在的問題,目前,有關部門已經出臺相關文件并對直播平臺進行了整治,但監管理念升級并不能有效解決直播亂象,監管技術亟待提高。對于網絡直播平臺問題,不僅要完善相關立法規定,更需要在技術上有所創新,實現對直播平臺的實時監控與管理。
2研究綜述
不少學者關注到網絡直播這一新興熱潮,并從用戶參與互動行為、彈幕信息特性等角度對直播中存在的問題進行研究。丁家佳以映客直播為例對直播用戶的互動行為進行研究,對直播亂象的治理提出了建議。喻昕等深入研究彈幕信息特性和彈幕用戶信息參與行為,構建網絡直播平臺中彈幕用戶信息參與行為的理論模型。徐向東分析直播亂象的表現與根源,從政府管理、行業自律、技術支持等方面提出構建網絡直播治理體系的建議。在綜合的網絡輿情預警領域,有很多學者展開了研究。石魯生等基于模糊綜合評價法提出一種網絡輿情的動態預警方法。張揚等針對網絡信息的特點優化情感識別策略,提出一種基于樸素貝葉斯模型的網絡負面信息預警策略。在高校的網絡輿情領域,牛兵等通過典型案例對網絡輿情的傳播特征和路徑進行剖析,構建高校網絡輿情的研判與預警機制體系。在旅游網絡輿情領域,楊艷霞針對旅游網絡評論信息,實現了一個基于本體的旅游網絡評論情感分析和預警系統。綜上所述,對于網絡直播這一新興熱潮,不少學者已關注到其中存在的問題,并提出了相關監管方法與政策上的建議,但缺乏實質性的解決方案。本文基于所構建的網絡直播評論情感傾向分級機制,對網絡直播評論進行情感分析,并搭建網絡直播評論動態預警系統,進而實時監管網絡直播中的不良信息并加以預警,以期營造一個清朗的網絡直播環境。
3系統設計
3.1系統設計框架
一般而言,大數據的技術體系框架包括數據采集、數據處理、數據分析與應用服務四個環節。本系統的設計目標是對網絡直播用戶的評論進行情感分析,及時發現、提取不良信息并加以預警提醒。通過對系統的需求分析,并借鑒已有大數據技術體系及相關網絡輿情監測預警系統,提出網絡直播評論動態預警系統結構圖。
3.2模塊實現
3.2.1數據爬蟲模塊
對于網絡直播用戶評論信息的采集,本文選取國內直播行業具有代表性的斗魚直播平臺。據統計,游戲直播類APP排行中,斗魚直播活躍人數達到2023萬人,排名第一。斗魚直播是綜合性的直播平臺,涵蓋游戲、電競、二次元、娛樂、綜藝等多種直播內容。因此,斗魚直播平臺的用戶評論數據適合數據分析的需要。利用socket模塊設計針對斗魚直播平臺的爬蟲程序,爬取了37349條用戶評論數據。采集數據的維度包括用戶ID、用戶昵稱、評論內容。采集的用戶評論中,包含一部分無實際意義的評論,如符號評論、刷屏評論等,需要對數據進行清洗。本文利用Excel工具,去除無用評論,得到初步可分析數據集,共25000條數據。
3.2.2情感分析模塊
情感分析模塊通過Python程序實現,主要利用SnowNLP算法和Jieba分詞算法進行編程。情感分析的第一步是構建網絡直播領域的語料庫。由于針對網絡直播評論分析的研究很少,目前尚無較為完整的語料庫,本研究基于詞典和評論文本相結合,進行情感分析語料庫的訓練。通過對知網情感詞典、臺灣大學整理的中文情感詞典、網絡流行語等詞匯集進行整理去重,形成新的情感詞典。此外,將人工標記的數據與情感詞典中對應極性詞匯,分別寫入正負極txt中,一同作為訓練文本,載入情感分析模塊進行訓練,構建情感分析語料庫。在此訓練結果的基礎上,將通過Jieba分詞算法得到的高頻詞寫入訓練文本,高頻詞的持續添加使情感分析語料庫更加豐富,有利于提高情感分析的準確率。同時,隨著訓練評論數量的增加,語料庫也得到不斷豐富。情感分析語料庫構建完畢后,開始對用戶評論進行情感分析。將情感>=0.6的歸為積極情感,將情感<0.6的歸為消極情感,在本文的研究中為了明確顯示情感極性,實現分級預警,進一步對評論的情感極性進行詳細劃分。根據以上情感傾向分析的結果,將負面評論整理出來,用Jieba進行分詞處理和詞頻計算,將高頻詞提取出來,整理并補充到訓練文本中。同時,根據詞頻計算結果制作詞云,詞云能清楚直接的顯示出當前直播間的負面輿論點,可提供給管理人員,以及時進行有效的預警干預。
3.2.3預警推送模塊
預警推送模塊的功能是:根據評論情感值、對應ID累計預警次數等指標,適時向用戶、直播間、平臺管理者推送預警消息。對于預警指標界限的確定,本研究采用德爾菲法。本研究邀請領域專家對預警指標進行預判,經過多輪征詢,專家認為情感值0.1應該作為預警極性的界限,即當情感值小于0.1時,認為該負面評論極大可能產生不良影響,需要及時進行預警干預。根據專家意見,建立了針對網絡直播負面評論的預警分級機制。結合分級機制賦予各個數據模塊指標相應的權重,計算預警結果并進行可視化反饋。將詞頻、詞云、預警等級進行可視化輸出,呈現給用戶、直播間、平臺管理者三個接收端,并進行預警提醒。在輕度預警情況下,對用戶進行消息提醒警告;對于中度預警,需要進行一定的違規懲罰,如禁言、封號一定時間;而對于重度預警,需要引起重視,通知平臺管理者及時進行人工干預。
3.3系統的工作流程
3.3.1系統的實施流程
基于網絡直播評論預警系統的整體結構設計,結合其他領域較為成熟的預警邏輯,形成網絡直播用戶評論預警流程。系統對網絡直播中的用戶ID、評論內容、評論時間等信息進行收集,經過預處理,形成可分析的數據集,利用大數據分析技術和語料庫進行情感分析,計算權重化的預警結果,并將其進行可視化輸出,將預警結果反饋到用戶端、直播間以及管理端。當結果值超過預警指標時,系統需要實施干預,以實現有效的預警與監管。系統自動收集分析數據、實施干預等,省時省力,彌補了大量人工監管中不及時、不全面、耗費大等缺點,但系統處理有時會過于客觀、機械,也需要一定的人工參與,使數據收集分析、干預更加科學合理。此外,重度預警也更需要人工的參與,進行重大事件決策處理。
3.3.2系統的可行性分析
該系統的實現具有可行性。首先,基于文本挖掘的輿情預警在旅游、網絡社區等其他領域已經有了成功的嘗試,為網絡直播輿情預警提供了有力的借鑒,說明輿情導向的預測具有現實的可能性。其次,文本挖掘、大數據技術日益發展,為網絡直播輿情分析預警系統的實現提供了有力的技術保障。最后,該系統的應用能幫助網絡直播平臺進行有效的監管,提高直播業的產品服務水平,有利于增強用戶黏性和對投資吸引力,從而促進直播平臺的穩定與持續發展。
4結語
通過對網絡直播用戶評論的采集,基于評論文本和情感詞典進行語料庫的構建,利用SnowNLP算法進行情感分析,并搭建網絡直播評論預警系統,進而實時監管網絡直播中的不良信息并加以預警,實現對直播過程中網絡輿情的正確引導與管理。本研究實現了直播用戶評論分析與負面評論動態預警系統設計,可供網絡直播平臺管理參考借鑒,從技術上對直播間輿情進行有效監管。本研究的情感語料庫還需要進一步的迭代優化,以提高情感分析的準確率,從而實現更加穩定有效的系統預警效果。
參考文獻
[1]丁家佳.從“映客直播”看泛娛樂網絡直播互動[D].安徽大學,2017.
[2]喻昕,許正良.網絡直播平臺中彈幕用戶信息參與行為研究——基于沉浸理論的視角[J].情報科學,2017,35(10).
[3]許向東.我國網絡直播的發展現狀、治理困境及應對策略[J].暨南學報(哲學社會科學版),2018,40(3).
[4]石魯生,陳林,李凱.一種網絡輿情的動態預警方法[J].天津師范大學學報(自然科學版),2012,32(2).
[5]張揚,崔晨陽.基于樸素貝葉斯模型的一種網絡負面信息預警策略研究[J].圖書館雜志,2014,33(8).
[6]牛兵,范君暉.基于傳播閾值的高校網絡輿情預警體系構建[J].統計與管理,2016(2).
[7]楊艷霞.基于本體的旅游網絡評論情感分析與預警系統[J].計算機與數字工程,2016,44(4).
作者:竇倩 陳彩蓉 林琳 單位:江蘇大學管理學院