前言:中文期刊網(wǎng)精心挑選了數(shù)據(jù)分析方法范文供你參考和學(xué)習(xí),希望我們的參考范文能激發(fā)你的文章創(chuàng)作靈感,歡迎閱讀。
數(shù)據(jù)分析方法范文1
[關(guān)鍵詞]新媒體營銷;企業(yè)轉(zhuǎn)型升級;市場營銷模式
1引言
新媒體營銷是隨著互聯(lián)網(wǎng)技術(shù)不斷發(fā)展而衍生的重要產(chǎn)物,它是以移動平臺為載體,以信息技術(shù)為橋梁而實現(xiàn)的企業(yè)網(wǎng)絡(luò)市場競爭的過程。這種模式的出現(xiàn)意味著企業(yè)與現(xiàn)代科學(xué)技術(shù)的接軌,是企業(yè)智能化數(shù)據(jù)化發(fā)展的鮮明體現(xiàn)。企業(yè)在新媒體平臺和技術(shù)的指導(dǎo)下,能夠依靠各類先進(jìn)技術(shù),轉(zhuǎn)變自身的發(fā)展方式。其中最為突出的應(yīng)用便在于企業(yè)對數(shù)據(jù)分析的引進(jìn)。
2分析數(shù)據(jù),確立市場受眾群體
企業(yè)要想在眾多新媒體平臺營銷中脫穎而出,就必須掌握符合自身市場定位的消費群體,要讓自身生產(chǎn)的產(chǎn)品能夠有廣泛的接受度,要取得屬于自身獨有的市場信任感和公信力。這也就意味著企業(yè)要主動出擊,積極地吸引消費者群體的關(guān)注和重視。如果一個企業(yè)發(fā)展自身新媒體營銷的方法,僅僅是通過水軍或者是買來的粉絲,或者是通過轉(zhuǎn)發(fā)抽獎等,那么這個企業(yè)只會在短時間內(nèi)取得一定的爆發(fā)式關(guān)注,無法取得長遠(yuǎn)的市場利益,也沒有辦法真正的給消費者留下深刻的印象,自然也不能根據(jù)消費者的喜好和興趣制訂出針對性的市場營銷方案。這就需要企業(yè)通過數(shù)據(jù)分析的方法來明確自身的受眾群體。[1]首先,企業(yè)要用數(shù)據(jù)分析的方法,對自身已有的市場發(fā)展基礎(chǔ)進(jìn)行系統(tǒng)的分析和總結(jié),整理出自身的市場定位和發(fā)展特點,包括品牌形象、競爭優(yōu)勢、產(chǎn)品性質(zhì)等。在此基礎(chǔ)上,大致地規(guī)劃消費者的群體范圍,制訂相應(yīng)的宣傳方案和宣傳規(guī)劃,同時也要注意把握時間的限制,要盡可能地尋求時間和效益之間的平衡。在這一過程中,企業(yè)要按照消費者的點擊喜好和頻率,來制定有針對性的宣傳模式,這樣可以更為有效地吸引消費者的關(guān)注。其次,企業(yè)要重視用戶之間的傳播和轉(zhuǎn)發(fā),企業(yè)要在吸引一批粉絲的基礎(chǔ)上適當(dāng)?shù)剡M(jìn)行轉(zhuǎn)發(fā)和抽獎活動,擴(kuò)大自身的市場影響力。最后,企業(yè)也要在這一過程中精確自身的市場定位,要動態(tài)地觀察宣傳的成果和績效,要尋找大眾的認(rèn)同感。這便要求企業(yè)要借助數(shù)據(jù)分析和檢索的平臺,搜索與自身宣傳相關(guān)的信息確立關(guān)鍵詞和重點語句,并分析大眾對于自身的評價和看法,更好地改進(jìn)營銷中存在的缺陷和不足。同時要在此基礎(chǔ)上,讓自身的宣傳內(nèi)容更加量化和準(zhǔn)確,更好地提升在用戶之間的口碑。
3分析數(shù)據(jù),確立市場營銷載體
根據(jù)上文所述,企業(yè)在新媒體營銷中所進(jìn)行的宣傳是離不開固定的平臺和載體的,移動平臺是企業(yè)信息和展現(xiàn)自身形象的基礎(chǔ)與保障。因此,企業(yè)要十分重視自身新媒體營銷工具的選擇,要運用數(shù)據(jù)分析的方法精準(zhǔn)地統(tǒng)籌和管理市場營銷的信息,推動網(wǎng)絡(luò)營銷能夠適應(yīng)自身發(fā)展的特點和規(guī)律。同時,數(shù)據(jù)分析方法還可以把企業(yè)自身經(jīng)營的特點與不同的新媒體平臺進(jìn)行融合,對比其結(jié)合后的實際效益和成果,同時也可以與事先的市場規(guī)劃設(shè)計相比較,在此基礎(chǔ)上選擇最為合適的企業(yè)新媒體營銷載體。[2]之所以運用數(shù)據(jù)分析的方法來選擇企業(yè)新媒體營銷載體,是因為現(xiàn)階段網(wǎng)絡(luò)企業(yè)的發(fā)展形式多種多樣,不同的企業(yè)也有自身不同的市場定位和產(chǎn)品特點,彼此之間相互獨立,但是也緊密聯(lián)系。這也就意味著,各類企業(yè)在共同運用新媒體網(wǎng)絡(luò)平臺這一方法進(jìn)行市場營銷的同時,也要根據(jù)自身的發(fā)展特點來選擇適合自己的宣傳載體和工具,只有這樣才可以促進(jìn)宣傳內(nèi)容的有效傳播。當(dāng)下企業(yè)利用新媒體進(jìn)行宣傳的主要形式包括紀(jì)錄片、文字和圖像等,也可以是多種表現(xiàn)形式的結(jié)合。盡管在宣傳方式上具有多樣性,但是否能真正的起到吸引用戶的作用還需要依靠用戶的主觀能動性。這就要求企業(yè)在選擇好自身營銷載體的基礎(chǔ)上,利用后臺運行接收數(shù)據(jù)信息的方法,分析用戶點擊頻率最多的板塊和內(nèi)容,總結(jié)出現(xiàn)階段自身市場發(fā)展應(yīng)當(dāng)跟隨的主流趨勢,以及分析當(dāng)下營銷平臺運行的成果。例如當(dāng)下的微博小程序,就是企業(yè)依靠文字推送或者視頻的方式,與用戶建立線上的交流和溝通,在此基礎(chǔ)上根據(jù)用戶的點擊頻率來制訂出更有針對性的市場營銷方案。
4分析數(shù)據(jù),確立信息展示模式
現(xiàn)階段,有許多企業(yè)建立了自身運營的自媒體平臺,有相當(dāng)一部分是需要用戶下載相應(yīng)的軟件,并注冊賬號才可以獲得相關(guān)的信息。用戶在注冊之后,便可以通過在移動端登錄的方法來完成后續(xù)操作。[3]但也正是因為這種登錄方法的存在,用戶會獲得比其他平臺更多的市場信息。這就在一定程度上激發(fā)了用戶的厭煩心理,有相當(dāng)一部分用戶會由于時間的限制,直接略過企業(yè)所的信息。同時,也有一部分企業(yè)將自身的信息運用網(wǎng)頁鏈接或者是二維碼的方式展現(xiàn)出來,用戶必須要在登錄網(wǎng)站的基礎(chǔ)上再一次點開網(wǎng)頁鏈接,這就會讓用戶覺得瀏覽信息是一件非常煩瑣的事情。因此,企業(yè)要重視自身信息展現(xiàn)形式的轉(zhuǎn)變,企業(yè)要盡可能地選擇簡潔明了的形式突出自身信息的重點,要讓用戶可以看到自身營銷的優(yōu)勢和特點。企業(yè)可以用數(shù)據(jù)分析的方法,統(tǒng)計出用戶容易接受的信息展現(xiàn)形式,并按照類別進(jìn)行劃分。當(dāng)下,用戶容易接納的是企業(yè)圖文并茂的信息展現(xiàn)形式,可以是圖片和文字鏈接的結(jié)合,也可以是視頻和文字鏈接的結(jié)合,或者是將鏈接安置在圖片上。企業(yè)就可以根據(jù)用戶的喜好,將自身內(nèi)容展現(xiàn)的形式進(jìn)行改革和優(yōu)化,例如企業(yè)可以將市場經(jīng)營的方向和產(chǎn)品的性能,利用形象化的圖片展示出來。讓用戶可以一眼就看到自身的品牌特色,提高自身的吸引力。在這一過程中企業(yè)要意識到信息真實準(zhǔn)確表達(dá)的重要性,企業(yè)可以在原有的基礎(chǔ)上進(jìn)行適當(dāng)?shù)劁秩竞蜐櫳遣荒芴摷傩畔ⅲ荒芸浯笃湓~,不能讓用戶接受錯誤且夸張的市場營銷數(shù)據(jù)。
5分析數(shù)據(jù),確定市場發(fā)展價值
企業(yè)運用數(shù)據(jù)分析的重點不僅是要打造更為針對性的市場營銷方案,更是要在數(shù)據(jù)信息的分析過程中審視自身的市場經(jīng)營價值,分析自身的發(fā)展建設(shè)前景,評估現(xiàn)階段自身方案的質(zhì)量和效益,并以此來為未來的長遠(yuǎn)發(fā)展打下堅定的基礎(chǔ)。因此企業(yè)要用數(shù)據(jù)分析的方法,對自身新媒體運營平臺進(jìn)行階段性和周期性的監(jiān)督,分析現(xiàn)階段自身在市場競爭中的地位。[4]監(jiān)督的內(nèi)容主要包括平臺粉絲的瀏覽量和點擊率、粉絲的轉(zhuǎn)發(fā)量、粉絲總量的增減、除粉絲之外的市場其他用戶點擊率,以及現(xiàn)階段市場營銷的經(jīng)濟(jì)利潤和收益等。這樣就可以在很大程度上幫助企業(yè)確定自身營銷平臺選擇的正確性,分析自身市場發(fā)展定位的準(zhǔn)確性。
數(shù)據(jù)分析方法范文2
關(guān)鍵詞:供電企業(yè);信息安全;大數(shù)據(jù);分析方法;思路;探討
前言
智能化的電網(wǎng)正在全面地實施建設(shè)。隨著以大數(shù)據(jù)為中心的IT技術(shù)的不斷融入,當(dāng)前我國的供電企業(yè)展開了大數(shù)據(jù)分析的研究,以便更好地使得大數(shù)據(jù)應(yīng)用到整個配網(wǎng)的規(guī)劃當(dāng)中。此外,還要根據(jù)電網(wǎng)的實際數(shù)據(jù)情況,把數(shù)據(jù)應(yīng)用到智能變電站的建立、智能電網(wǎng)的調(diào)度及供電信息的采集等各個方面。進(jìn)而有效地提高我國供電企業(yè)的管理水平及處理業(yè)務(wù)的能力。然而,信息化新技術(shù)在應(yīng)用的過程中也具有一定的風(fēng)險因素,所以需要建立大數(shù)據(jù)的安全分析結(jié)構(gòu),進(jìn)而對數(shù)據(jù)進(jìn)行相應(yīng)的處理并把安全分析方法應(yīng)用到整個供電企業(yè)的信息系統(tǒng)中去,進(jìn)而更好地為供電企業(yè)的數(shù)據(jù)安全提供保障。
1供電企業(yè)的信息完全風(fēng)險分析
大數(shù)據(jù)作為供電企業(yè)的管理工具是一把雙刃劍,給供電企業(yè)管理提供了便利,提高供電企業(yè)的管理水平和管理能力的同時,也給供電企業(yè)帶來了一定的挑戰(zhàn)和風(fēng)險因素。使得企業(yè)數(shù)據(jù)處理、收集及傳輸?shù)娘L(fēng)險等級提高。若企業(yè)內(nèi)部的數(shù)據(jù)出現(xiàn)問題,則會使得數(shù)據(jù)在進(jìn)行傳輸?shù)倪^程中被盜取和竊聽,這給企業(yè)的管理帶來了很大的風(fēng)險。除此之外,企業(yè)在進(jìn)行數(shù)據(jù)中進(jìn)行一定的儲存和利用的過程中,也會由于大數(shù)據(jù)系統(tǒng)的內(nèi)部維護(hù)不到位而帶了很大的風(fēng)險。若企業(yè)的數(shù)據(jù)被長時間地竊聽,就會使得不法分子有機(jī)可乘,采用各種方法來對數(shù)據(jù)后臺進(jìn)行攻擊和試探,并尋找系統(tǒng)的薄弱之處。最后實行致命的攻擊,并造成系統(tǒng)的癱瘓。所以,大數(shù)據(jù)給在方便企業(yè)的信息管理的同時,也帶來了一定的信息安全挑戰(zhàn)。
2供電企業(yè)信息安全大數(shù)據(jù)所面臨的數(shù)據(jù)安全的需要
傳統(tǒng)的電力信息系統(tǒng)逐漸地走向了信息化處理的進(jìn)程,智能化的電網(wǎng)模式帶給了供電企業(yè)信息系統(tǒng)數(shù)據(jù)安全更大的要求。每次進(jìn)行數(shù)據(jù)的訪問時,都需要確定數(shù)據(jù)的訪問權(quán)限,并核實訪問者的身份,并查看是否被授權(quán)。供電企業(yè)的數(shù)據(jù)信息需要被完整地保護(hù),并保障其不被刪除或者惡意的篡改。一旦供電企業(yè)發(fā)生一定的突發(fā)事件,需要大數(shù)據(jù)平臺對數(shù)據(jù)進(jìn)行自動的備份,并使數(shù)據(jù)得到安全的保護(hù)。④要采取一定的措施來保證供電企業(yè)的數(shù)據(jù)在運行過程中的安全性不被破壞。⑤要切實保證整個供電企業(yè)的信息系統(tǒng)的網(wǎng)絡(luò)安全,控制供電企業(yè)信息系統(tǒng)的基礎(chǔ)安全信息網(wǎng)絡(luò)和供電企業(yè)內(nèi)部比較重要的業(yè)務(wù)系統(tǒng)的安全。
3供電企業(yè)的信息安全大數(shù)據(jù)分析思路
當(dāng)前供電企業(yè)內(nèi)容的安全信息系統(tǒng)逐漸地向著對抗型的信息安全系統(tǒng)方式轉(zhuǎn)變,并使得電力系統(tǒng)的大數(shù)據(jù)網(wǎng)絡(luò)可以積極地應(yīng)對外界的攻擊。并對潛在的敵人進(jìn)行分析和識別,并歸納總結(jié)當(dāng)前的供電企業(yè)的信息安全大數(shù)據(jù)的風(fēng)險類型,從而采取相應(yīng)的對策,并先發(fā)制人,提高安全大數(shù)據(jù)系統(tǒng)的防御能力。這就是當(dāng)前供電企業(yè)的信息安全大數(shù)據(jù)的分析思路。大數(shù)據(jù)的分析和挖掘技術(shù)需要不斷地融入到大數(shù)據(jù)的安全分析中去,下圖是大數(shù)據(jù)的安全結(jié)構(gòu)分析思路。供電企業(yè)的信息安全大數(shù)據(jù)分析思路是基于技術(shù)的安全分析和理念,是至今為止比較完善的大數(shù)據(jù)安全分析辦法,是供電企業(yè)大數(shù)據(jù)的核心環(huán)節(jié),是對相對分散的信息進(jìn)行采集并實現(xiàn)存儲,并對其進(jìn)行一定的分析,最后把其分析結(jié)果進(jìn)行分發(fā),把所有的安全分析體系結(jié)合在一起,并實現(xiàn)安全技術(shù)的互動。
4供電企業(yè)信息安全大數(shù)據(jù)安全分析結(jié)構(gòu)的數(shù)據(jù)處理
供電企業(yè)的信息安全大數(shù)據(jù)的結(jié)構(gòu)具體根據(jù)業(yè)務(wù)的不同分為不同的數(shù)據(jù)庫進(jìn)行處理。關(guān)系數(shù)據(jù)庫是當(dāng)前最豐富的數(shù)據(jù)庫,是進(jìn)行供電企業(yè)信息安全處理的主要形式。而數(shù)據(jù)倉庫屬于一種多維的數(shù)據(jù)結(jié)構(gòu),可以允許用戶進(jìn)行匯總級別的計算,并對數(shù)據(jù)進(jìn)行觀察。事務(wù)數(shù)據(jù)庫中記錄了每一個事務(wù),并同時附帶了一些相互關(guān)聯(lián)的附加表。文本數(shù)據(jù)庫是對圖象進(jìn)行描述的數(shù)據(jù)庫,文本數(shù)據(jù)庫與圖書館數(shù)據(jù)庫類似。而多媒體數(shù)據(jù)庫則是對圖像以及音頻和視頻的存儲,并用于存放內(nèi)容的檢索。供電企業(yè)的信息安全大數(shù)據(jù)的存儲往往需要先確定好處理的目標(biāo),并對數(shù)據(jù)進(jìn)行量化的處理,最后對數(shù)據(jù)進(jìn)行一定的評估,最后進(jìn)行結(jié)果的展示。將大量的數(shù)據(jù)進(jìn)行集中化的處理可以切實地反映出安全數(shù)據(jù)的指標(biāo),并根據(jù)指標(biāo)對安全數(shù)據(jù)進(jìn)行相應(yīng)的評估。
5供電企業(yè)信息安全大數(shù)據(jù)安全分析方法
當(dāng)前,進(jìn)行供電企業(yè)信息安全大數(shù)據(jù)安全分析的方法有很多,隨著大數(shù)據(jù)的技術(shù)體系逐漸成熟,目前對安全數(shù)據(jù)的分析算法也變得多樣化,很多分析方法比如分類技術(shù)方法、序列分析方法等等對大量的數(shù)據(jù)的分析具有很好的效果。而對于不同的數(shù)據(jù)庫可以采用不同的分析算法進(jìn)行分析。比如,當(dāng)利用關(guān)系數(shù)據(jù)庫和事務(wù)數(shù)據(jù)庫時,就可以利用序列分析的辦法進(jìn)行數(shù)據(jù)的挖掘和統(tǒng)計;而數(shù)據(jù)倉庫除了需要進(jìn)行聯(lián)機(jī)處理以外,還需要進(jìn)行數(shù)據(jù)的挖掘;文本數(shù)據(jù)庫則是利用模式匹配以及關(guān)聯(lián)分析等方法相互結(jié)合來進(jìn)行數(shù)據(jù)的挖掘分析。
6結(jié)論
針對供電企業(yè)的信息安全的大數(shù)據(jù)分析有很多的途徑,在進(jìn)行供電企業(yè)信息安全的大數(shù)據(jù)分析時,需要對供電企業(yè)的安全數(shù)據(jù)信息進(jìn)行全面預(yù)測,并利用多種分析辦法綜合處理。隨著當(dāng)前大數(shù)據(jù)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,根據(jù)大數(shù)據(jù)的分析特點進(jìn)行安全分析的辦法也在不斷地完善。基于信息安全的大數(shù)據(jù)分析方法和思路具有很大的發(fā)展前景,安全大數(shù)據(jù)技術(shù)的不斷革新,使得供電企業(yè)的防護(hù)網(wǎng)絡(luò)更加地發(fā)達(dá),并逐漸實現(xiàn)了供電企業(yè)的大數(shù)據(jù)信息安全的評估系統(tǒng)的完善,使得供電企業(yè)的信息安全大數(shù)據(jù)發(fā)展更為迅速。
參考文獻(xiàn)
[1]鐘志琛.電力大數(shù)據(jù)信息安全分析技術(shù)研究[J].電力信息與通信技術(shù),2015(9):45-46.
數(shù)據(jù)分析方法范文3
【關(guān)鍵詞】大型裝備制造 項目型制造企業(yè) 數(shù)據(jù)分析 決策支持
在我國制造行業(yè)的快速發(fā)展下,提升制造企業(yè)的管理水平已經(jīng)成為當(dāng)前需要重點解決的問題。隨著信息技術(shù)的快速發(fā)展,促進(jìn)了制造企業(yè)數(shù)據(jù)分析和決策支持的發(fā)展。通過創(chuàng)建企業(yè)信息管理系統(tǒng),可以有效提升企業(yè)的生產(chǎn)效率,使各個部門之間的工作更加協(xié)調(diào)。對分散、零碎的信息進(jìn)行充分挖掘和利用。利用決策模型,對企業(yè)生產(chǎn)管理中遇到的問題提供決策支持。
一、基于數(shù)據(jù)倉庫的企業(yè)對集成的應(yīng)用
(一)面向主題性
完成事務(wù)型處理的任務(wù)是傳統(tǒng)操作型數(shù)據(jù)庫進(jìn)行的數(shù)據(jù)組織工作,各業(yè)務(wù)系統(tǒng)間存在相對獨立性,按照一定的主題組織數(shù)據(jù)倉庫中的數(shù)據(jù)。對主題而言,其概念比較抽象,通常情況下,一個主題同時與多個操作型數(shù)據(jù)庫有關(guān)系。例如,在確定企業(yè)的采購訂單時,需要分析供需情況、庫存信息、供應(yīng)商信息等多方面的數(shù)據(jù)的綜合關(guān)系,然后做出最終的決策。
(二)集成性
一般情況下,操作型數(shù)據(jù)庫進(jìn)行事務(wù)處理工作與某些特定的應(yīng)用關(guān)系密切,數(shù)據(jù)庫間具有相對獨立性,通常具有異構(gòu)性。抽取、清理原有分散的數(shù)據(jù)庫數(shù)據(jù),然后對其進(jìn)行系統(tǒng)加工、匯總和整理最終獲得了數(shù)據(jù)倉庫中的數(shù)據(jù),并保證存儲在數(shù)據(jù)倉庫內(nèi)的信息與規(guī)范的信息相一致。例如,在查詢銷售數(shù)據(jù)時,系統(tǒng)會根據(jù)輸入的條件要求,進(jìn)行篩選、整理后提供出最終的決策參考數(shù)據(jù)。
(三)歷史變化的反映
當(dāng)前的數(shù)據(jù)是操作型數(shù)據(jù)庫主要關(guān)注的,但是數(shù)據(jù)倉庫中還包括很多豐富的歷史性信息,系統(tǒng)將企業(yè)從過去某一時點(如開始應(yīng)用數(shù)據(jù)倉庫的時點)到現(xiàn)在各階段的信息完整的記錄下來,企業(yè)可以以這些信息為依據(jù),定量分析企業(yè)產(chǎn)品未來的發(fā)展情況。例如,企業(yè)可以通過分析產(chǎn)品上季度的綜合銷售情況以及市場反映來決策下一季度的生產(chǎn)量。
二、決策支持系統(tǒng)的概況
(一)決策系統(tǒng)的含義
Decision Support System 即決策支持系統(tǒng),簡稱DSS,是指對大量數(shù)據(jù)和數(shù)學(xué)模型與數(shù)據(jù)處理模型等有機(jī)組合眾多模型進(jìn)行綜合利用,通過人機(jī)交互功能,幫助企業(yè)各級決策者完成科學(xué)的決策的新型系統(tǒng)。機(jī)器學(xué)習(xí)(ML)興起于80年代后期,自動獲取知識有了新方法。數(shù)據(jù)倉庫(DW)和數(shù)據(jù)挖掘(DM)兩項新的決策支持技術(shù)興起于90年代中期。數(shù)據(jù)倉庫的發(fā)展是以數(shù)據(jù)庫為基礎(chǔ)發(fā)展的,支持決策是其發(fā)展目標(biāo)。知識發(fā)現(xiàn)(KDD)是面向數(shù)據(jù)庫的機(jī)器學(xué)習(xí)方法發(fā)展的結(jié)果;“數(shù)據(jù)挖掘”是發(fā)現(xiàn)知識的關(guān)鍵步驟。決策的支持也是數(shù)據(jù)庫知識的功能。隨著決策支持技術(shù)的不斷發(fā)展,決策系統(tǒng)逐漸完善。
(二)決策支持系統(tǒng)組成部分
R.H.Sprague 提出DSS的構(gòu)成部分為人機(jī)對話系統(tǒng)、數(shù)據(jù)庫與模型庫的兩庫結(jié)構(gòu)。隨著決策支持系統(tǒng)功能的增強(qiáng)與擴(kuò)大,對模型與方法進(jìn)行分離存儲,因此,數(shù)據(jù)庫、模型庫與方法庫構(gòu)成了 DSS。近年來,DSS 將人工智能技術(shù)、專家系統(tǒng)、知識工程的相關(guān)思想方法引進(jìn)后,以原來的結(jié)構(gòu)為基礎(chǔ),新增知識庫,將推理機(jī)制引入,最終DSS的四庫結(jié)構(gòu)框架形成。
隨著決策支持技術(shù)的發(fā)展提高,決策支持系統(tǒng)的體系結(jié)構(gòu)不斷發(fā)展健全,傳統(tǒng)決策支持系統(tǒng)中的數(shù)據(jù)庫、模型庫與方法庫、知識庫與推理機(jī)、數(shù)據(jù)倉庫、OLAP、數(shù)據(jù)挖掘技術(shù)等都是其組成部分,將引進(jìn)顯性知識與隱性知識同時引進(jìn)到?jīng)Q策支持過程中是這種體系結(jié)構(gòu)最關(guān)鍵的特點,保證推理的結(jié)果更科學(xué)合理,為決策層做出決策提供更高價值的參考依據(jù)。
三、實現(xiàn)數(shù)據(jù)分析與決策支持方法
(一)建立制造業(yè)決策模型庫
當(dāng)前比較常用的決策模型系統(tǒng)如GIS、PDM、ERP、CRM、SCM 等。在選擇決策系統(tǒng)時,需要根據(jù)企業(yè)的發(fā)展戰(zhàn)略來進(jìn)行選擇。通過決策模型,可以為企業(yè)的生產(chǎn)經(jīng)營提供指導(dǎo),使企業(yè)可以更好的把握市場、順應(yīng)市場。企業(yè)用戶決策分析的存放模型是決策模型庫。進(jìn)行決策的模型的建立是以大型制造企業(yè)生產(chǎn)過程中的材料采購、庫存管理、產(chǎn)品生產(chǎn)、市場營銷、財務(wù)管理、人力資源管理、研發(fā)設(shè)計、質(zhì)量管理、售后服務(wù)等方面的數(shù)據(jù)為依據(jù)。決策模型被授予一定程度的權(quán)限,對數(shù)據(jù)進(jìn)行訪問。然后以數(shù)據(jù)倉庫中獲取的數(shù)據(jù)為依據(jù),對用戶指定的目標(biāo)進(jìn)行決策支持。系統(tǒng)描述現(xiàn)有模型的組成元素與其組成結(jié)構(gòu)的知識,模型構(gòu)造過程中的各類推理算法被獲取。以模型構(gòu)建推理算法為基礎(chǔ),使匹配模型的框架由新問題的屬性值填充,最終決策問題模型得以建立。
(二)實施制造業(yè)決策分析
對決策模型進(jìn)行求解的過程就是決策分析的實施。通過理解決策問題獲得用戶需要決策的目標(biāo)、意圖等方面信息,然后利用合適的決策模型分析獲得的數(shù)據(jù),再根據(jù)規(guī)則與模型的求解算法獲得有價值的決策意見,將其提供給用戶。本系統(tǒng)規(guī)范描述每個模型包含的求解算法利用含有通用求解算法的模型很容易求解問題。但是如果沒有求解算法或者不確定利用哪種算法進(jìn)行求解,平臺依據(jù)以前比較成功的相似的案例,將范例的求解方法求解問題。平臺會詳細(xì)記錄取得較好決策效果的案例,并用數(shù)據(jù)層的公用數(shù)據(jù)庫進(jìn)行存放,這樣能夠及時調(diào)用成功的相似案例進(jìn)行決策分析問題的求解。
(三)協(xié)作決策支持的多環(huán)節(jié)性
通常企業(yè)決策不會通過利用單一的決策模型得到。企業(yè)管理的決策方案案是利用了多模型的協(xié)作來實現(xiàn)決策的。協(xié)作決策的實施系統(tǒng)從兩個方面著手。
(1)為實現(xiàn)有效的智能理解需要利用人機(jī)智能交互接口實現(xiàn),分解復(fù)雜的問題,最終可以得到結(jié)構(gòu)有序的子問題、與決策問題有聯(lián)系的事實與數(shù)據(jù)、求解方案等;
(2)參與決策的模型可以利用平臺進(jìn)行調(diào)用,與決策相關(guān)的模型的選擇可以通過分解的子問題實現(xiàn),為了保證多個模型為特定的決策目標(biāo)服務(wù)需要采用協(xié)調(diào)的合作機(jī)制。
數(shù)據(jù)分析方法范文4
關(guān)鍵詞 自組織映射 組織特異性基因 管家基因 基因表達(dá)譜
一、SOM算法介紹
由Kohonen提出的自組織映射(SOM)的神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)中適合用于對數(shù)據(jù)進(jìn)行分類的有效方法。SOM神經(jīng)網(wǎng)絡(luò)包含一個輸入層和一個輸出層,組織成一個二維的網(wǎng)格結(jié)構(gòu)(圖1.1)。該網(wǎng)絡(luò)能夠從任意一個隨機(jī)選擇輸入的結(jié)點開始最終形成一個拓?fù)浣Y(jié)構(gòu)的映射,這個映射反映了輸入模式的內(nèi)在的關(guān)系。但是運用SOM有一些參數(shù)的限制,首先需要指定類別數(shù)目,對映射空間結(jié)點進(jìn)行權(quán)值的初始化等。如(圖1.1)所示,SOM網(wǎng)絡(luò)是一個的映射,如果這個神經(jīng)元被安排在一個平面網(wǎng)格上面的話,這個神經(jīng)網(wǎng)絡(luò)就稱為二維神經(jīng)網(wǎng)絡(luò),因為這個網(wǎng)絡(luò)將一個高維的輸入向量映射到一個二維的平面上面。給定一個網(wǎng)絡(luò),輸入向量是一個維的向量,相應(yīng)的第個突觸向量的第個元素與輸入向量的第個元素相連,這樣,一個維的突觸向量就和第個神經(jīng)元實行連接。
圖1.1 SOM網(wǎng)絡(luò)的基本結(jié)構(gòu)
SOM算法描述如下:
(1)令網(wǎng)絡(luò)學(xué)習(xí)次數(shù),賦予初始化權(quán)值向量一個小的隨機(jī)向量值,對拓?fù)溧徲颍ǎW(xué)習(xí)率()進(jìn)行初始化,設(shè)置網(wǎng)絡(luò)總的學(xué)習(xí)次數(shù)()。
(2)當(dāng)學(xué)習(xí)次數(shù)()小于總的學(xué)習(xí)次數(shù)()時,重復(fù)步驟3至步驟6。
(3)隨機(jī)選一個輸入向量進(jìn)入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
(4)確定獲勝神經(jīng)元,相應(yīng)的權(quán)值向量為與輸入向量距離最短的向量,成為獲勝神經(jīng)元,輸入向量與獲勝神經(jīng)元的最短距離為,定義如下:
(1.1)
(5)按照下式更新獲勝神經(jīng)元及其鄰域內(nèi)神經(jīng)元權(quán)值向量:
(1.2)
與函數(shù)定義如下:(1.3)
(6)令,如果,回到第(3)步繼續(xù)訓(xùn)練,否則結(jié)束訓(xùn)練。
二、數(shù)值模擬計算
本文以HUGEindex數(shù)據(jù)庫中人7000多條基因在19個正常組織中的表達(dá)情況這19個組織中表達(dá)的基因為樣本對其進(jìn)行分析。不同組織下的全基因表達(dá)數(shù)據(jù)構(gòu)成了一個7070x59的數(shù)據(jù)矩陣,其中每一個元素表示第個基因在第個組織中的表達(dá)水平值,行向量代表基因在19個人組織中的表達(dá)水平,成為基因的表達(dá)譜,列向量代表某一組織的各基因的表達(dá)水平。
(1.4)
本文運用SOM方法對人基因19個組織的59個樣本進(jìn)行聚類,SOM網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)見(圖1.2)及參數(shù)選擇見表(表1.1)。
圖1.2 樣本聚類SOM網(wǎng)絡(luò)結(jié)構(gòu)圖
上圖中,根據(jù)Genechip得到的人體19個組織的59個微陣列數(shù)據(jù)所得到的信息,我們采用4x5的二維拓?fù)浣Y(jié)構(gòu)的SOM網(wǎng)絡(luò)對人體組織樣本進(jìn)行分類(其中第(4,5)個結(jié)點為空),圖中每個結(jié)點的位置(結(jié)點位置用與輸入模式維數(shù)相同的向權(quán)值向量表示,初始權(quán)值由系統(tǒng)自動產(chǎn)生)為各個結(jié)點權(quán)值尺度化之后所得到的位置。
三、結(jié)論
通過分類可以將芯片實驗的59個樣本按照人體組織類別分為19個類別,并且與采用層次聚類法所得結(jié)果進(jìn)行比較,可以看出自組織映射的聚類方法與層次聚類方法比較,可以看出采用SOM網(wǎng)絡(luò)聚類方法比層次聚類得到的結(jié)果更為明確,其分類正確率達(dá)到了92.2%,證明了SOM方法是有效的。
參考文獻(xiàn):
[1]孫嘯,陸祖宏,謝建明.生物信息學(xué)基礎(chǔ)[M].北京:清華大學(xué)出版社,2005:282-285.
[2]許東,吳錚.基于matlab6.x的神經(jīng)網(wǎng)絡(luò)系統(tǒng)分析與設(shè)計[M].西安電了科技大學(xué)出版社,2002.
[3]閻凡平,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進(jìn)化計算[M].北京:清華大學(xué)出版社,2005.:11-34,360-395.
作者簡介:
數(shù)據(jù)分析方法范文5
【關(guān)鍵詞】大數(shù)據(jù) 網(wǎng)絡(luò)規(guī)劃 用戶價值 用戶感知
doi:10.3969/j.issn.1006-1010.2015.10.004 中圖分類號:TN929.53 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-1010(2015)10-0022-06
引用格式:李梅,杜翠鳳,沈文明. 基于大數(shù)據(jù)分析的移動通信網(wǎng)絡(luò)規(guī)劃方法[J]. 移動通信, 2015,39(10): 22-27.
1 引言
隨著移動通信網(wǎng)絡(luò)的發(fā)展和移動互聯(lián)網(wǎng)業(yè)務(wù)的增長,移動通信網(wǎng)絡(luò)的各類相關(guān)數(shù)據(jù)呈爆炸式增長。借助大數(shù)據(jù)強(qiáng)大的數(shù)據(jù)處理能力和數(shù)據(jù)挖掘技術(shù),通過分析用戶行為、基于用戶價值和用戶感知規(guī)劃設(shè)計網(wǎng)絡(luò),成為運營商提升網(wǎng)絡(luò)競爭力的關(guān)鍵環(huán)節(jié)。
傳統(tǒng)的移動通信網(wǎng)絡(luò)規(guī)劃需要借助海量的測試,分析總結(jié)網(wǎng)絡(luò)存在的問題,再基于對市場和業(yè)務(wù)的經(jīng)驗預(yù)測,制定規(guī)劃方案。該過程中,測試結(jié)果的普遍性和業(yè)務(wù)預(yù)測的準(zhǔn)確性制約了規(guī)劃方案的合理性,高昂的測試成本和冗長的測試工期影響了規(guī)劃效率。
基于此,提出了基于大數(shù)據(jù)分析的移動通信網(wǎng)絡(luò)規(guī)劃方法,通過大數(shù)據(jù)工具分析海量數(shù)據(jù),實現(xiàn)用戶業(yè)務(wù)趨勢預(yù)測、用戶價值挖掘、用戶感知評估分析,進(jìn)而能夠以用戶為中心、面向具體業(yè)務(wù)場景展開通信網(wǎng)絡(luò)規(guī)劃。同時,該方法能夠綜合分析CQT(Call Quality Test,呼叫質(zhì)量撥打測試)、DT(Drive Test,路測)等多種前端測試數(shù)據(jù)和信令數(shù)據(jù)、位置數(shù)據(jù)、用戶業(yè)務(wù)信息等大量后臺數(shù)據(jù),克服單一數(shù)據(jù)分析的局限,不僅能夠大規(guī)模降低測試成本、縮短方案制定時間,而且還提高了方案的科學(xué)合理性。
2 基于大數(shù)據(jù)分析的移動通信網(wǎng)絡(luò)規(guī)劃
體系
如圖1所示,本文提出的移動通信網(wǎng)絡(luò)規(guī)劃體系可分為數(shù)據(jù)層、管理層、業(yè)務(wù)層和展示層,各層均與大數(shù)據(jù)密切相關(guān)。
2.1 大數(shù)據(jù)數(shù)據(jù)層
該層采用HDFS數(shù)據(jù)庫和Hbase數(shù)據(jù)庫管理通信網(wǎng)絡(luò)相關(guān)的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)主要來自于網(wǎng)管側(cè)和計費側(cè),包括:核心網(wǎng)管數(shù)據(jù)、詳單數(shù)據(jù)、網(wǎng)優(yōu)平臺數(shù)據(jù)、投訴數(shù)據(jù)、用戶信息表等,這些數(shù)據(jù)經(jīng)過預(yù)處理、算法處理后,按照標(biāo)準(zhǔn)數(shù)據(jù)格式存放在Hbase里面。
2.2 大數(shù)據(jù)管理層
該層基于Hadoop管理平臺建立特定的數(shù)據(jù)預(yù)處理腳本和算法模型,實現(xiàn)對用戶價值和用戶感知數(shù)據(jù)的分析管理。
數(shù)據(jù)的預(yù)處理主要包括確實數(shù)據(jù)處理以及噪音數(shù)據(jù)處理。為分析用戶價值和用戶感知,本系統(tǒng)用到的大數(shù)據(jù)分析算法模型主要有層次分析法和聚類閾值法。
2.3 大數(shù)據(jù)業(yè)務(wù)層
該層是對用戶價值和用戶感知業(yè)務(wù)實施梳理與管理,對影響用戶價值和感知業(yè)務(wù)的各維度進(jìn)行分析并找出其關(guān)聯(lián)關(guān)系。例如:用戶價值與收入、終端、業(yè)務(wù)、套餐的各維度關(guān)聯(lián)關(guān)系的梳理;用戶感知與回落之間的關(guān)系梳理等。
2.4 大數(shù)據(jù)展示層
該層是以圖表進(jìn)行展示數(shù)據(jù)分析結(jié)果,輔助開展通信規(guī)劃,重點是對用戶價值與感知進(jìn)行地理化展現(xiàn)、相關(guān)圖表的輸出。
3 用戶價值與感知評價分析方法構(gòu)建
3.1 用戶價值評價體系構(gòu)建
通信領(lǐng)域中的用戶價值評估是一個多層次、多因素的問題,需要針對相關(guān)的業(yè)務(wù)構(gòu)建評價指標(biāo)體系,能夠全面考慮用戶的收入特征、層次結(jié)構(gòu)、業(yè)務(wù)特征相互聯(lián)系。
(1)建立用戶價值評價體系結(jié)構(gòu)模型――AHP分析法
采用AHP法評價用戶價值時,首先是把用戶價值進(jìn)行梳理,建立出以業(yè)務(wù)為基礎(chǔ)的層次結(jié)構(gòu)模型,然后將用戶價值分解成收入、套餐、業(yè)務(wù)和終端4部分。具體如圖2所示:
用戶價值評價模型的層次一般分為:
最高層:用戶價值。
中間層:用戶潛力和消費能力。
最底層:用戶潛力包括用戶的套餐指標(biāo)與終端指標(biāo);消費能力包括用戶的收入指標(biāo)與業(yè)務(wù)指標(biāo)。
基于以上的維度進(jìn)行評分,可將評分落到各基站扇區(qū),根據(jù)評分做出扇區(qū)化的圖層,并將網(wǎng)絡(luò)的價值扇區(qū)進(jìn)行地理化呈現(xiàn)。
(2)確定用戶價值評價模型各指標(biāo)權(quán)重
以AHP法確定用戶價值評價模型各指標(biāo)的權(quán)重分為以下兩步:
首先,構(gòu)建遞階層次結(jié)構(gòu)。如圖2所示,目標(biāo)層是用戶價值,該層是建立評價模型的目的和追求的最終結(jié)果。一級指標(biāo)層為{用戶潛力,消費能力};二級指標(biāo)層包括套餐、終端、收入、業(yè)務(wù)等。
其次,要建立判斷矩陣。根據(jù)模型同一層級的相關(guān)指標(biāo)體系指標(biāo)可構(gòu)造判斷矩陣,將同一層次的指標(biāo)元素按照其上層指標(biāo)元素的重要性進(jìn)行兩兩比較,判斷相對重要程度。一般都會邀請通信專業(yè)人士和資深人員組成專家小組,依據(jù)他們的通信專業(yè)知識和研究經(jīng)驗進(jìn)行評估,構(gòu)造判斷矩陣。
(3)綜合權(quán)重計算用戶價值
針對移動通信系統(tǒng),服從一定社會(地理和邏輯)分布的具有不同消費能力、行為和移動特征的客戶群體,在通信過程中形成的具有運營價值的業(yè)務(wù)活動區(qū)域叫做價值區(qū)域。
價值區(qū)域可以采用收入、終端、用戶、業(yè)務(wù)(數(shù)據(jù)和語音)“四維度”,基于各自評分標(biāo)準(zhǔn)進(jìn)行評分;將評分落到各基站扇區(qū),再根據(jù)評分做出扇區(qū)化的圖層,就可以將網(wǎng)絡(luò)的價值扇區(qū)進(jìn)行地理化呈現(xiàn)。
根據(jù)AHP法得出的權(quán)重以及各維度的評分標(biāo)準(zhǔn),可以算出各小區(qū)的綜合評分;再根據(jù)綜合評分,可定義TOP30%為高價值扇區(qū),TOP30%~TOP50%為中價值扇區(qū),TOP50%~TOP80%為一般價值扇區(qū),TOP80%以上為低價值扇區(qū);最后,根據(jù)高低價值區(qū)域的評定,可以將網(wǎng)絡(luò)的價值扇區(qū)進(jìn)行地理化呈現(xiàn)。
該價值分析結(jié)果在規(guī)劃中可進(jìn)一步拓展到區(qū)域?qū)用妗⑽⒕W(wǎng)格層面,從而實現(xiàn)網(wǎng)絡(luò)建設(shè)目標(biāo)精準(zhǔn)定位,以更好地指導(dǎo)網(wǎng)絡(luò)資源投放。
3.2 用戶感知分析方法
(1)建立用戶感知評價體系結(jié)構(gòu)模型
如圖3所示,與用戶價值評價體系結(jié)構(gòu)模型建立的方法相似,仍采用AHP分析法,用戶感知評價模型可分為:
最高層:用戶感知。
中間層:網(wǎng)絡(luò)覆蓋和網(wǎng)絡(luò)質(zhì)量。
最底層:網(wǎng)絡(luò)覆蓋主要為MR(Measurement Report,測量報告)覆蓋指標(biāo);網(wǎng)絡(luò)質(zhì)量包括HSDPA(High Speed Downlink Packet Access,高速下行分組接入)用戶速率與3G回落指標(biāo)。
(2)確定用戶感知評價模型各指標(biāo)權(quán)重
與用戶價值評價模型各指標(biāo)權(quán)重計算方法相似。
首先,構(gòu)建遞階層次結(jié)構(gòu)。如圖3所示,目標(biāo)層是用戶感知,該層是建立用戶感知評價模型的目的和追求的最終結(jié)果。一級指標(biāo)層為{網(wǎng)絡(luò)覆蓋,網(wǎng)絡(luò)質(zhì)量};二級指標(biāo)層包括MR覆蓋指標(biāo)、HSDPA用戶速率、3G回落指標(biāo)等。
其次,建立判斷矩陣。由專家根據(jù)經(jīng)驗確定權(quán)重。
(3)綜合權(quán)重計算用戶感知
用戶感知可以采用MR覆蓋指標(biāo)、HSDPA用戶速率、3G回落指標(biāo)“三維度”,按照評分標(biāo)準(zhǔn)進(jìn)行評分,再將評分結(jié)果落到各基站扇區(qū),做出扇區(qū)化圖層實現(xiàn)網(wǎng)絡(luò)感知的地理化呈現(xiàn)。
3.3 價值與感知聯(lián)合評估
為了更好地指導(dǎo)網(wǎng)絡(luò)規(guī)劃建設(shè),可將用戶價值分析方法和用戶感知分析方法聯(lián)合起來,建立4×3的價值與感知聯(lián)合評估矩陣,針對不同矩陣中的網(wǎng)格分別制定對應(yīng)的資源投放策略。
價值與感知聯(lián)合評估矩陣中,不同網(wǎng)格的資源投放策略建議如表1所示(紅色、綠色區(qū)域為重點投資區(qū)域)。
4 應(yīng)用案例
在某運營商本地網(wǎng)的無線網(wǎng)絡(luò)規(guī)劃中,運用上述的分析方法對2014年6月的7 000萬條語音原始詳單、5億條數(shù)據(jù)原始詳單、238萬條用戶原始信息詳單進(jìn)行了大數(shù)據(jù)分析。
4.1 價值區(qū)域分析
(1)終端分布分析
網(wǎng)上現(xiàn)有用戶約110萬戶,其中支持3G業(yè)務(wù)的終端56萬戶,占比50.7%,僅支持2G業(yè)務(wù)的終端54萬戶,占比49.3%;約一半用戶終端不支持3G業(yè)務(wù),3G終端使用者中有一半終端使用的是2G套餐。
(2)業(yè)務(wù)分布分析
現(xiàn)網(wǎng)用戶的業(yè)務(wù)分布統(tǒng)計情況是:語音業(yè)務(wù)63%承載在2G網(wǎng)絡(luò)上,37%承載在3G網(wǎng)絡(luò)上;數(shù)據(jù)流量2G承載24%,3G承載76%。考慮到3G網(wǎng)絡(luò)的業(yè)務(wù)體驗更好,且網(wǎng)絡(luò)資源更為豐富,應(yīng)通過各種措施加快業(yè)務(wù)的遷移,促進(jìn)2G/3G網(wǎng)絡(luò)的融合發(fā)展。
(3)套餐分布分析
現(xiàn)有用戶的套餐數(shù)據(jù)統(tǒng)計結(jié)果如圖4所示:
從圖4統(tǒng)計分布可知,低端用戶貢獻(xiàn)了61%的收入,但占用了73%的流量資源和65%的語音資源。低端用戶單位收入消耗的網(wǎng)絡(luò)資源更高,說明高流量不一定帶來高收入;市場營銷策略是影響用戶規(guī)模、用戶行為以及網(wǎng)絡(luò)資源使用的主要因素,為此,建議規(guī)劃與市場應(yīng)緊密結(jié)合,以計劃為先、網(wǎng)絡(luò)先行,市場與建設(shè)互相配合、逐步推進(jìn)。
(4)用戶收入分布分析
從用戶收入角度分析,結(jié)果如表2所示:
從表2統(tǒng)計分析可知,使用2G套餐2G終端ARPU(Average Revenue Per User,每用戶平均收入)值低于2G套餐3G終端,3G套餐2G終端ARPU值低于3G套餐3G終端,3G套餐ARPU值整體高于2G套餐,3G終端ARPU值整體高于2G終端。
從以上“收入、套餐、終端、業(yè)務(wù)”四維度進(jìn)行扇區(qū)化統(tǒng)計,各扇區(qū)統(tǒng)計結(jié)果如圖5所示:
從圖5統(tǒng)計分布可知,高價值小區(qū)數(shù)占比為30%,收入占比達(dá)到72%;中價值小區(qū)數(shù)占比為20%,收入占比達(dá)到16%;高/中價值全網(wǎng)小區(qū)數(shù)占比為50%,收入占比達(dá)到88%,高價值小區(qū)各維度占比均接近70%,各維度評估合理。
4.2 用戶感知分析
(1)用戶速率分析
網(wǎng)絡(luò)單用戶下載速率統(tǒng)計分布如圖6所示:
從圖6統(tǒng)計分布可知,全網(wǎng)速率大于1Mbps的扇區(qū)占比為90.3%,需重點關(guān)注低于1Mbps區(qū)域的速率改善。
(2)3G用戶回落分析
3G用戶回落指標(biāo)統(tǒng)計分布如圖7所示:
從圖7統(tǒng)計分布可知,全網(wǎng)回落評估指標(biāo)差的扇區(qū)占比為23.2%,需重點關(guān)注回落評估指標(biāo)差的扇區(qū)的深度覆蓋問題。
(3)用戶感知MR覆蓋分析
對MR數(shù)據(jù)中扇區(qū)級的RSCP(Received Signal Code Power,接收信號碼功率)進(jìn)行統(tǒng)計,其分布如圖8所示:
從圖8統(tǒng)計分布可知,全網(wǎng)MR覆蓋指標(biāo)差的扇區(qū)占比為20.87%,需重點關(guān)注MR覆蓋指標(biāo)差的扇區(qū)的深度覆蓋問題。
4.3 價值與感知聯(lián)合分析
綜合以上價值區(qū)域及用戶感知分析,按照專家法取定的權(quán)重對各維度指標(biāo)進(jìn)行綜合評分,得到全網(wǎng)各小區(qū)的綜合評估分析結(jié)果,統(tǒng)計各類小區(qū)占比如圖9所示:
從圖9統(tǒng)計分布可知,全網(wǎng)綜合評估高/中價值扇區(qū)中感知中/差的扇區(qū)占比為34%,這部分區(qū)域?qū)⑹潜敬我?guī)劃中需要重點投入網(wǎng)絡(luò)資源的區(qū)域。具體分布如圖10所示:
5 結(jié)束語
綜上所述,通過對現(xiàn)網(wǎng)用戶的收入分布、終端分布、套餐、業(yè)務(wù)、用戶感知等多維度分析,可精準(zhǔn)定位高價值扇區(qū)及高價值區(qū)域,以進(jìn)一步指導(dǎo)網(wǎng)絡(luò)的精準(zhǔn)化規(guī)劃設(shè)計,引導(dǎo)投資的精準(zhǔn)投放。除此之外,基于用戶價值和用戶感知的多維度分析還可以應(yīng)用于市場營銷、渠道規(guī)劃等領(lǐng)域。
基于大數(shù)據(jù)的價值分析對運營商而言,是市場驅(qū)動、精細(xì)化管理的重要途徑,有利于改變傳統(tǒng)的經(jīng)營模式,改善用戶感知、增強(qiáng)自身競爭力,從而能夠有效應(yīng)對來自于虛擬運營和OTT業(yè)務(wù)的沖擊。
參考文獻(xiàn):
[1] 黃勇軍,馮明,丁圣勇,等. 電信運營商大數(shù)據(jù)發(fā)展策略探討[J]. 電信科學(xué), 2013(3): 6-11.
[2] 劉旭峰,耿慶鵬,許立群. 運營商獲取移動互聯(lián)網(wǎng)用戶價值的策略研究[J]. 郵電設(shè)計技術(shù), 2012(8): 9-12.
[3] 袁首. 多網(wǎng)協(xié)同下的電信無線網(wǎng)絡(luò)規(guī)劃方法研究[D]. 北京: 北京郵電大學(xué), 2012.
[4] 曹艷艷. 3G無線網(wǎng)絡(luò)規(guī)劃[D]. 濟(jì)南: 山東大學(xué), 2005.
[5] 李勇輝. 大數(shù)據(jù)概念辨析及應(yīng)對措施[J]. 互聯(lián)網(wǎng)天地, 2014(1): 11-14.
[6] 龍青良,李巍,呂非彼. 基于用戶感知的WCDMA無線資源效能評估方法研究[J]. 郵電設(shè)計技術(shù), 2014(9): 33-39.
[7] 朱強(qiáng). 3G無線網(wǎng)絡(luò)規(guī)劃和優(yōu)化的探討[J]. 通信世界, 2005(30): 57.
[8] 任毅. 3G無線網(wǎng)絡(luò)規(guī)劃流程[J]. 電信工程技術(shù)與標(biāo)準(zhǔn)化, 2005(11): 15-18.
[9] 郭金玉,張忠彬,孫慶云. 層次分析法的研究與應(yīng)用[J]. 中國安全科學(xué)學(xué)報, 2008(5): 148-153.
數(shù)據(jù)分析方法范文6
關(guān)鍵詞: 關(guān)鍵詞模板庫; 景區(qū)輿情; 滿意度; 評價數(shù)據(jù)
中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2017)03-62-03
Abstract: This paper puts forward a method of analyzing public opinion and satisfaction on the evaluation data of scenic spots based on tourist demand template. By means of keywords template library building and expansion based on the template of tourism demand, the paper analyses and builds the model of the public opinion and satisfaction on the evaluation data. It solves the problem that unstructured content such as tourists' travels and evaluation cannot be efficiently searched and utilized by other tourists. It can not only provide tourists with scenic spots' comprehensive satisfaction value, but also satisfaction values in the specific area of cuisine, housing, transportation, travelling, shopping, and entertainment, and even more specific related content of the satisfaction value in those six aspects. Thus it helps visitors quickly understand the evaluation of the various parameters of the area.
Key words: template library; public opinion of scenic spots; satisfaction; evaluation data
0 引言
隨著經(jīng)濟(jì)的發(fā)展,現(xiàn)在已經(jīng)進(jìn)入旅游智能化階段和大數(shù)據(jù)的時代,游客通常通過查看媒體互動分享評價來決定自己旅游計劃。然而,傳統(tǒng)游客在游記中對景區(qū)景點的評價內(nèi)容是非結(jié)構(gòu)化、離散的,即難以采用一定的算法對其進(jìn)行有規(guī)律地提取和組織,從而導(dǎo)致不能采用計算機(jī)智能對其提取分類。然而游客對“吃、住、行、游、購、娛”的評價獲取需求頗為急切,因此需要采用一種新的技術(shù)來實現(xiàn)游客評價的自動化提取并對大量的數(shù)據(jù)進(jìn)行高效的有價值的分析[1-3]。
1 本文提出的方法步驟及特征
本文提出一種基于旅游需求模板的景區(qū)評價數(shù)據(jù)分析輿情滿意度方法,主要有基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建(見圖1)、關(guān)鍵詞模板庫的擴(kuò)充(見圖2)和針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算三個步驟。該方法的特征在于:所述的旅游需求模板主要由內(nèi)容大類關(guān)鍵詞、內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個內(nèi)容大類關(guān)鍵詞下分屬有其對應(yīng)的內(nèi)容子類關(guān)鍵詞,每個內(nèi)容子類關(guān)鍵詞下分屬有其對應(yīng)的情感關(guān)鍵詞[4-5]。
1.1 基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建
主要由基于旅游需求模板引導(dǎo)評價的內(nèi)容大類關(guān)鍵詞、內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個內(nèi)容大類關(guān)鍵詞下分屬有其對應(yīng)的內(nèi)容子類關(guān)鍵詞,每個內(nèi)容子類關(guān)鍵詞下分屬有其對應(yīng)的情感關(guān)鍵詞。
關(guān)鍵詞模板庫初始由列舉而成,所述的內(nèi)容大類關(guān)鍵詞包括吃、住、行、游、購、娛的六個類別;所述的內(nèi)容子類關(guān)鍵詞是在內(nèi)容大類關(guān)鍵詞的基礎(chǔ)上構(gòu)建的;所述情感關(guān)鍵詞是對內(nèi)容子類關(guān)鍵詞的描述性詞語。
1.2 關(guān)鍵詞模板庫的擴(kuò)充
關(guān)鍵詞模板庫的擴(kuò)充具體是采用以下方式對內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞進(jìn)行擴(kuò)充:
⑴ 在已構(gòu)建的關(guān)鍵詞模板庫基礎(chǔ)上,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容大類關(guān)鍵詞所在段落文字附近搜索內(nèi)容子類關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫中不存在的內(nèi)容子類關(guān)鍵詞作為新的內(nèi)容子類關(guān)鍵詞,并加入到關(guān)鍵詞模板庫中;
⑵ 在已構(gòu)建的關(guān)鍵詞模板庫基礎(chǔ)上,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容子類關(guān)鍵詞所在段落文字附近搜索情感關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫中不存在的情感關(guān)鍵詞作為新的情感關(guān)鍵詞,對新的情感關(guān)鍵詞賦權(quán)值后加入到關(guān)鍵詞模板庫中。
1.3 針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算
所述針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算具體是:由擴(kuò)充后的關(guān)鍵詞模板庫通過網(wǎng)絡(luò)爬蟲工具搜索景區(qū)下的文字?jǐn)?shù)據(jù),抽取出內(nèi)容大類關(guān)鍵詞所在段落文字附近的內(nèi)容子類關(guān)鍵詞,再搜索抽取出每個內(nèi)容子類關(guān)鍵詞所在段落文字附近的情感關(guān)鍵詞,從而獲得所有情感關(guān)鍵詞及其每個情感關(guān)鍵詞對應(yīng)的內(nèi)容子類關(guān)鍵詞和內(nèi)容大類關(guān)鍵詞,然后構(gòu)建景區(qū)輿情與滿意度的分析模型,通過景區(qū)輿情與滿意度的分析模型獲得以平均滿意度值作為該景區(qū)的輿情滿意度值。
2 景區(qū)輿情與滿意度的分析模型
⑴ 先采用以下公式計算獲得文字?jǐn)?shù)據(jù)中所有評論中的關(guān)于某一個內(nèi)容子類關(guān)鍵詞的滿意度值:
其中,表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞的平均滿意度值,t是分值(1~5),表示i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞對應(yīng)分值為t的情感關(guān)鍵詞的數(shù)量,Bij表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞,B{B11,B12,B13…B21,B22,B23…}代表內(nèi)容子類關(guān)鍵詞集合。
⑵ 再采用以下公式計算獲得文字?jǐn)?shù)據(jù)中一個內(nèi)容大類關(guān)鍵詞的滿意度值:
其中,表示第i個內(nèi)容大類關(guān)鍵詞的滿意度值,表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞的權(quán)值,n表示第i個內(nèi)容大類關(guān)鍵詞下內(nèi)容子類關(guān)鍵詞的數(shù)量,A{A1,A2,…,A6}代表內(nèi)容大類關(guān)鍵詞集合。
⑶ 再采用以下公式計算獲得該景區(qū)的綜合滿意度值:
其中,Y表示景區(qū)的綜合滿意度值,i表示內(nèi)容大類關(guān)鍵詞的序號,i取值范圍是1~6,表示第i個內(nèi)容大類關(guān)鍵詞下的的權(quán)值。
3 具體實施方式
3.1 基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建
⑴ 內(nèi)容大類關(guān)鍵詞構(gòu)建,主要包括吃、住、行、游、購、娛幾個大類。
⑵ 內(nèi)容子類關(guān)鍵詞構(gòu)建,主要是在內(nèi)容大類關(guān)鍵詞的基礎(chǔ)上構(gòu)建,比如和內(nèi)容大類關(guān)鍵詞吃相關(guān)的內(nèi)容子類關(guān)鍵詞有飯店、餐館、快餐店、小吃街等。
⑶ 情感關(guān)鍵詞構(gòu)建,主要是在內(nèi)容子類關(guān)鍵詞基礎(chǔ)上構(gòu)建,比如和內(nèi)容子類關(guān)鍵詞‘吃’對應(yīng)的情感關(guān)鍵詞有味道很好,價格實惠,環(huán)境優(yōu)美等。
3.2 關(guān)鍵詞模板庫的擴(kuò)充
⑴ 基于需求模板引導(dǎo)評價的內(nèi)容子類關(guān)鍵詞庫擴(kuò)充,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容大類關(guān)鍵詞附近搜索相關(guān)的內(nèi)容子類關(guān)鍵詞并與已有的模板庫進(jìn)行對比,遇到新的內(nèi)容子類關(guān)鍵詞后,自動加入到模板庫,比如遇到與內(nèi)容大類關(guān)鍵詞吃相關(guān)的新的內(nèi)容子類關(guān)鍵詞野味店等。
⑵ 基于需求模板引導(dǎo)評價的情感關(guān)鍵詞庫擴(kuò)充,通過網(wǎng)絡(luò)爬蟲工具八爪魚采集器,在內(nèi)容子類關(guān)鍵詞附近搜索相關(guān)的情感關(guān)鍵詞并與已有的模板庫進(jìn)行對比,遇到新的情感關(guān)鍵詞后,自動加入到模板庫。
⑶ 情感關(guān)鍵詞均已由用戶進(jìn)行賦分,給出分值(1~5),比如非常好/棒極了/美妙極了,這三個情感詞表達(dá)的滿意度是相同的,對應(yīng)的分值都是5分,一般/湊合/還行對應(yīng)的分值則都是3分;差極了/難受死了/簡直就是受罪/再也不會去了,對應(yīng)的分值則是1分。
3.3 針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算
⑴ 根據(jù)已有模版庫構(gòu)建評價體系表。內(nèi)容大類關(guān)鍵詞和內(nèi)容子類關(guān)鍵詞的權(quán)重和情感關(guān)鍵詞的分值以及相同分值評論數(shù)量如表1所示,表中{}表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞對應(yīng)分值為t的情感關(guān)鍵詞的集合。
⑵ 通過網(wǎng)絡(luò)爬蟲工具搜索景區(qū)網(wǎng)頁的每個帖子,按內(nèi)容子類關(guān)鍵詞,搜索所有相關(guān)的情感關(guān)鍵詞,根據(jù)表1進(jìn)行分類統(tǒng)計,把相應(yīng)的情感關(guān)鍵詞的數(shù)量記錄到對應(yīng)到中。
比如:通過網(wǎng)絡(luò)爬蟲工具搜到網(wǎng)頁得到1000個情感關(guān)鍵詞,有600個是與內(nèi)容大類關(guān)鍵詞‘吃A1’有關(guān)的,其中300個是與內(nèi)容子類關(guān)鍵詞‘味道B11’有關(guān)的,對應(yīng)的情感關(guān)鍵詞集{}及數(shù)量如表2所示。
由內(nèi)容子類關(guān)鍵詞滿意度計算公式可知該景區(qū)關(guān)于吃的味道的滿意度值為:
即:該景區(qū)關(guān)于吃的味道的滿意度值為3.6,同理可以計算其他內(nèi)容子類的關(guān)鍵詞的滿意度值。
4 結(jié)束語
通過這種方法得到滿意度值,解決了以往游客的游記、評價等非結(jié)構(gòu)化內(nèi)容難以被其他游客高效搜索利用的問題,除了可以向游客提供某個景區(qū)的綜合滿意度值外,還可以向游客提供該景區(qū)具體的關(guān)于吃、住、行、游、購、娛六個方面的滿意度值,以及比吃、住、行、游、購、娛更具體的相關(guān)內(nèi)容子類關(guān)鍵詞的滿意度值,讓游客快速了解該景區(qū)的各個評價參數(shù)。
參考文獻(xiàn)(References):
[1] 維克托.邁爾舍恩伯格著,盛楊燕,周濤譯.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].浙江人民出版社,2013.
[2] 馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技,2013.2:10-11
[3] 黃先開,張麗峰,丁于思.百度指數(shù)與旅游景區(qū)游客量的關(guān)系及預(yù)測研究-以北京故宮為例[J].旅游學(xué)刊,2013.11:93-100