国产一区二区三精品久久久无广告,中文无码伦av中文字幕,久久99久久99精品免视看看,亚洲a∨无码精品色午夜

統計技術論文范例6篇

前言:中文期刊網精心挑選了統計技術論文范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

統計技術論文

統計技術論文范文1

1.1計算機技術應用于統計學是信息化發展的必然要求

傳統的統計工作基本以統計人員的手工勞動為主,因此無論在信息量,還是統計數據的可靠性、準確性及時效性都已不能適應現代社會信息化發展的需要。而在信息化時代,從統計方法的選擇到統計工作過程,即統計設計、統計調查、統計整理和統計分析四個階段,在遵循客觀規律和實事求是原則基礎上,每個環節都需要滲透計算機技術,尤其是最后對海量數據分析階段,需揭示事物的本質和規律,需要對數據進行深度挖掘,得出有用的決策方案和評價結論。離不開計算機軟件處理,有的甚至需要編程尋求數據結果,數據結果的一般也是在通過該網絡平臺上進行的、所以,計算機技術應用于統計學是信息化發展的必然要求。

1.2計算機技術推動了統計學的發展

就統計數據本身而言,其不但滲透到社會生活的各個領域,而且數據量也快速增加,即所謂海量數據的處理,這就對統計學的發展和應用提出了更高的要求。例如在對一些理財產品的選擇和風險投資領域,對這些數據處理最重要的要求就是快而準,唯有如此才能抓住盈利的時機,而電腦和網絡技術的發展真正提供了這種可能性。計算機作為一種高速計算的電子計算機器,最重要的功能之一便是數據處理分析,不但能在時間復雜度上得到最大程度的優化,同時在完成基本數據運算之余,更能通過分析技術對數據做出合理分析,并在一定程度上通過對數據的整合完成對所關心對象未來發展的預測。所以,計算機技術不但能實現對數據的快速處理,而且在很大程度上推動了統計學的發展。

1.3統計學為計算機信息處理提供數據保證

在信息化時代,數據日新月異,層出不窮,計算機技術只是為信息時代的數據處理提供了高效手段,但只有信息是準確和可靠的,才能得出正確的處理結論,而這些數據是否真實、準確、可靠,完全依賴于統計學的調查方法和手段,依賴于統計學的不斷發展。只有統計學,才能為計算機技術進行準確和及時的數據處理提供保證,也才能更好地促進信息社會的發展。

2計算機技術在高校統計學教學中的應用

統計學,以“概率論與數理統計”為核心理論支撐,包括諸如隨機過程、抽樣推斷、時間序列、多元統計分析等各個細小分科,而作為與數據打交道的統計學,在通過數據挖掘來探求事物本質,發展狀況與走向時,對數據的依賴是不容忽視的,對于海量數據的處理需要計算機技術、統計分析方法和統計軟件。而在目前高校統計學教材和統計學學習中,學習的核心仍舊放在理論方面,在應用上投入時間少,尤其是對較為實用,較為前沿的技術介紹不夠。下面介紹幾種簡單的計算機處理技術如何在統計學中進行應用。

2.1EXCEL在統計學中的應用

EXCEL是WINDOWS的成員,學習起來非常方便,極易被人們所接受,因高校中開設計算機文化基礎課程,對此有所了解,因此尤其適合高校統計學中深入學習。EXCEL軟件是一種功能強大的數據分析與管理系統,它提供了大量的函數,比如統計學中經常涉及到的平均指標(算數平均數、中位數、眾數)、標志變異指標(標準差、方差、標志變異系數)、回歸系數(一元、多元)、極值計算(最大值、最小值、峰值)、抽樣推斷(樣本個數、置信區間)以及編制變量數列進行統計分組等等,都可以進行處理和計算,很直觀,也很適合統計人員使用。另外,還具有很強的制圖制表功能,同時可以對經濟預測提供相應的數學模型,是目前高校統計學習中的一種重要數據處理工具。

2.2SPSS在統計學中的應用

SPSS是StatisticalPackageForSocialSciences的縮寫,即社會科學統計軟件包,是目前國際上廣泛使用的統計軟件包之一,主要分布在保險、醫療、制造、銀行、證券、科研院所等各個領域。SPSS主要功能包括數據管理、數據分析、圖表分析和數據輸出等,集數據管理、分析與一體。主要內容包括均值比較、方差分析、主成分分析、回歸分析、時間序列分析、因子分析、聚類分析等等,每類中都有多個細小的專項統計方法。SPSS也有專門的繪圖系統,可以根據數據繪制各種圖形。具有操作簡便、編程方便、功能強大、全面的數據接口、靈活的功能模塊組合等優點,為統計人員處理數據提供方便。

2.3SAS軟件在統計學中的應用

SAS是StatisticalAnalysisSystem的縮寫,即統計分析系統,現已發展成為一個大型的模塊化集成軟件系統,融數據處理和統計分析于一體,具有數據倉庫管理、數據挖掘和集成數據訪問等功能,廣泛應用于醫藥、衛生、經濟學、政府、農業、教育部門等各行各業,幾乎滿足任何類型的數據和任何應用的需要。具有易學易用,操作簡便、完整可靠的特點。在統計學方面,可以進行一元線性回歸分析、相關分析、方差和協方差分析、時間序列分析、決策分析和經濟預測等等。SAS具有繪圖功能,能把存儲的數據以圖形的形式非常形象和直觀地顯示出來,不僅可以繪制直方圖、散點圖、扇形圖等,而且還能繪制地圖。另外,本身還有函數系統,用戶可以根據自己的需要選擇適合自己的模塊。SAS提供了幾乎所有最新的統計分析方法,其分析技術先進可靠,非常值得在統計學中學習和推廣。

3統計軟件運用過程中的相關建議

統計技術論文范文2

1.較高的有效性新興起來的數據挖掘技術的應用時間并不是很長,但是其在經濟統計領域的應用受到了良好的效果,其穩定的工作性能,不僅能夠對經濟統計數據進行分析整理,更能深層次地開發出更多的有用信息,在實際的應用中展現出較高的有效性。

2.綜合應用性強數據挖掘技術已經被廣泛地應用在統計工作中的多個領域,并且發揮著重要的作用。數據挖掘技術不僅是一種綜合應用性強的技術手段,同時又能滿足統計數據使用者的特定數據需要。因此,數據挖掘技術能夠對經濟統計數據進行定向的整理和開發,為數據使用者提供更好的服務。

3.宏觀型的數據庫有利于數據挖掘技術的應用當前,我國的經濟統計大多還是采用傳統的經濟統計方法,統計收集的數據信息不能形成有機整體,在對數據進行管理過程中,出現了很多問題。因此。經濟統計工作需要能夠提供數據整理開發的新技術。宏觀經濟統計數據庫,為數據挖掘技術的開展提供了平臺。數據管理系統的經濟統計信息要正確無誤,然后經過數據挖掘技術的整合,就能得到更豐富的數據資源。

二、數據挖掘技術的運用

數據挖掘技術的特性決定了其對經濟統計數據整理的重要性,經濟統計所得到的數據信息要求必須有實用性和真實性,數據挖掘技術的特性正好滿足了經濟統計工作的需要。數據挖掘的過程主要包括以下四種方法:

1.預處理方法首先,要對統計數據進行預處理。由于經濟統計信息在收集過程中存在一些問題,導致收集到的數據存在缺失和模糊現象,這種有缺憾的數據信息不能作為數據挖掘的基礎,因此一定要對數據挖掘對象進行事先的處理。其中包括對基礎數據中不正確、不真實、不準確和偏差較大的數據進行甄別。

2.集成化處理方法其次,要對統計數據進行集成化處理。經濟統計過程中,會出現對多個數據源進行重疊統計的現象,這就要求對數據進行挖掘之前,要有一個統一整理的過程,即數據的集成化處理。數據集成在統計中被廣泛的使用。經過數據集成處理的統計信息更加全面,更加真實,可以作為數據挖掘基礎信息。

3.轉換方法再有,要對統計數據根據需要進行轉換。經濟統計數據的描述形式比較單一,為了滿足數據信息使用者的需要,就要對數據進行轉換,使其的表現形式具有泛化或是更加規范。這里所說的泛化指的是利用更深層次和更加抽象的定義來代替原有的低層數據。

4.決策樹方法除卻上述四種處理方法外,還有決策樹方法,指的是對龐雜的經濟數據進行分類,把有利用價值的統計數據提煉出來,這種數據挖掘形式能夠對分析對象進行體現,并能快速的對信息進行分類處理,能夠解決在經濟統計過程中出現的各種問題。

三、結語

統計技術論文范文3

數據供應鏈管理體系

1數據供應鏈的構成

信息系統環境中的統計數據與和制造環境的物質產品具有相似性,把統計數據視為信息系統中的產品,這樣,就可以采用全面質量管理(TQM)的原則、方法和技術來進行數據質量管理[4,7];可以采用制造環境中供應鏈的管理體系來構建數據產品的管理體系,我們稱之為數據供應鏈。實際上可以把統計數據的制造和消費過程看作一種業務流程模型,它由數據提供者、數據生產者、數據管理者到數據消費者的價值鏈組成,完成由數據消費者需求開始到提供給數據消費者以所需要的產品與服務的整個過程[8],這就是數據供應鏈。數據產品的制造過程包括:原始數據采集、中間數據生成、成品數據生成、數據消費等四個階段,它涉及四種角色:數據提供者、數據生產者、數據管理者、數據消費者[4]。數據產品的生產制造過程也是數據的增值過程,隨著數據(信息)的價值得到社會廣泛的認可,數據產品的開發和利用將會得更多的關注。從某一個數據生產者內部來看,它的數據生產過程也構一個內部供應鏈[9],這個供應鏈比較簡單(見圖1)。外部供應鏈還包括數據生產者的數據供應市場和數據消費市場,數據供應市場由一個或多個數據提供者和它們的數據供應市場構成,數據消費市場由一個或多個數據消費者和它們的數據消費市場來構成(見圖2)。

2內部數據供應鏈的管理組織模式

隨著企業信息建設的推進,現代信息系統從MIS發展到企業商務智能系統。商務智能系統采集業務數據原始數據,經過數據清洗,形成支持決策和分析的數據倉庫,數據的采購與處理過程見圖3。可以看出,現代企業(或組織)內部的統計數據的采集、處理、分析過程是可以由企業商務智能系統來完成,并提供給相關的數據消費者。

3外部數據供應鏈的管理組織模式

完整的外部數據供應鏈是圍繞滿足用戶的數據需求來構建的,它存在一個核心機構(或組織),并起著核心管理作用。構建一個數據供應鏈的同時也意味著一個統計體系的形成,它將數據提供者、數據生產者、數據管理者、數據消費者聯系起來形成一個是開放性的、以團隊工作為組織單元的有機整體[10]。采用供應鏈管理的思想來實現整個統計體系的管理,就是對一個統計體系中各參與組織、部門之間的數據、信息流與資金流進行計劃、協調和控制等,目的是通過優化提高數據生產過程的速度和確定性,提高組織的運作效率和效益。對比制造環境的供應鏈管理,數據供應鏈管理更簡單,它所關注的只有數據(或信息)及其價值,沒有物流過程。數據供應鏈管理的基本對象是數據產品流,數據產品流由供應市場流向消費市場。數據供應鏈的信息流包括數據的需求、數據處理狀態和傳遞狀態等信息,評價與反饋流包括對數據產品的評估和評價信息等。采用現代信息技術,建立數據供應鏈管理系統實現數據產品流、信息流、評價與反饋流的統一管理,以實現對數據供應鏈的全面管理。

統計數據質量控制體系的構建

1系統框架

現代信息系統具有高效的計劃、控制、反饋機制,高效的數據處理與傳輸能力,為構建DSCMS系統提供了技術支持。信息網絡時代,統計數據質量的監控與預警系統是統計信息系統的重要組成部份[3],可采用企業資源計劃(ERP)、全面質量等管理思想構建統計數據質量控制框架,以有效避免目前統計數據質量控制體系中易受中間環節的人為干擾。圖4給出了DSCMS的系統框架。

2系統功能與管理控制的實現

DSCMS由兩部分組成:一是統計數據管理系統,它實現方案設計、數據采集、數據整理和統計分析與等統計工作各階段的信息化管理;二是評價與反饋系統,它負責系統的控制、評價與反饋,是數據質量控制體系的實現。兩者有機結合,融入計劃控制、全面質量管理等現代管理思想,形成統計管理信息系統的全面解決方案。按系統的功能實現,可分成以下6個部分:(1)方案設計系統。實現統計工作方案設計,包括任務和目標的制定,數據收集、處理方案的制定,以及數據標準和要求的設定等。方案設計將結合目標與實施方案,做出完整的實施計劃與控制策略,是DSCMS的控制中心,并通過評價與反饋系統來實現整個管理體系的計劃、過程控制和評價功能。(2)數據采集系統。在跨組織的數據供應鏈中進行數據采集,需考慮時間和空間對數據采集產生的影響,構建基于互聯網的分布式集成數據采集系統不僅能提高工作的效率,也可以有效的減少數據逐級傳遞過程中的人為干擾。面向服務架構是分布式系統當前應用最廣泛的核心集成技術之一[11],它可以對數據供應者的業務系統進行有效的集成,實現數據采集過程的自動化。(3)數據處理系統。數據處理采用集中處理方式來完成,各級數據生產者和管理者經過授權可通過數據處理系統對采集的數據進行處理,生成相關的統計數據,以供本級數據消費者使用。數據處理包括抽取、轉換、裝載等過程。(4)數據分析系統。數據分析可結合統計方法、數據挖掘技術、聯機分析處理技術(OLAP)對數據庫或數據倉庫中的數據進行分析,分析結果可通過信息系統進行,并對分析結果進行評價與反饋。(5)信息系統。統計數據或分析結果可通過網站向社會公眾或相關用戶,并通過網站收集用戶的反饋信息。(6)評價與反饋系統。通過構建科學的數據質量評價指標體系與反饋系統,利用現代信息技術手段對統計數據質量進行評價,并將評價結果及時反饋到數據質量控制框架及數據生成的各個部門(或環節),以便于及時進行修正、完善。

統計技術論文范文4

類似于固定中繼系統,移動中繼系統由基站、移動中繼和用戶終端組成。其中,基站和移動中繼之間的鏈路為回程鏈路(BackhaulLink),移動中繼和用戶終端之間的鏈路為接入鏈路(AccessLink)。若基站和用戶設備之間的信道狀況良好,還可以考慮直連鏈路(DirectLink)。移動中繼可以選擇放大轉發和解碼轉發等模式。由于移動中繼具有運動性和隨機性,而這種特點與性能密切相關,如何建立合理的移動中繼運動模型是移動中繼系統研究領域的首要問題。當前研究中有的采用較簡單的隨機游動模型,或采用二維泊松過程來表示用戶終端的放置位置,使用M/M/∞排隊模型來表示用戶終端的移動性。在實際部署移動中繼系統時,需要考慮不同的應用場景。在3GPPR11版本中,高鐵是主要應用。在文獻[8]中,主要考慮以下兩種典型場景:場景1移動中繼服務靜止用戶場景說明如圖1所示。在該場景下,中繼被安裝在交通工具的頂部,中繼天線被分別放置在車輛的內外,分別用于和基站與用戶終端通信。若不使用中繼輔助傳輸,該場景下的通信將會面臨許多問題,如嚴重的車體損耗,多普勒頻移,小區換帶來的大量開銷等。反之,則可以將較差的信道分為兩段傳輸條件較好的鏈路,從而很好地解決了該場景下的通信問題。與直接傳輸相比,中繼輔助傳輸的掉話率明顯降低,為車內用戶提供較高的吞吐量和較低的小區切換失敗率,從而提高了通信質量,改善了用戶體驗。場景2移動中繼服務非靜止用戶場景說明如圖2所示。在該場景下,中繼也被部署在車輛頂部,不過其目的不是為了為車內乘客提供服務,而是為街道和公園提供覆蓋。鬧市區的街道和公園,是行人比較集中的地方,通信業務量大,屬于“熱點”地區。在經過這些地方的公交車上部署中繼,則可以增強覆蓋,提高吞吐量,具有實際意義。

2移動中繼系統中的關鍵技術

2.1信道建模與估計對于移動中繼來說,由于其移動的特點,而且可能是高速移動,因此研究的首要問題是移動中繼的信道建模問題,主要包括回程鏈路和接入鏈路的建模。不同鏈路的信道模型與各網絡節點采用的天線數目、中繼的轉發模式和中繼的運動模型密切相關,信道建模的準確度會極大地影響系統性能。如文獻[9]分析了不準確的路徑損耗模型對移動中繼系統性能的影響。此外,基站到移動中繼的信道會隨著車輛的運動而急劇變化,同時車輛的運動會引起多普勒頻移問題,因此在實際的移動中繼系統中采用合適的信道預測和估計方法也是非常必要的。如文獻提出了一種采用在車輛頂部使用預測性天線的信道預測和估計方法,從而較好地解決了移動中繼的信道估計問題。

2.2中繼選擇在實際的移動中繼系統中,可能會存在多個移動中繼。現有研究表明,根據信道狀態信息選擇一個最好的中繼進行協作,可以較低的復雜度獲得滿分集增益。因此,機會中繼選擇技術是移動中繼系統中的關鍵技術。信令開銷是中繼選擇算法的首要考慮因素。對于快速移動的用戶,基于信噪比的方案會產生大量的信令開銷,而基于位置或距離的選擇方案在高速場景下開銷較小,因而適用性更強。上述方案都是基于單個參數的選擇,實際信噪比和時延等參數會同時影響中繼選擇,為此,文獻[13]提出了一種具有服務質量(QoS)保證的多參數聯合中繼選擇算法。由于信令開銷和系統復雜度與每個目標用戶的候選中繼的數量成正比,文獻[14]考慮了如何減少候選中繼的數量而不影響使用中繼帶來的系統性能增益。文中所提算法限制了每個目標用戶的數量從而減少了反饋開銷。文獻[15]提出了一種三步選擇算法。該算法在保持中繼增益的同時可以使中繼信令開銷維持在較低水平。雖然中繼選擇可以提高系統性能,但是不適宜的選擇會引起頻繁的中繼切換,從而影響系統的整體性能。文獻[16]從這個角度出發,提出了使中繼活動時間最長和中繼切換率最小的兩種中繼選擇算法。研究結果表明,與現有方案相比,所提方案在不降低系統吞吐量的情況下可以獲得較低的中繼切換率和較長的中繼活動時間。

2.3資源分配在中繼系統中進行功率和帶寬等資源的分配可以有效提高系統資源利用率和系統吞吐量,目前得到了廣泛的研究。(1)功率分配。最簡單的功率控制方法是開關算法。所謂開關功率控制算法就是給中繼分配一定功率或者不分配功率。該算法可以提高小區吞吐量和覆蓋范圍。文獻[17]根據不同的數據速率要求提出了一種最優的功率分配算法。該文獻考慮了中繼的移動性,建立了移動模型,使用所提出的最優功率分配方案可以提高數據速率。仿真結果表明,在一些實際的數據速率下該算法可以帶來3dB增益。文獻[18]提出了一種分布式的功率控制算法用以提高平均小區吞吐量。文章考慮了在多小區環境中,通過使用分布式移動中繼功率分配方案,與傳統的系統相比,平均小區吞吐量得到了改善。同時,也提升了小區邊緣吞吐量,因此對小區邊緣用戶來說,該方案有助于改善其用戶體驗,是一種較好的解決方案。(2)帶寬分配。對于不同的運營商分別安裝不同的中繼顯然并不是高效的,文獻[19]基于此提出了共享頻譜分配算法來解決此問題。該方案中不同運營商使用相同的移動中繼為某一區域內的用戶服務,并根據鏈路質量為不同運營商分配相應的帶寬,從而實現了無線資源的有效利用。借助于納什均衡理論,該方案可以將吞吐量提升近20%。文獻[20]以IEEE802.16j系統為研究對象,研究了子信道分配對系統性能的影響。文中提出了重疊子信道分配(OVSA)和正交子信道分配(ORSA)兩種方案。研究結果表明,所提方案的小區吞吐量高于不使用中繼情況下的吞吐量。文獻[21]則利用博弈論理論聯合考慮了動態服務選擇和帶寬分配的問題。為了獲得更好的服務質量,移動中繼執行基站選擇和傳輸模式的選擇,基站則為不同傳輸模式分配不同的帶寬。當移動中繼和基站的策略相互影響并且需要作出動態決定時,這將面臨著挑戰。為解決這個問題,該文提出了一個兩層的基于進化博弈和微分博弈的博弈結構。在下層,動態服務選擇可以建立為一個進化博弈模型;在上層,基站端的動態帶寬分配可以形成一個微分博弈模型,最后得到了一個閉環納什均衡。數值仿真結果表明了動態博弈帶寬分配策略的有效性,并且系統性能和覆蓋范圍的優勢得到了加強。

2.4小區切換在移動中繼系統中,由于中繼的移動性以及中繼一般為多個用戶同時服務等原因,如何設計中繼高速移動情況下的小區切換策略便成為了一個關鍵問題,文獻此進行了深入研究。在高速運動場景,大量用戶很可能需要進行頻繁的小區切換,因而如何保證較低的鏈路失敗率和較高的切換成功率,將直接影響用戶的通信服務質量和通信體驗。對于移動中繼系統的小區切換問題,現在比較好的一種方案是使用具有兩根分布式天線的移動中繼,即在車輛首尾分別裝有天線。移動中繼通過選擇具有較好接收信號質量的天線作為接收天線。當車輛進入重疊區域時,前置天線執行切換至目標基站,后置天線將和服務基站保持連接。當前置天線完成切換后,再由后置天線將工作頻率轉移至目標基站。如果切換失敗,后置天線將執行第二次切換。因此,這種切換方案使通信在切換過程中不會被中斷,實現了通信的無縫體驗,而且降低了切換失敗率,是一種簡單實用的方案。

2.5移動中繼的其他問題使用移動中繼來改善車輛用戶的服務質量和吞吐量的效果明顯,除了以上提到的關鍵問題外,仍然有其他的一些問題和挑戰需要解決。首先是移動中繼的移動性管理問題。這主要包括不同基站間移動中繼的切換和不同移動中繼間用戶的切換。但是,現有LTE系統中沒有針對移動中繼的移動性支持,因此有必要修改當前的系統結構用以提供有效、可靠的移動性管理。目前,為了支持移動性管理,是在當前的固定中繼架構上修改還是提出新的架構尚在討論中。其次,由于移動中繼的使用,干擾管理也是一個新的挑戰。中繼技術的優勢在理論上已獲得共識,但在實際部署中中繼節點的引入必然導致更加嚴重的干擾問題。盡管接入鏈路干擾較小,但對于回程鏈路來說,不同移動中繼間以及中繼與宏小區用戶間的干擾使問題變得復雜。預測性天線的使用將提高CSI的準確性,從而可以在回程鏈路中使用高級的干擾避免和干擾消除方案。

3結束語

統計技術論文范文5

1.1較高的有效性數據挖掘技術作為一種數據的深加工技術,其本身是帶有鮮明的目的性的,在實際應用活動中能夠對長時間積累下來的經濟統計數據進行基于數據使用者要求的深入加工。在實踐應用活動中主要有兩種重要的應用形式,一種是對積累經濟統計數據的管理高效化處理,一種是對現有經濟數據的目的性分析。其中第一種分析方式是從經濟數據管理的角度出發的,在應用中主要是以固有數據信息的統計、分類為基礎,將原本混亂的數據庫信息進行科學、系統的歸類,保證統計數據管理的高效性和使用的便利性。另一種工作方式是一種經濟數據的再加工過程,以鮮明的數據統計、分析目標為指引對原有數據的呈現形式、組成內容和關聯形式進行重新加工,以保證經濟統計數據能夠最大限度地服務于管理者的需求。

1.2綜合應用性強如前文所述,數據挖掘技術是一個工具系統而不是單一的工具,能夠實現使用主體的各種信息需求,隨著現代社會經濟的快速發展,當前我國經濟管理的各個部門都需要大量的經濟統計信息來作為經濟管理決策的基礎。但是因為各個管理部門經濟管理的領域不同、經濟管理的方式不同、經濟的管理權限不同,所以相應的經濟統計數據呈現形式的需求就不同。這就為經濟數據統計系統提出了更高的要求,其不僅要對符合各個經濟管理部門需求的數據內容進行統計,同時要將統計完成的數據換算成各種不同的呈現形式,并根據統計信息的來源和統計信息的計算方式對其可靠性進行評估[2]。最終這些數據信息的輸出格式還應該符合所服務的經濟管理部門管理系統的格式要求,保證統計數據能夠在管理部門的管理系統中正常錄入、應用,數據挖掘技術很好地滿足了上述的復雜經濟數據管理要求,其功能的綜合性促進了其應用深度的提高和范圍的擴大。

1.3宏觀數據庫有利于數據挖掘技術的應用當前因為經濟管理部門的職權較為分散,各個經濟管理部門的經濟統計數據需求不盡相同。所以我國的經濟統計活動絕大多數還采用傳統的經濟統計方法,統計收集的經濟信息存在一定的局限性,不能夠服務于經濟管理活動的整體,或者造成一些數據統計工作的重復,對經濟數據統計工作造成了一系列的質量和效率上的影響。經濟數據統計活動急需一個能夠整合各個統計系統,實現統計數據信息融合的新技術。宏觀經濟統計數據庫為數據挖掘技術的開展提供了平臺,數據管理系統的經濟統計信息要正確無誤,然后經過數據挖掘技術的整合,就能得到更加豐富的數據資源[3]。

2數據挖掘技術的應用

在社會經濟管理活動中,管理主體對經濟統計數據的要求主要有兩個。一個是統計數據的真實性、一個是數據統計信息的實用性。單就這兩個經濟統計數據要求而言,數據挖掘技術能夠很好地滿足經濟統計工作的需求,是適用性極強的一種經濟數據統計技術,其在具體的經濟數據統計活動中主要有以下三種應用方法。

2.1預處理方法在經濟數據統計活動中,最為基礎的一種處理方式就是經濟數據的預處理方法,因為數據挖掘本身是一種基于提供基礎信息的智能分析技術。其本身是受基礎經濟信息限制的,不可能無中生有代替經濟數據收集系統的功能。所以所有作為數據挖掘系統數據基礎的經濟統計數據信息都應該進行預處理,處理的內容主要包括對這些數據中不正確、不真實、不準確,以及不同經濟統計數據信息之間差距較大的現象。對這些基礎數據存在的問題進行處理的過程被稱為數據清理,當前數據清理主要采用的方法有均值法、平滑法和預測法。其中均值法是現代分析技術中模糊理念的一種應用形式,當基礎數據中的一個數據點是空值或者噪聲數據的時候,可以采用均值法進行處理,即用數據庫中所有該屬性已知的屬性均值來填補空缺。保證數據挖掘系統對基礎數據的分析和整理能夠正常進行,得出相對而言準確度較高的統計分析數據。其中Ci表示當前數據點的取值,Cj表示當前數據點前后不為空的數據點,K表示當前數據點進行計算所取的參考數據點數量[4]。平滑法依然是對基礎數據中空值和噪聲數據的計算方法,其與均值法的區別是用加權平均數代替了平均數,考慮了計算過程中提取的每一個數據對數據結果的影響權重,所以計算出的結果往往更加接近真實的數值。其中Ci表示當前數據點的取值,Cj表示當前數據點前后不為空的數據點,K表示為對當前數據點進行計算所取的數據點數量。WJ表示Cj數據點的權值。

2.2集成化處理方法在數據挖掘技術的應用活動中,因為相同地區的數據統計主體不同,或者在不同地區對相同經濟數據的統計標準不統一,會產生一系列的數據集成問題,如何對這些調查方向不同或者是呈現方式不同的數據進行有效集成而不影響經濟數據統計的準確性,是數據挖掘技術的重要任務。在具體的數據集成過程中主要考慮以下幾個方面的問題[5]。

2.2.1模式集成當前因為社會經濟活動中經濟數據的統計內容過于廣泛,很多經濟數據統計并不是來自于官方的統計局而是來自一些民間統計組織,或者是由一線社會經濟主體直接提供的經濟數據,在數據挖掘過程中將這些來自多個數據源存在多種數據呈現模式的經濟數據信息進行集成就涉及實體識別的問題。例如在數據挖掘過程中如何確定一個數據庫中“std-id”與另一個數據庫中的“std-no”是否表示同一實體,當前一般使用數據庫與數據庫之間的含元數據對比來保證實體識別高效率和高質量[6]。

2.2.2冗余問題數據挖掘本身是對經濟統計數據的一種深加工技術,經過其加工的經濟統計技術應該在本質上達到最簡狀態。在數據挖掘過程中要將與其他數據呈現某種正相關關系的數據項目進行精簡,以保證數據庫中數據量維持在一個較低的水平,為數據管理和應用提供便利。在經濟數據挖掘活動中人均國民生產總值就是典型的冗余屬性,因為其數值是可以通過國內生產總值和總人口屬性計算出來的,所以類似人均國民生產總值這種冗余屬性在數據挖掘過程中就應該精簡,應用的時候在利用國民生產總值和人口屬性計算得出[7]。對冗余屬性的判斷主要通過相關度對比來實現。其中n表示元組的個數,分別是屬性A和屬性B的平均值,分別是屬性A和屬性B的標準方差,在這一公式中如果則表示A、B兩個屬性是正相關,也就是說A越大B就越大,值越高二者的正相關關系就越密切;如果則表示屬性A、B之間沒有直接關系,是相互獨立的;如果則表示A、B兩個屬性呈負相關,屬性B會隨著屬性A的減小而增大,的絕對值越大,二者的負相關關聯關系就越密切。

2.3決策樹方法在數據挖掘技術應用過程中,經過系統的分析和總結以后,分析數據的輸出是一個關鍵的環節,其輸出的數據形式會對使用者的經濟管理決策產生直接的影響。決策樹是一種較為常見的、直觀的快速分類方法。其應用的關鍵是決策樹的構建,具體而言主要分為兩步:第一步是利用訓練集建立并精簡一棵決策樹,建立輸出分析的模型;第二步是利用構建完畢的決策樹進行輸入數據的分類,這一分類是一個遞歸的過程,從決策樹的根部開始進入到樹干、枝丫,直到輸入數據的分類滿足了某種條件而停止。在具體的應用中停止分割的條件有兩個:一個是當一個節點上的所有數據都屬于同一個類別的時候;另一個是沒有分類屬性可以對輸入數據進行再分割[8]。在決策樹構建完成后,還要根據使用者的具體要求對決策樹進行“剪枝”,剪枝的主要目的是要降低因為使用訓練集而對決策樹本身數據輸出產生的起伏影響。

3結語

統計技術論文范文6

計算機技術已經被各個行業所采用,大到政府部門機關、國際金融機構,小到居民P2P個人線上工商經營都開始利用計算機技術所帶來的通信優勢在日常工作的處理、企業的貿易管理等方面加以利用。

1.1計算機通信技術在計費系統領域的應用計算機系統在計費系統領域有著非常廣闊的應用,由于不管是什么樣的企業還是政府部門都是不開成本與收益的,而這其中就要需日常的收支進行詳細統計。計算機通信技術被利用最為廣泛的行業主要是財務行業、金融行業、通信行業。例如:在企業的日常賬目管理系統當中經常會開發數據收集和數據處理系統,其能夠有效的將企業最基層所開發的業務處理系統的數據進行收集。再例如,移動通信公司的主體是應用其自主研發的叫做“ACS”的系統。這一系統是基于計算機的J2EE技術和共同的對象的請求的一種結構技術。它能夠實現更加清晰和快速的通信漫游清算,從而能夠確保整個通信服務網絡順暢運作。

1.2計算機通信技術在信息管理領域的應用信息管理系統包括多個方面,例如:經理決策系統,事務處理系統,企業資源計劃系統等等。這些系統的開發和研制都離不開計算機通信技術的支持。計算機通信技術通過將信息進行互助傳遞實現了這些系統的工作,通過高頻率的接受、分析、反饋達到了這些系統設計的初衷。再例如:目錄搜索方式的代表為雅虎和搜狐網絡公司,它通過對web網站的實施分類和分級的處置,位于數據庫系統之中依據內容的不相同對之各個網絡的頁面進來簡要描繪,從而使得關鍵字以及分類信息能夠實現出一個良好匹配。

1.3計算機通信技術在客戶管理領域的應用計算機通信技術在客戶管理領域應用的也非常廣泛,最為常見的就是移動、聯通、電信的網上營業平臺。例如,3G無線通信系統技術同上兩代差別在于數據傳輸以及聲音處理傳遞速率實現了顯著的提升。ARM這種處理器讓移動終端研發的豐富應用得以實現。另外,其借助嵌入電腦Windows操作系統和手機的安卓系統,讓其能夠進一步令手機終端走向智能化、科技化、現代化方,為3G通信乃至4G通信提供了一個良好的基礎。當代計算機通信技術已經不再高深,并根植于千家萬戶被更多的日常消費者所廣泛利用。

2計算機通信的未來發展和展望

主站蜘蛛池模板: 亚洲妇女自偷自偷图片| 欧美成aⅴ人高清免费| 免费无码一区二区三区蜜桃大| 亚洲色大成网站www| 午夜男女很黄的视频| 欧美精品| 国产∨亚洲v天堂无码久久久| 中文幕无线码中文字蜜桃| 又爽又黄又无遮挡网站动态图| 免费人成无码大片在线观看| 久久天天躁狠狠躁夜夜躁app| 国产a∨精品一区二区三区不卡| 人与动人物xxxx毛片人与狍| 中文字幕久久精品无码| 精品国产a∨无码一区二区三区| 久久久久久人妻精品一区| 国产激情久久久久影院老熟女免费| 亚洲成无码人在线观看| 一本久久a精品一区二区| 日韩亚洲制服丝袜中文字幕| 偷偷做久久久久免费网站| 国产草莓精品国产av片国产| 婷婷开心激情综合五月天| 国产精品国产三级国产av剧情| 在线观看免费无码专区| 国产乱码一区二区三区爽爽爽| 国内精品久久久久久无码| 免费午夜无码片在线观看影院| 国产成人亚洲日韩欧美| 顶级欧美做受xxx000| 久久水蜜桃亚洲av无码精品| 国产精品无码a∨精品影院| av男人的天堂在线观看国产| 极品老师腿张开粉嫩小泬| 大陆熟妇丰满多毛xxxx| 无码福利日韩神码福利片| 99精品国产丝袜在线拍国语| 人妻人人澡人人添人人爽人人玩| 成人区人妻精品一区二区三区| 国产精品香港三级国产av| 国产精品自在线拍国产电影|