前言:中文期刊網精心挑選了數據倉庫范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
數據倉庫范文1
關鍵詞:數據倉庫;原理;思想;應用;報表
中圖分類號:TP311.13 文獻標識碼:A文章編號:1007-9599 (2011) 09-0000-02
Data Warehouse Design and Show
Zhu Mingjie
(Shanghai Economic and Informatization Commission,Information Center,Shanghai200003,China)
Abstract:With the information age,information resources in daily life plays an increasingly important,even indispensable plex information needs of the scientific method with its efficient data processing,and can quickly and effectively from a different point of view,to determine the information to improve the comprehensiveness of the information,accuracy,efficiency.With the development of technology,a deeper level of data warehouse applications,data warehouses demonstrating an important role in the information age.In this paper,data warehousing principles,ideas,and through reporting tools,data and charts on how the show has been superficial discussion.
Keywords:Data warehouse;Principle;Thinking;Applications;Report
一、數據倉庫的原理
數據倉庫,英文全名是Data Warehouse,也可縮寫為DW或者是DWH。事實上,數據倉庫這個名稱并沒有一個固定的、完全統一的定義。而現在被用的最廣泛的應該屬數據倉庫概念的創造者W.H.Inmon在自己的作品中――《建立數據倉庫》對數據倉庫的定義:數據倉庫就是面向主題的、集成的、相對穩定的、隨時間不斷變化(不同時間)的數據集合,用以支持經營管理中的決策制定過程。而后雖然學者對數據倉庫的概念有著不同的定義,但是歸根結底,在這些學者的觀點中,都對數據倉庫所持有的特征看法基本是一致的。
(一)數據倉庫是面向主題的
主題就是在高層次上將數據進行歸類,并與另一個分析環境想對應,這個分析環境也就是指在使用者通過數據倉庫來進行決策時所最關注的對象。
(二)數據倉庫是集成的
數據倉庫中的數據是由各種不同、分散的初始數據根據所需要的數據進行的分析,篩選,提煉,最終通過加工整合而成,最終進入數據倉庫。所以在建立數據倉庫的過程中,數據集成可以說是最細致也是最難的一個重要步驟了。
(三)數據倉庫是相對穩定的
這里所描述的數據倉庫的相對穩定是針對數據倉庫的應用而言。在對子數據進行整合吸收后,這些數據并不能改變更新,用戶只能借用數據進行分析,而不能改變原始數據。所以說數據倉庫的穩定性表明了數據讀取格式為只讀。
(四)數據倉庫是隨時間的變化而變化的
在前一段中有提出數據倉庫的穩定性是對應用而言。但這并不意味著數據倉庫中的數據是一成不變的,隨著時間的變化,數據倉庫會增加一些新的數據、刪除一些陳舊數據以及整合一些與時間相關的數據。這也正說明數據倉庫是隨時間的變化而變化的,這也反映了數據倉庫的歷史變化,而企業通過數據的變化更能準確的進行分析和預測,從而降低企業風險,進一步提高企業效益。
二、數據倉庫的思想
數據倉庫中存在著很多優秀的思想,這些思想都非常值得數據庫設計者和軟件設計者用來參考。數據倉庫的核心思想之一就是面向主題。正如前面所言,主題是在高層次上將數據進行分類,并與另一個分析環境相對應,此環境是使用者在通過數據倉庫進行決策時所關注的對象,而這種對數據的關注傾向正好反映了使用者的需要,這種需求提供了可靠的依據,所以說主題是數據倉庫需求的構成因子,一個好的數據倉庫離不開多個好的主題。
三、數據倉庫的應用
(一)數據倉庫應用的現狀
目前,政府、各行業、眾多企業都開始建立本單位的數據倉庫體系,包括政府決策支持系統、銀行信息系統、電力系統以及全國各大連鎖店等??梢哉f數據倉庫的應用是比較廣泛并且迫切需要的。在建立本單位的數據倉庫體系時,是通過各路相對獨立、不同的子數據加以數據抽取、轉換而后輸入到所建立的數據倉庫當中。這些數據與單位自身的內部信息有效的相結合,從而為單位更好的分析經營環境提供了比較準確的數據依據,也為單位的正確分析預測進行了準確的技術保障,同時相應減少了單位的經營風險,提高了管理水平和決策效率。
(二)數據倉庫應用存在的問題
事實上,國內數據倉庫應用與預測帶來的效益還是有一定差距的,顯而易見,在我國數據倉庫的應用還存在著一定的問題。
1.數據倉庫的利用率并沒有預期高
數據倉庫設計者沒有面向主題,沒有根據需求建立數據倉庫,導致數據倉庫的利用率并不高。不少企業花費了很長人力資源、物力資源精心設計數據倉庫卻得不到相應預期的效益。根本原因是市場的需求分析有缺陷,沒有根據市場需求設計而是僅從企業自身出發,從而導致數據倉庫的使用人群很少,在運轉數據倉庫過程中用戶并不多。當然這與企業的管理水平也有關系,我國企業的管理水平本身是有缺陷的,由于這個缺陷致使在收集來的子數據很多沒有發揮作用,沒有有效聯系起來,最終導致數據倉庫的利用率低。
2.信息體現形勢不夠豐富,過于單一
由于數據倉庫應用以OLAP以及固定報表為主,OLAP,聯機分析處理,雖然是從不同的角度進行觀察,這些觀察是從分析人員、管理人員或執行人員對原始數據進行的轉換,但是這種方式并不能使信息統一化,完美化。而固定報表,僅僅是在原有處理過的數據倉庫中的基礎上進行一次重復,所以導致數據倉庫中的信息表現方式不夠豐富,太過單一。很明顯,這樣并不能給數據倉庫帶來應有的效益,不能發揮它最大的應用價值。
3.數據倉庫的應對不夠靈活
數據倉庫的特征之一是隨時間的變化而變化,數據倉庫對一些新增的需求需要靈活的應對適應。而對新增的需求又要進行抽取、轉換、清洗,這對數據倉庫有一定的沖擊,導致數據倉庫進入疲憊狀態。然后由于子數據的問題以及所存在的某些技術問題、管理水平、投入力度不大導致數據倉庫系統不穩定。
(三)數據倉庫的應用方法
根據數據倉庫應用所存在的問題,可以將數據倉庫的應用方法重點歸于兩大類,一種是根據需求,另一種是提高技術。
1.根據需求
根據需求來設計數據倉庫,從而提高數據倉庫的利用率。而這種需求與傳統意義上的OLTP系統需求是不同的,傳統的OLTP系統需求是指依據事務處理的邏輯上進行收集、整理、分析的。而數據倉庫應用的需求是成功建立一個數據倉庫必不可少的一部分,這要求應用的需求必須是經過整理并完善起來的。一個比較優秀的數據倉庫應用系統應該是不斷循環的過程,而這個過程的實現就需要需求的推動。
所以說確定需求起點是至關重要的,例如保險企業,在構建保險公司管理指標體系時就要以需求為起點,再確立主干、支干、葉片。例如可將承保、核保、報案理賠這些業務歸納為主干,而支干可以是管理人員、統計人員這些工作角色,而以簽單數量這些數據指標作為葉片總結起來就可以構成保險公司管理指標體系。一個成功的管理指標體系加上技術部門的加工之后,更能有效的將各部門聯系起來,更加清楚的指導各業務部門有效的操作,使技術以及業務人員更加清晰明了使用,從而更大更有效的發揮了整個數據倉庫的優勢。
2.提高技術
根據數據倉庫的設計首先是必須要有一個數據體系的整體規劃。而數據體系的規劃要注重數據模型的建立。由于子數據發展大相徑庭,相互獨立,在各個方面都有很大的不同,這些外部數據與單位自身內部數據很難達到均衡統一,所以是很難實現理想化地數據模型。在數據模型建好之后要加強前端的應用系統的建立,以便更便捷的進行業務分析。在管理層方面,因為數據是變化的,外部環境的變化也是相當迅速的,數據倉庫應該加強對數據動態變化的適應性。這就要求規劃好數據體系,及時將靜態和動態的數據進行管理,并逐步完善數據倉庫的管理體系。
四、數據倉庫展現工具
目前而言,國內市場上的數據倉庫展現工具是琳瑯滿目的,但是其功能多數是一樣的,所以在選擇工具上,用戶都還是要有自己的標準。首先是交互性,所謂交互性就是指用戶在使用的時候不再是電子死板輸入的方式,不必為尋找某個數據全篇翻查,而是通過報表的智能分析,進行簡單的輸入操作就能實現分析要求。在比較流行的報表工具中,Crystal Report和Style Report作為兩家成熟的商業報表軟件供應商在交互性技術上存在著比較明顯的優勢。另外一個好的報表工具還需要有易用性、擴展性、可靠性以及完整性等特征,國內比較流行的報表工具有潤乾報表、BI@Report等。那么這些較為流行的報表工具是如何進行數據倉庫的數據圖表展現的呢?
數據和圖表的展現是非常重要的,它展現的合理性直接影響著用戶是否能簡單明了的讀懂數據和圖表表示的含義價值,能否更好的應用數據,從而提高使用者的興趣、發現數據的價值。相反,如果展現方式不明了簡潔,則會挫傷用戶的耐心以及下次使用報表的興趣。報表主要展現的是數據的值、數據發展的趨勢以及數據構成的比例等信息,數據發生的變化以及異常都只能通過報表來體現。而數據倉庫在進行數據和圖表的展現時主要是通過兩種方法:一種是現在我們最通用、最常見的WEB報表,WEB端的報表可以直接通過常用的瀏覽器登錄進行查看,最為廣泛運用的就是Business Objects等這些分析工具;而另一種就是在客戶端的數據基礎上展現,最普及的就是Excel,利用Excel的數據透視表功能可以很好地展現多維數據庫MDDB中的數據。
圖1.上海市經濟運行決策分析數據倉庫,多維展現圖
五、結束語
本文通過對數據倉庫原理和存在的特點、核心思想以及在當代數據倉庫應用過程中存在的問題,針對問題提出應用方法解決措施,分析了比較流行的報表工具和用戶在選擇報表工具中所考慮的標準,以及對報表數據圖表的展現方式進行了粗淺的論述,提出了一些自己認為有效可行的方法。在這個科技快速發展的時代,隨著我國的數據倉庫應用范圍的不斷深入,管理水平的提高,相信通過長期經驗積累,數據倉庫設計在更富創造性更具特色的同時,將會給政府提供更高效的決策分析依據,給企業帶來更多的經濟效益、更高的質量管理水平。
參考文獻:
數據倉庫范文2
Abstract: In this paper,it expatiates and analyses the concepts of Data Warehouse and Data Mine, outlines the implmenting process of data warehouse and Data Mining, introduces the application of Data Mining and analyses the two technologies with prospect.
關鍵詞: 數據倉庫;數據挖掘;OLAP
0引言
隨著信息社會的 發展,互聯網的普及度越來越高,需要人們處理的數據數量隨著時間的變化而急速增長。如何處理日益龐大的數據,就成了現代人必須要面對的問題。因此,開發一 種可以處理大量信息、并且能夠辨別真偽的技術勢在必行。隨著技術不斷的發展與創新,人們在嘗試各種方法,逐漸有了自己的一套模式,數據挖掘(Data Mining簡稱DM)技術便是最終的結果。
1數據倉庫
數據倉庫的含義:“數據倉庫是用于支持企業或組織的 決策分析處理的,面向主題的、集成的、不可更新的、且隨著時間不斷變化的數據集合。”互聯網中的數據浩如煙海,如果用戶在其中搜尋的話,基本上是大海撈 針。而數據倉庫便解決了此類問題,它把龐大的數據及信息從互聯網中收集起來,并進行適當的處理、加工和分類,把這些凌亂的數據轉換成公共的數學模型,這樣 便能夠解決數據與數據之間的沖突、表達不一致等問題,同時還方便用戶查詢自己所需要的信息,這樣便使得數據和信息在決策查詢上理便捷。
2數據挖掘
互聯網中,實際的應用操作數據往往都是數量很大,不完整且具有模糊性和隨機性。而數據挖掘所要做的便是提取這類數據中隱含的、不為人知的,但對人們又有潛在用途的信息和知識。并把提取的知識和信息存放于數據倉庫或其他信息庫中,所以說,數據挖掘是運用統計學、 人工智能、機器學習、數據庫技術等方法發現數據的模型和結構、發現有價值的關系或知識的一門交叉學科。另一個角度來講,數據倉庫中的數據,利用挖掘技術的 算法,將源數據收集起來,并進行適當的篩選及過濾變成相應信息。數據挖掘基于的數據庫類型有:關系、面向對象、事務、演繹、時間和時間序列、多媒體、空 間、遺產、文本、Web型以及新興的數據倉庫等。對于數據庫的描述,通常是指面向對象的數據庫在面向對象的程序為規范的程序設計標準。其描述對象可以是一 定時期的人口、流量等數據。而關于一個對象的代碼在一個單元中的封裝,對象可以與其他對象或數據庫系統通信。空間數據庫涉及空間的信息,如地理、醫療和衛 星圖像數據庫等,通過數據挖掘可以發現,描述各個地區的人口或者可以根據現有的關于某小區距離中心主要道路的距離的描述來表達這個小區低價的變化程度。通 過縱軸和橫軸的序列數據庫我們可以看出,數據挖掘可以根據數據庫中的數據的變化隨時隨地的進行調整,從而發現數據的變化特點和變化趨勢,通過對這種變化的 趨勢和特點的變化,幫助人們處理計劃, 制定發展策略等。在文本數據庫中大部分是高度化的長句和短文,數據挖掘的作用是發現、描述對象和類的特征,進行關鍵詞和內容關聯性分析以及文本對象的聚 類。多媒體數據庫存儲的是圖像、音頻、視頻數據,在其上進行數據挖掘,這是存儲和搜索技術相結合的新興技術,這種技術中,進行多媒體數據的特征的提取和基 于相似性的模式匹配等。
數據庫的建設是以程序設計為標準的。無論何種先進的技術都有它的局限性,數據挖掘也亦如此,它只能對信息進行初期處理,也就是說,如果收集的數據中出現丟失或沖突的現象,用數據挖掘的算法是不可行的。
3數據挖掘技術
3.1 數據挖掘分析方法數據挖掘的分析方法可分為兩類:直接數據挖掘和間接數據挖掘。直接數據挖掘指:L在指定的數據中,按照某一法則,提取其中可用數據,建立 一個數學模型,并用此模型對余下的數據,或是對有的數據進行描述。直接數據挖掘有:分類、估值、預言。間接數據挖掘指:目標中的數據都是沒有規則的,因而 不能確定某一具體的變量,所以不能用模型來對其進行系統上的描述,只能通過數據之間聯系,將彼此組合起來。間接數據挖掘有:相關性分組或關聯規則、聚集、描述和可視化。下面本文將對分類和預測、關聯分析和聚類分析三種數據挖掘方法介紹。
3.1.1 分類和預測數據分析一般分為分類和預測兩種形式,如果想要知道某種數據未來的走向,或是提取某種模型中重要的數據,可以利用數據分析形式的屬性對其進行描 述,然后得到自己想要的模型,并把數據合理的分類,以便使用原有數據對新數據進行預測。數據分析的兩種形式,在信譽證實、醫療診斷、性能預測和選擇購物等方面的用途也十分廣泛。如在金融證券領域,想要在銀行貸款,必須要分析貸款是否有足夠安全性,風險性是否很高,如此便要建立一個分類模型,對其進行預測,例如想要成功銷售一批計算機設備,我們必須要預測、分析哪類人可能是潛在的用戶。
3.1.2 關聯分析關聯分析在交易數據、關系數據以及其他信息載體中應用較為廣泛,可以查找有關于某一個項目集合或者對象集合之間存在的頻繁模式、關聯、相關性、或 因果結構。當然這種關聯分析也可以用最小置信度和支持度找出所選范圍內所有感興趣的規則。其中最為著名的關聯規則發現方法常用的是Apriori算法。關 聯分析大多應用在消費者一次購物時同時購買锪商品購物分析、某些商品和另外一些物品次序推銷或促銷以及大型工廠、制造廠里生產的產品目錄設計等。如某所大 學,所有學生記錄中,有2%的人專業是會計且選修了數據庫且成績為A;在專業是計算機科學CS且選修了數據庫DB的學生中有75%的人成績為A。
3.1.3 聚類分析聚類分析的方式就按照某種程度的度量方式來進行度量方法,這種方法中將用戶的數據根據需要分解成相應有意義子集合。通過能否用于大數據量和不同的 數據類型,能夠發現不同開關和類型的聚集;對領域知識的要求晝少;對噪聲或數據不同的順序不敏感,來判斷優劣,根據模型可解釋。如:①一些特定癥狀的聚集 可能預示了一個特定的疾病。②租VCD類型不相似的客戶聚集,可能暗示成員屬于不同的亞文化群。
數據倉庫范文3
2008年,四川銷售公司完成了ERP系統在全公司的全面推廣,不僅實現了銷售“一體化”管控,而且實現了財務業務無縫集成及物流、資金流、信息流的三流合一。2009年加油站管理系統在四川銷售公司1400余座加油站部署實施,對加油站的采購、銷售、結算、庫存、客戶、加油卡等進行全面的專業性管理,控制了零售業務的每一個環節,優化業務流程,提高運行效率和管理水平。2011年二次配送系統和油庫系統在全公司推廣運用,實現對油品品種、運輸路徑、運輸車輛、油站庫存、配送時間的統籌安排和優化,并對配送過程進行跟蹤與監控,提高了配送效率和管理水平。2012年以ERP為核心的五大信息系統全面集成,油庫、加油站、二次配送和ERP系統實現了信息數據自動流轉,減少人為干預,提高了數據的準確性。2013年,銷售應用集成系統將在四川銷售公司試點運用,實現與各銷售信息系統管理者視圖的集成。
四川銷售公司的各個信息系統幾乎覆蓋了公司的各項經營和管理的方方面面,這些業務操作型信息系統的上馬和推廣運用,不僅實現公司各個層面的管控信息化,而且為數據倉庫建設提供了大量的歷史數據源。
建設省級數據倉庫的意義
四川銷售公司建設省級公司的數據倉庫是對中石油總部數據倉庫數據支持功能的補充和完善,有利于提高信息系統數據利用效率,彌補總部數據倉庫無法滿足四川銷售公司對精細化管理等方面信息數據挖掘利用需求的缺陷。
總部數據倉庫“臟數據”過多。由于總部數據倉庫涉及面廣,涵蓋了整個中國石油的勘探與生產、天然氣與管道、煉油與銷售、化工與銷售和其他部分,因而數據非常龐大。假設僅僅以全國32家銷售公司的數據在一起建立一個數據倉庫,那么對于四川銷售公司來說,不僅其他板塊的數據甚至其他銷售公司的大量數據基本上為“臟數據”(按32家來計算,96.8%的數據為臟數據)。大量的“臟數據”不僅犧牲了分析的效率,而且降低了分析質量。
總部數據倉庫的數據粒度級過粗,無法滿足四川銷售公司個性化分析需求。全國中石油旗下加油站每日產生的可以作為客戶分析價值高的卡交易記錄,每日總共可達13億條,平均每月記錄過億,所以在總部級數據上無法提供卡客戶低粒度級的分析。在交易明細記錄上,每年的記錄數預計高達53億條以上,在上億條記錄的數據庫中做任何統計計算幾乎都是要命的事,所以要總部數據倉庫提供“購物籃分析”之類細粒度級的數據挖掘功能是不可行的。
總部級的數據倉庫的主要服務對象不是銷售公司一般管理者(特別是二級公司級以下的管理者)??偛考墧祿}庫對四川銷售公司來說,還達不到提升管理和精細化管理的要求。2013年中石油總部推廣運用的銷售應用集成系統主要運用對象是銷售公司、地區公司和地市公司的領導,提供日常辦公、業務數據查詢分析、業務決策、輿情監控和應急指揮等功能;而對于需要大量數據進行分析、挖掘的一般管理人員缺乏分析工具和支持。
數據倉庫設計思路
建立四川銷售公司的數據倉庫不僅是總部數據倉庫數據支持功能的補充和完善,而且是四川銷售公司整合自行開發各類輔助管理信息系統,新增數據挖據分析、商務智能等需求的核心和基石。近年來,四川銷售公司為了滿足自身管理提升需要,陸續開發了加油站輔助管理系統、油庫輔助管理系統、商品管理輔助管理系統、非油輔助管理系統等諸多管理系統。然而這些系統都相互孤立,信息數據沒有集成共享,大部分數據靠人工干預,不僅大大增加了工作量,而且各類信息數據的完整性、正確性和及時性大打折扣,信息數據共享和挖掘功能無法真正發揮?!绊攲釉O計”的總部數據倉庫的數據主要來源于五大系統,雖然確保了不同銷售企業執行同一管理標準,為系統順利集成、統一應用、科學評價奠定了基礎,但是無法滿足因地區和管理差異而新增的個性需求。特別是涉及到與四川本地相關的數據上,總部數據倉庫幾乎是空白。例如分析四川銷售公司及其各個二級的銷售總量、增幅與四川省及其對應地市GDP的總量、增速、能耗的關系時,總部級數據倉庫是無法提供的。如果四川銷售公司有自己的數據倉庫,就可以把四川省及其對應地市GDP的相關數據作為外部數據源進行采集分析。再如需要分析路網建設、競爭對手網點布局對公司自身銷售的影響時,必須要有獨立的數據倉庫,才能快速地得到量化的、科學的分析結果。有了數據倉庫,商務智能才成為可能。沒有數據倉庫,商務智能只能是一個理論。
綜合上述多方考慮,結合中國石油四川內江銷售公司的研究成果、業務經營管理現狀和前期需求調研分析,四川銷售公司的主題需求可分為油品銷售分析、非油品銷售分析、卡客戶分析、商品管理分析、加油站配送分析、財務分析、人力資源分析和市場分析八個主題。根據四川銷售公司信息系統運用狀況,數據源將涉及內部信息系統的有ERP、HOS、FMIS、油庫、二配、加油站管理等,其中市場分析涉及外部數據的采集。
數據倉庫系統接口設計
將數據放置在數據倉庫中既是建設的難點,也是起點。一般數據集成和轉換的過程需要花費約整個數據倉庫建設80%的開發資源。由于ERP、HOS、油庫、FMIS等操作型系統是總部統一開發設計,接口的最佳方式是總部能夠提供對應的數據接口。但是由于“頂層設計”需要,總部沒有開放相關數據接口。如何建立ERP等系統和數據倉庫之間的接口,如何構思編寫ETL軟件實現自動將ERP等操作系統歷史數據到數據倉庫中,是四川銷售公司構建自己數據倉庫的重點和難點,這也是數據倉庫攻關的難點。
通過對當前使用的ERP等系統的調研和分析發現,對于所有系統的數據源可以分為三類。一類是有數據庫訪問方法的系統(例如加油站管理系統的站級系統);第二類是沒有數據庫訪問方法的系統,但有統一的數據導出方式的系統(例如ERP、HOS、FMIS等);第三類是既沒有數據庫的數據源,也沒有統一的數據導出方式的系統(例如外部系統數據)。第一類由于能直接訪問數據庫,ETL設計的重點是數據的清洗和集成;第二類有統一的數據導出方式,ETL設計的重點是數據的采集、糾錯和集成;第三類只能依靠設計模版,人工統一導入相關數據。因此對不同系統數據采集接口需采用不同的方法。
數據的集成到清洗
數據集成、轉換和清洗數據是提高數據集成和提高利用效率的必要步驟。數據在從操作型環境向數據倉庫環境的傳送過程中所經歷的轉換非常復雜,一是DBMS的變化,二是操作系統的變化,三是硬件體系結構的變化,四是語義的變化和編碼的變化等,所以必然存在轉化和清洗。在這個過程中首先要將數據集成,當數據進入倉庫時,要對各個應用的不同值進行正確的譯碼,重新編碼為合適的值;其次必須建立各個不同源字段到數據倉庫字段的映射;然后還需將各個系統不同技術存儲的數據必須轉換到同一種技術下存儲。
在數據的轉換與再清洗過程中,可以將數據以一種稱為“時間間隔”的方式裝載進入數據倉庫,操作型環境新更新的數據可以在操作型環境中停留達24小時,然后才轉移到數據倉庫。例如在加油站管理系統得TILLITEM(交易明細記錄表)含有大量的控制類數據,我們取數主要取對應的交易序號、營業日期、油品、價格、數量、金額、折扣、支付方式、卡號、槍號、罐號、起泵、止泵等數據。
保證數據采集準確性
數據的正確性驗證是提高數據倉庫數據準確有效的必要措施。提高訪問現有系統數據采集正確主要有五種方法:一是掃描在操作型環境中那些被打上時間戳的數據(例如采集ERP等系統的銷售訂單時以創建時間為準,因為創建時間是系統自動生成的時間,不能任意更改);二是只掃描增量文件(例如采集加油站管理系統的站級數據);三是對取數機制進行了程序自動糾錯,對沒有獲取完全的數據自動重新獲??;四是對后臺數據載入清洗程序進行修正,增加容錯機制,對數據臨時變化等問題進行了日志記錄;五是將有對應關系的數據采集后進行對比(例如HOS的油品銷售日報與ERP系統的純槍銷售訂單進行對比),這種方法相對麻煩、復雜。其糾錯驗證在導入數據倉庫前的臨時數據庫里,一旦驗證正確后,方才導入到數據倉庫。
此外,外部數據的采集對于數據倉庫的建設格外重要,因為可以在一定時間范圍內將外部數據與內部數據進行比較,以便給管理者提供一個獨特的視角。例如天氣變化給公司銷量的影響是多少,節假日對公司銷量的影響是多少,各個二級公司銷量與GDP總量的關系,各個二級公司銷售增量與GDP增量的關系?對此,有必要針對主題需求,增加成品油價格行情,四川(各地區)天氣記錄,四川(各地區)GDP數據(總量、增幅、能耗等)等外部數據的錄入。
細化數據粒度
數據的粒度與分區是進行數據倉庫設計決策的兩個最重要方面。保存所有細節數據是錯誤的,一是存儲和處理的開銷可能是個天價;二是大量數據是有效分析技術的一個障礙;三是前面做的細節分析不可復用。所以對于四川銷售公司來說,采用雙重粒度是非常有意義的。
根據測算,全四川省站級系統的交易明細記錄表一年的總記錄數超過億條,卡交易明細記錄表一年的總記錄數也有千萬以上。所以,必須要根據DSS(決策分析)主題需求,進行雙重粒度設計和分區。例如可以對卡交易記錄進行概要記錄統計(例如開卡時間、總消費額、消費次數、最大消費額、最小消費額、消費品種、消費區域、最近消費時間),便于以后的卡客戶的相關分析,而對交易明細進行海量存儲;同時可以對數據進行分區設計,比如按照年度來分區。這樣大大提高了數據近期數據的訪問速度。
由于非油業務開展還處于初級階段,預計一年的記錄數據估計在幾百萬條,可以保存做類似“購物籃分析”的數據挖掘運用。所以需要對卡交易明細和非油交易明細進行不同粒度的設計,以盡可能低的數據粒度來滿足四川銷售公司DSS分析。
數據倉庫范文4
關鍵詞:數據倉庫;商務運作;集成
中圖分類號:TP274 文獻標識碼:A 文章編號:1674-7712 (2012) 06-0077-01
通常來說,對數據倉庫進行建立的過程就是對數據倉庫進行構造和使用,在構造數據倉庫時必須做到數據的統一、清理和集成。在對數據倉庫進行利用的時候必須要借助于決策支持技術,這就使得主管、經理和分析人員等這些知識工人能對數據倉庫進行使用,數據的總體視圖可以方便和快捷的得到,進行決策的時候可以按照數據倉庫中的信息得出。有些研究者在進行數據倉庫構造的過程會選取術語“建立數據倉庫”來進行標示,使用和管理數據倉庫則選取術語“倉庫DBMS”標示,在本文的研究中對兩者不進行區分。目前已經有很多的組織機構進行商務決策活動的時候使用這些信息進行支持,其主要內容包括:對顧客關注度增加,包含購買時間、消費習慣、購買愛好、預算周期等顧客購買模式進行分析;依據地區、年度、季度等劃分對營銷情況做好比較,對管理投資和產品進行重新配置,做好生產策略的調整;對利潤源進行查找和對運作進行分析;做好顧客關系進行管理,做好環境調整,進行合股人的資產開銷情況進行管理。立足于異種數據庫集成,這使得有著十分有效的作用在數據倉庫上。目前有著許多的組織對各種數據進行收集,并且有著分布、自治和異種等數據源對大型數據庫進行維護。通過對這些數據進行集成,這就會有著很大的希望提供有效和簡便的訪問,這也可以作為機遇而存在。目前數據庫研究界和工業界都竭盡全力為實現這個目標。
而集成異種數據庫,依據傳統的數據庫做法就是立足于多個異種數據庫,通過集成程序和包裝程序進行建立。折疊門的例子主要包括Informix的數據刀和IBM的數據連接程序。當有著查詢給客戶站點提交,首要的就是通過元數據字典轉換查詢,從而實現相應異種站點上的查詢轉換。在此基礎上,映射和發送這些查詢到局部查詢處理器。集成不同站點所返回來的結果成為全局回答。而這種查詢驅動的方法進行信息過濾和集成處理顯得比較復雜,并且做到局部數據源上的競爭資源的處理。由于這種方法從功效上顯得比較低效,并且進行頻繁查詢的時候,特別是在聚集操作查詢,要有著很大的開銷。
數據庫為傳統的異種數據庫集成方法提供者有趣替代方案,在數據庫當中通過更新驅動這種方法的使用,而擯棄以往的驅動查詢的方法。這就使得出現預先集成在多個異種源的信息,并且在數據倉庫當中進行存儲,以便提供進行查詢和分析。和聯機事務處理數據庫進行對比發現差異性是最近的信息不包含在數據倉庫當中。但是數據倉庫能夠提供高性能在集成的異種數據庫系統當中,這主要是由于拷貝、集成、預處理、注釋和匯總數據,并且經過重新的組織成為一個語義一致的數據進行存儲。查詢在數據庫當中部隊處理局部源產生影響。另外就是通過對歷史信息存儲和集成在數據倉庫當中,對多維的復雜查詢進行支持。這樣在工業界就非常流行進行數據倉庫的建立。
通過與大家耳熟能詳的商品關系數據庫系統進行比較,就會對數據倉庫很容易進行了解。對查詢處理和聯機事務進行執行這是聯機操作數據庫系統所具備的主要任務。通常將這種系統稱之為聯機事務處理系統。該系統通過對組織中的大部分諸如記賬、注冊、工資、銀行、制造、庫存、購買等日常操作。從另外的層面上來講,數據倉庫系統通過決策方面和數據分析使得服務于用戶或者是“知識工人”。而在這個體系當中所使用不同的格式進行數據的組織和提供,以便因用戶的不同從而不同需求的滿足。通常將這種系統稱為聯機分析處理系統。聯機事務處理系統也稱之為OLTP,聯機分析處理系統稱為OLAP,兩者之間的區別為:
一是用戶和系統的面向性:OLTP是面向顧客的,用于辦事員、客戶、和信息技術專業人員的事務和查詢處理。OLAP是面向市場的,用于知識工人(包括經理、主管、和分析人員)的數據分析。
二是數據內容:OLTP系統管理當前數據。通常,這種數據太瑣碎,難以方便地用于決策。OLAP系統管理大量歷史數據,提供匯總和聚集機制,并在不同的粒度級別上存儲和管理信息。這些特點使得數據容易用于見多識廣的決策。
三是數據庫設計:通常,OLTP系統采用實體-聯系(ER)模型和面向應用的數據庫設計。而OLAP系統通常采用星形或雪花模型和面向主題的數據庫設計。
四是視圖:OLTP系統主要關注一個企業或部門內部的當前數據,而不涉及歷史數據或不同組織的數據。相比之下,由于組織的變化,OLAP系統常??缭綌祿炷J降亩鄠€版本。OLAP系統也處理來自不同組織的信息,由多個數據存儲集成的信息。由于數據量巨大,OLAP數據也存放在多個存儲介質上。
數據倉庫范文5
摘要:該文基于對數據倉庫系統本身的架構和數據模型特征研究,并結合元數據倉儲架構的理論設計提出一種數據倉庫元數據集成與轉換功能的架構,并進行了系統實現,涉及到數據結構的分析、集成與轉換的流程以及列沖突差異的實現。
關鍵詞:元數據;集成與轉換;數據倉庫
中圖分類號:TP311文獻標識碼:A 文章編號:1009-3044(2009)28-7862-02
The Discussion of Integration and Conversion based on Data Warehouse Metadata
HE Chuan
(Electronic Engineering Institute, Hefei 230022, China )
Abstract: The paper introduces the structure and characteristics of data models based on the data warehouse system, and provides the design of a data warehouse meta-data integration and conversion of the architecture in combination with the theory of meta-data warehouse architecture, involving the analysis of the data structure, integration and conversion processes, as well as differences in the realization of the column of conflict.
Key words: Metadata;Integration and Conversion; Data Warehouse
數據集成是把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而為企業提供全面的數據共享。在企業數據集成領域中,已經有了成熟的框架可以利用。但在實施數據共享的過程當中,由于數據源的異構性、分布性、自治性引起的數據內容、數據格式和數據質量千差萬別,有時甚至會遇到數據格式不能轉換或轉換格式后丟失信息等棘手問題,嚴重阻礙了數據在各部門和各軟件系統中的流動與共享。因此,如何對數據進行有效的集成管理是構建數據集成系統的核心問題。
元數據是描述數據的數據,或者說是與數據有關的信息,是數字信息組織和處理的基本工具,是理解數據含義和如何使用數據的關鍵。所以,每一個軟件產品和工具能夠在數據層進行有效集成的前提是,它在元數據層就必須被有效集成。所以對數據倉庫元數據集成和轉換的研究是非常有意義的。
1 元數據集成與轉換的設計
1.1 元數據的信息供應鏈
本文所設計的元數據集成與轉換功能,是基于數據倉庫的,該功能用來提取數據倉庫中各部分產生的元數據,并應用某種策略對其進行綜合管理。通過這些元數據,相關人員可以清楚地了解數據倉庫中的數據結構、業務規則等,從而對決策支持產生巨大的戰略價值。換句話說,元數據集成與轉換管理工具的起點就是數據倉庫的構建過程和業務使用過程。而數據倉庫中信息流動的和處理過程常常用信息供應鏈(ISC,Information Supply Chain)來描述。
從數據源開始,信息經過多次處理,最終用于輔助決策支持。在整個流動過程中,順序產生了四種數據,即源系統中的業務數據、ODS數據、DDS數據,以及OLAP數據,這幾種數據的在粒度、抽象級別以及面向的應用等方面均存在不同[1]。為保證ISC的順暢流動,并使參與此過程的軟件產品都能夠有效工作并基于數據層進行交互操作,就必須對描述各軟件產品的元數據有一致理解。這是因為元數據定義了它們的內部處理邏輯和存儲結構,通過元數據可以制定處理數據的策略。綜上所述,構成ISC的每一個倉儲產品和工具能夠在數據層上進行有效集成的前提是,它們能在元數據層面進行有效的集成。
1.2 集成和轉換的體系結構
本文以聯邦式管理模式為基礎提出元數據集成和轉換功能的架構,主要分為元數據源、局部元數據倉儲、全局元數據倉儲、適配器、元數據抽取、元數據轉換、元數據匯集等部分,如圖1所示。
在上述架構中,所有元數據均來源于組成ISC信息供應鏈的軟件產品。對于存儲業務數據、ODS數據、DDS數據、OLAP數據的倉儲軟件產品,可以經過元數據抽取操作從中獲得諸如存儲結構等信息的元數據,存入各自的局部元數據倉儲中;對于諸如ETL工具、報表工具等軟件產品,產品內部往往會配備記錄該工具使用規則等方面信息的局部元數據倉儲,除此之外,還需對這些信息進行格式的一致性轉換以提供元數據共享的途徑[2]。
局部元數據倉儲中是以關系型數據庫的形式存放元數據的,其中的元數據可以分為兩類,一類是僅為軟件產品自身服務的私有元數據,另一類是需要在企業全局范圍內共享的元數據,稱之為共享元數據。對于前者,只需要存放在局部元數據倉儲中,而對于后者,就需要進一步將其送入關系型的全局元數據倉儲中保存和共享。
2 元數據集成與轉換的實現
2.1 數據結構分析
本文所涉及的集成及轉換工具,內部實現總共分為四個步驟。其中第一步就是將局部元模型導入到工具設計的數據結構中,利用這個數據結構,我們可以存儲局部元模型的表結構以及沖突差異分析后產生的標記。本主涉及如下四個數據結構表。
1) 數據結構l:記錄表來源的數據結構,如表1所示。
2) 數據結構數據結構2:記錄列來源的數據結構,如表2所示。
3) 數據結構3:臨時記錄一一對應的列的數據結構,如表3所示。
4) 數據結構4:臨時記錄一一對應的表的數據結構,如表4所示。
2.2 集成與轉換的流程
假設模型集成工具的兩個輸入模型分別為Ml和M2,目標輸出模型為M3,則需要按照如下步驟完成模型集成:
Step1,將M1和M2中表的相應結構填入初始的集成工具的數據結構中。
Step2,針對數據結構中的數據進行如下流程實現模型的沖突和差異分析。
1) 檢查M1和M2中所有表,將無同名的表的標記Tag值設為TD(Table Difference),同名表的標記Tag值設為TS,并將同名的表Id對加入到數據結構4中。進入步驟2)。
2) 針對每一對標記為TS的表,檢查該表中列個數是否相同、名稱是否相同。如果列一一對應則進入3),且將對應的列Id值對記錄在模型集成工具的數據結構3中;否則進入步驟4)。
3) 查詢并記錄數據結構3對應的表項個數N,即對應的列的個數,分別檢查每對列的屬性,開始列對檢查的循環,查看其數據類型是否沖突。
4) 首先將模型中無同名列的Tag標識為CDl(Column Difference1),說明這是某個輸入模型的表中多出來的列。然后記錄同名的列對的個數N作為循環次數,進入步驟5)。
5) 檢查剩下的同名列的屬性,如果相同,進入步驟6):如果不相同,進入步驟7)。
6) 檢查同名列的數據類型。如果相同,則在數據結構2中,將該對應列的記錄中Tag值設為CE,表示這兩列的完全相同;如果不同,則在數據結構2中將這對列的Tag值設為CC,表示沖突。然后返回到步驟4)進行下一次的循環。
7) 檢查屬性不同的列對。如果其中一個列的屬性是默認值,則進入步驟8);否則將數據結構2中的相應兩個列對應的記錄的Tag值設為CC,表示屬性值沖突。
8) 繼續檢查該列對的數據類型。判斷是否所有的同名列都已檢查完畢,如果沒有,則返回步驟4)進行下一次的循環。
Step3,針對分析過程中得到的不同種類的沖突和差異加以解決,并輸出目標模型M3。在分析的流程中,我們得到了不同標記的表和列,針對不同標記有不同的沖突和差異解決方案。
2.3 列沖突差異的實現
1) 列沖突CC
思路:生成列沖突的原因是列屬性設置或者數據類型不同。這種情況下,本文的集成工具默認認為其不存在模型合并的必要,只需將兩個輸入數掘模型的表結構完全拷備,添加到輸出模型中即可。但是,如果將來需要用戶選擇解決沖突方式的需求,也可以在本文設計的集成工具的基礎上增加這個功能。
算法:遍歷查詢數據結構2所在表每條Tag值為CC的記錄,獲得該記錄的OwnedTableId,到數據結構l中查找符合條件的記錄,使得該記錄的TableID值等于0wnedTableId,這樣,就找到了相應模型中的表結構,從而添加到新模型中。
2) 列差異CD
思路:CD表示某一輸入模型的表較另一輸入模型的表多了一些列,這種情況下,我們要將含有多余列的表結構加入到新模型中。
算法:遍歷查詢數據結構2所在表中每條Tag值為CD的記錄,獲得該記錄的OwnedTableId,到數據結構1中查找符合條件的記錄,使該記錄的TableID值等于OwnedTableId,這樣,就找到了相應模型中的表結構,將其添加到新模型中即可。
3 結束語
總之,數據倉庫及其元數據是企業知識管理的重要組成,數據倉庫的元數據管理終歸是一個非常繁瑣復雜的過程,其范圍涉及數據倉庫的整個環節,一個完整、通用的元數據管理系統的構建注定充滿了迭代和不斷反復,因此,對它的研究也應該是長期的、不斷探索的過程。
參考文獻:
數據倉庫范文6
【關鍵詞】數據倉庫;OLAP技術;數據ROLAP技術
1 數據倉庫概念及其體系結構分析
1.1 數據倉庫定義分析
數據倉庫的本質是由聯機分析系統和決策支持系統共同構成的結構化數據環境,是一個具有穩定性和集成性,能夠面向發展主題的數據集合,并通過數據的分布管理和并行處理以支持企業集體管理過程中的決策。數據倉庫的建立為企業的決策處理提供了更為有力的支持,其數據并行處理的多變性也使得數據倉庫能夠在不同的數據環境中對大量的數據信息進行有效的處理。在數據倉庫的實際應用中,高層次的數據歸類標準能夠使數據在宏觀上得到類型劃分,不同類型的數據在依照各自歸屬領域中邏輯處理后,經集成和加工后變為面向主題的數據集合,并為之后的數據調取做好準備。
1.2 數據倉庫的體系結構劃分
數據倉庫在數據處理過程中主要分為數據的分析型處理和操作型處理,兩種數據處理方式在實際應用中通常區別使用,以保證數據倉庫中數據結構的整體性。為進一步完善數據倉庫的體系結構,通常將數據倉庫的體系結構劃分為數據查詢和分析組件,數據集成組件,數據源和監視器等體系結構。數據查詢和分析組件能夠將數據倉庫的終端用戶數據信息轉換為數據源裝入DW,并在數據集成組件的DW視圖維護中完成數據源的合并及過濾。數據源作為一個數據庫系統,主要包括HTML類型文件和SGML類型文件等,數據倉庫的內容通過監視器與多類型文件相連接,以實現數據倉庫中數據源的監測與處理。隨著數據倉庫在實際應用中的日漸完善,其體系結構的劃分也更為具體化,數據提取工具,轉換工具以及其他多種數據處理工具的協調使用使得數據倉庫日漸成為數據處理系統的核心,并以此為基礎滿足用戶的多方面數據需求。
2 數據聯機分析處理技術發展背景討論
OLAP技術即數據聯機處理技術,該技術的發展是以數據庫技術為基礎的,隨著計算機數據處理和計算技術的迅速發展,數據倉庫的建立已經成為計算機數據處理的首要前提。在社會經濟的迅速潮流中,企業經濟成為了社會經濟構成中的一部分,發展至今,企業經濟已成為社會進步的主要推動力,因此為保證社會的經濟進步,企業的經濟建設是必不可少的。為進一步提升企業的運營效益,企業決策者引進了數據倉庫技術,通過對企業累計的大量生產及業務數據進行分析處理,并從多數據類型中篩選出有效的數據信息,通過有效信息的篩選反應企業的運營實際情況,并為企業的決策提供數據支持。隨著企業決策者對數據信息策略性價值的不斷探索,數據聯機處理技術得以開發,這一技術的開發與應用不僅充分展現了企業數據信息的策略性價值,也使得企業之間信息視圖的互訪成為可能。OLAP技術開發研究的逐漸深入,使其數據處理的效率和一致性都在一定程度上得以提升,隨著OLAP技術在企業數據倉庫技術基礎上應用的進一步推廣,企業決策者以及管理人員將能夠更為明晰的洞察到數據倉庫中數據的隱含規律,進而制定出更切合企業發展實際的發展決策。
3 基于數據倉庫的OLAP技術概論
3.1 OLAP概念分析
OLAP技術是指在處理特定問題的情況下采取的聯機數據訪問和處理技術,通過對大量數據進行分析和處理,使得數據中所包含的信息內容能夠被決策者快速的讀取訪問,進而為決策者的數據深入調查提供便利。OLAP技術在實際應用中是以多維視圖的形式展現的,通過劃分維度層次使數據中的細節信息得到多方面描述,并通過處理企業日常運營過程中產生的數據以起到支持企業決策的有效作用。
3.2 OLAP技術特點分析
根據OLAP技術的實際應用作用分析可知,OLAP技術具有信息性,多維性及可分析性等多種技術特點。從信息性角度分析,由于OLAP技術的職能是對大量的數據內容進行分析與處理,并且數據的存儲位置無法影響到信息獲取效率,所以OLAP技術通常用于管理大量的數據信息,并且在磁盤空間應用和數據倉庫結合等多方面都有較為廣泛的應用。OLAP技術還能夠在進行數據邏輯分析的同時對數據進行統計分析,這便使得用戶在定義全新的編程運算時無需針對運算過程進行程序編寫,為用戶的實際應用提供了很大的方便。OLAP技術的可分析性也體現在用戶對OLAP系統的應用中。OLAP技術為用戶提供了OLAP數據平臺,用戶能夠在平臺上完成數據分析,OLAP技術平臺也能夠連接到其他數據分析工具上,通過其他數據分析工具將分析結果錄入到系統中,進而提升OLAP系統的數據處理效率和準確性。OLAP技術的多維性作為該技術的關鍵屬性,是系統進行數據處理后結果的直觀展示,OLAP技術中多維視圖的展現,使得企業運營中產生的數據內容能夠得到最為直觀的展現,加之多維視圖中層次維和多層次維的引入,更是使得數據內容展現得以進一步豐富。
4 基于數據倉庫的OLAP技術探究
4.1 OLAP數據模型結構分類
OLAP技術主要應用于大量數據的分析歸納過程中,由于數據種類和處理方式的多樣性,OLAP技術在實際應用中必須能夠支持多維視圖模式,并且具備一定的旋轉性,這樣才能有效滿足用戶需求。為進一步提升OLAP數據處理系統性能,通常要以關系型數據庫為基礎搭建數據倉庫,并通過數據倉庫與OLAP技術的協調運行來實現數據的數據的有效處理。為滿足用戶因數據接口不同而產生的數據存儲需求,將OLAP數據處理技術分為三種數據模型。數據容量最小的是基于多維數據庫的數據模型結構。該結構中數據的存場所是多維度數據庫,數據庫由多個多維數組存儲單元構成,不同數組存儲單元中存儲的數據類型都具有統一的屬性,這也為后期類型性數據的調取與處理提供了方便?;陉P系型數據庫的OLAP具有更為靈活的縮放性,該技術產品更加強強調對數據的并發控制管理,由于數據的并發控制管理在實際應用中最為普及,也使得這種數據模型結構成為當下最為成熟的模型結構?;旌闲蚈LAP數據模型結構是在最近得以發展的,該數據模型結構最大的特點是融合了多維數據庫結構和關系型數據庫結構的優點,兩種數據模型結構的有機結合使得混合型OLAP數據模型結構具有更為優良的擴展性和數據處理速度。
4.2 OLAP數據模型搭建
在基于數據倉庫下的OLAP技術中,OLAP數據模型的搭建是OLAP的技術核心。在整個數據模型中,維和度量共同構成了數據信息的分析處理標準,OLAP技術便是以這兩種衡量標準進行數據的分析處理的。OLAP數據模型的搭建為終端用戶的數據查詢和報表提供了更為簡要的處理方式,復雜的數據查詢方式向簡要數據切片處理方式的轉換,使得數據倉庫中的數據內容能夠以多維視圖的形式展現給用戶,使得用戶的數據查詢和處理過程在很大程度上得到簡化。在OLAP數據模型中,維是同種類型數據的集合,數據所具備的變量特性使得維具有自身的屬性特點。OLAP數據模型中的度量則與維不同,它僅表示一個度量值,如在商品銷售中,度量的存在形式主要包括商品單價,銷售數量以及銷售總額等,與數據模型中的維不同,度量更為強調數值本身的屬性,是數值所代表內容的直觀體(下轉第166頁)(上接第136頁)現。
4.3 OLAP數據模型多維表示方法
在OLAP技術和數據倉庫的結合與應用中,為有效提社OLAP數據處理效率,通常將多維數據庫轉換為事實表和維表兩大類型。事實表在關系數據庫中表示數據關系時,通常要以存儲數據的實施度量值和不同位的主碼為基礎,而維表在OLAP數據模型的表示中則保留了描述不同維之間層次關系以及成員類別等必要的數據內容。在OLAP技術數據模型的多維表示中,事實表和維表的緊密聯系能夠使關系數據庫中的數據類型分類更為明晰,維表中不同數據屬性的ID主碼也使得OLAP數據模型呈現出星型模式,這也進一步表明了數據倉庫中數據二維關系的確立,為數據的多維查詢和描述提供了有效參考。雪花模式也是OLAP數據模型的重要體現。在OLAP關系數據庫中的雪花模式下,企業的決策人員和管理人員不再需要從多層次,多角度進行數據分析,而是從多維表的數據描述中得出數據的數據集構造。如在商品銷售中,按照商品產地,商品種類和用途等將商品進行不同種類的劃分,這就會使得OLAP星型數據結構的頂端出現分支,進而演變成為關系數據庫的雪花模式。OLAP技術的雪花模式數據模型能夠利用多張維表表示維層次復雜且成員類型較多的數據集,并且數據在存儲時也要借助實施表和維表的聯結才能實現,雪花模式下OLAP技術與數據倉庫的結合使得維表形式更為規范化,這也為OLAP技術今后的探究與發展指明了方向。
5 結束語
隨著我國社會企業競爭的日趨激烈,企業中決策人員的數據信息獲取能力成為了影響企業發展的關鍵,也成為了企業競爭與發展的根本,OLAP技術和數據倉庫的應用,為企業的數據處理提供了多維的數據分析方式,此外,OLAP技術的應用也為數據用戶提供了便捷的數據查詢途徑。在計算機技術發展的推動下,我國基于數據倉庫的OLAP技術將會更加靈活,數據分析與處理水平也會得到顯著提高,隨著我國對數據分析與處理研究的深入,OLAP技術將會受到更為廣泛的應用。
【參考文獻】
[1]王珊,等.數據倉庫技術與聯機分析處理[M].北京科學出版社,2010,12(8):35-56.