前言:中文期刊網(wǎng)精心挑選了金橘樹范文供你參考和學(xué)習(xí),希望我們的參考范文能激發(fā)你的文章創(chuàng)作靈感,歡迎閱讀。
金橘樹范文1
大數(shù)據(jù)服務(wù)
我們可以干點(diǎn)兒啥
國(guó)家信息中心常務(wù)副主任杜平表示,如今在某些應(yīng)用領(lǐng)域,信息尚未完全流動(dòng)起來,這給大數(shù)據(jù)產(chǎn)業(yè)以及服務(wù)提供了發(fā)展空間。目前,大數(shù)據(jù)已經(jīng)不單單是概念,應(yīng)該通過服務(wù)表現(xiàn)。而京津冀大數(shù)據(jù)產(chǎn)業(yè)聯(lián)合發(fā)展,將成為促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)以及服務(wù)進(jìn)行跨部門、跨區(qū)域部署發(fā)展的催化劑。
目前,大數(shù)據(jù)服務(wù)如果從第三方的角度來看,大致可以分為兩種類型,一種是平臺(tái)商,另一種是服務(wù)商。無論是硬件還是軟件,可能人們更關(guān)注直接提供服務(wù)的這部分市場(chǎng),特別是聚焦到第三方服務(wù)的小市場(chǎng)。
大數(shù)據(jù)服務(wù)在篩選服務(wù)對(duì)象的過程中,往往遵循這樣的規(guī)律:作為企業(yè),首先要具備信息化和標(biāo)準(zhǔn)化的平臺(tái)、數(shù)據(jù)庫,另外涉及這樣的服務(wù)需求。實(shí)際上對(duì)于大數(shù)據(jù)服務(wù),本身的差異性可以從數(shù)據(jù)采集的方式,分析方法,從結(jié)構(gòu)化的計(jì)算到非結(jié)構(gòu)化等方面表現(xiàn)出來。例如大家經(jīng)常用的滴滴,每天數(shù)據(jù)處理量是70TB,甚至現(xiàn)在可以基于滴滴的數(shù)據(jù)了解到整個(gè)城市交通情況的數(shù)據(jù)。現(xiàn)在有很多企業(yè)通過購物偏好推接購買產(chǎn)品,更多通過對(duì)其行為屬性、行為習(xí)慣等方面打標(biāo)簽,甚至從價(jià)值觀角度進(jìn)行判斷。例如一個(gè)人如果常年喝依云,購買農(nóng)夫山泉的可能性有多大?可以根據(jù)這樣的屬性推導(dǎo)相應(yīng)的營(yíng)銷現(xiàn)場(chǎng),進(jìn)而判斷用戶購買路徑、會(huì)員服務(wù)或購買建議等。所以對(duì)于第三方服務(wù)來說,基于不同階段的企業(yè)會(huì)有不同的服務(wù)方式。
慧辰資訊TMT互聯(lián)網(wǎng)研究部總經(jīng)理劉贊對(duì)《中國(guó)信息化周報(bào)》記者表示:“大數(shù)據(jù)服務(wù)會(huì)有四種趨勢(shì),針對(duì)服務(wù)的企業(yè)對(duì)象其信息化基礎(chǔ)不同,服務(wù)的三個(gè)階段肯定是并存的。從三個(gè)階段發(fā)展方向來講,第一階段是滿足基礎(chǔ)的信息化需求,下一步是整合內(nèi)外部數(shù)據(jù),第三階段是通過數(shù)據(jù)為導(dǎo)向的應(yīng)用要求,未來數(shù)據(jù)會(huì)成為企業(yè)的生命線并作為服務(wù)基礎(chǔ)。”從數(shù)據(jù)本身來講,有數(shù)據(jù)才有大數(shù)據(jù)服務(wù)。如今一些互聯(lián)網(wǎng)巨頭,例如谷歌和百度,都把自己資源平臺(tái)開放出來,但并不是所有的企業(yè)都需要進(jìn)行私有云的部署。尤其是數(shù)據(jù)量龐大之后,肯定是會(huì)有這樣的公共計(jì)算資源平臺(tái)。
“實(shí)際上現(xiàn)階段不是所有企業(yè)都有大數(shù)據(jù),但不可否認(rèn)的是已經(jīng)有很多企業(yè),例如快銷品行業(yè)或手機(jī)終端企業(yè),會(huì)結(jié)合自己本身企業(yè)的數(shù)據(jù),去做大小數(shù)據(jù)的結(jié)合,這其中包括互聯(lián)網(wǎng)數(shù)據(jù)、環(huán)境監(jiān)測(cè)數(shù)據(jù)等,還有一些企業(yè)內(nèi)部戰(zhàn)略的數(shù)據(jù)。所謂的大小數(shù)據(jù),大數(shù)據(jù)包括互聯(lián)網(wǎng)相關(guān)的產(chǎn)品評(píng)論數(shù)據(jù)和用戶參加活動(dòng)的數(shù)據(jù)等,小數(shù)據(jù)是包括企業(yè)內(nèi)部的CRM數(shù)據(jù)等。如果采用傳統(tǒng)方法,這些數(shù)據(jù)是很難結(jié)合在一起的。如今采用大數(shù)據(jù)的計(jì)算模型就會(huì)簡(jiǎn)單很多,這或許可以給京津冀大數(shù)據(jù)企業(yè)發(fā)展帶來一些啟發(fā)。”劉贊補(bǔ)充道。
為生活洞見數(shù)據(jù)的美好
2013年,廣州市政府審批一個(gè)大項(xiàng)目需要700個(gè)工作日,開發(fā)了政務(wù)數(shù)據(jù)整合系統(tǒng),將數(shù)據(jù)進(jìn)行打通后,審計(jì)進(jìn)程從700多天減少到27天。這對(duì)政府來說是很好地利用大數(shù)據(jù)整合連接并提高效率,對(duì)企業(yè)來說也很受鼓舞。
不單單是廣州,京津冀大數(shù)據(jù)產(chǎn)業(yè)的蓬勃發(fā)展同樣離不開企業(yè)的參與。眾所周知,浪潮是國(guó)內(nèi)硬件產(chǎn)品的代表企業(yè)之一,自從進(jìn)入大數(shù)據(jù)時(shí)代,尤其“互聯(lián)網(wǎng)+大數(shù)據(jù)”熱潮瀕臨之際對(duì)許多傳統(tǒng)產(chǎn)業(yè)沖擊的同時(shí),浪潮也在不斷思索如何改變自己適應(yīng)時(shí)展的要求,利用大數(shù)據(jù)方面的知識(shí)積累嘗試一些突破,例如搭建創(chuàng)客平臺(tái),幫助廣大中小微企業(yè)創(chuàng)業(yè)者獲取大數(shù)據(jù)資源和工具平臺(tái),助力包括京津冀在內(nèi)的地方政府實(shí)現(xiàn)大眾創(chuàng)業(yè)、萬眾創(chuàng)新發(fā)展。例如,美國(guó)將政府的數(shù)據(jù)做了很好的整合,在谷歌導(dǎo)航中將門牌號(hào)、地址全部標(biāo)準(zhǔn)化,基于這種思考,浪潮進(jìn)行了“卓數(shù)平臺(tái)”的開發(fā),收集來自互聯(lián)網(wǎng)和政府開放數(shù)據(jù),通過數(shù)據(jù)服務(wù)、API工具對(duì)創(chuàng)客或開發(fā)者提供數(shù)據(jù)服務(wù),延展了“數(shù)據(jù)開發(fā)服務(wù)”的思路。“如今隨著大眾創(chuàng)業(yè)、萬眾創(chuàng)新的風(fēng)靡,我們把與數(shù)據(jù)相關(guān)聯(lián)的創(chuàng)業(yè)人員分兩類,一類是創(chuàng)客,即應(yīng)用數(shù)據(jù)的人,另一類是生產(chǎn)數(shù)據(jù)的人,一起加工處理數(shù)據(jù)。其中浪潮提供一個(gè)治理平臺(tái),涉及到基礎(chǔ)設(shè)施、服務(wù)器、數(shù)據(jù)處理工具、數(shù)據(jù)的挖掘分析工具等,到現(xiàn)在為止有小小進(jìn)展。”浪潮云服務(wù)集團(tuán)有限公司數(shù)據(jù)服務(wù)事業(yè)部總經(jīng)理徐宏偉對(duì)《中國(guó)信息化周報(bào)》記者說。
在濟(jì)南,一家公司利用浪潮的平臺(tái)生成了鋼鐵、水泥等數(shù)據(jù),做數(shù)據(jù)服務(wù)。開放了一個(gè)DP為一千多家建筑公司、兩千多家造價(jià)師提供服務(wù),有這樣一個(gè)及時(shí)并實(shí)時(shí)提供數(shù)據(jù)的APP,造價(jià)師可以精確地在每一次進(jìn)行采購時(shí),優(yōu)化采購的庫存調(diào)整。在焦作,浪潮把數(shù)據(jù)采集提供給河南大學(xué)的學(xué)生們,他們把當(dāng)?shù)靥禺a(chǎn)鐵棍山藥的數(shù)據(jù)做了收集,形成鐵棍山藥產(chǎn)業(yè)數(shù)據(jù)庫。如今政府利用數(shù)據(jù)庫分析依據(jù),向鐵棍山藥批發(fā)、運(yùn)輸、加工企業(yè)提供數(shù)據(jù)。可以說浪潮將大數(shù)據(jù)服務(wù)的方方面面運(yùn)用得恰到好處,時(shí)刻洞悉數(shù)據(jù)見證生活美好的道理,為京津冀大數(shù)據(jù)企業(yè)發(fā)展做出了榜樣。
大數(shù)據(jù)
發(fā)展正從滲透走向落地
總結(jié)大數(shù)據(jù)產(chǎn)業(yè)未來發(fā)展的重點(diǎn)方向,首先還需要國(guó)家以及政府的指導(dǎo),這對(duì)京津冀大數(shù)據(jù)發(fā)展至關(guān)重要,需要充分發(fā)揮政府引導(dǎo)作用,努力創(chuàng)新拓展大數(shù)據(jù)發(fā)展領(lǐng)域、內(nèi)容以及模式。
金橘樹范文2
年歲末,一份懷胎十月、即將分娩的《有色金屬工業(yè)“十二五”規(guī)劃》,引發(fā)了業(yè)界高度關(guān)注。
根據(jù)該規(guī)劃,國(guó)家將對(duì)鎢、鉬、錫、銻、稀土等戰(zhàn)略性小金屬的發(fā)展做出專項(xiàng)規(guī)劃,并提出“建立完整的國(guó)家儲(chǔ)備體系”。
有關(guān)“收儲(chǔ)小金屬”的傳言,已有多次,每每帶動(dòng)小金屬價(jià)格一輪接一輪飆升。比如,2011年5月,國(guó)務(wù)院下發(fā)《關(guān)于促進(jìn)稀土行業(yè)持續(xù)健康發(fā)展的若干意見》,明確提出建立稀土戰(zhàn)略儲(chǔ)備,之后兩個(gè)月稀土礦產(chǎn)價(jià)格上漲超過500%;其他非稀土小金屬也紛紛發(fā)力上揚(yáng),鎢精礦、甚至用量極有限的精銦價(jià)格,均上漲了兩倍多。
2011年后半年,小金屬價(jià)格新一漲后,收儲(chǔ)政策卻遲遲不見蹤影。失去政策支撐的市場(chǎng)初現(xiàn)塌陷:一個(gè)月間,碳酸稀土價(jià)格下跌50%左右,氧化鐠釹下跌約30%,鎢精礦下跌20%,精銦價(jià)格下跌30%……
此次,傳說已久的收儲(chǔ)政策是否能夠真的出臺(tái)?
小金屬豆腐價(jià)
2011年11月26日,商務(wù)部公布了2012年第一批有色金屬出口配額,鎢、銻、銦、錫、鉬等5種戰(zhàn)略性小金屬和貴金屬白銀出口配額共計(jì)6.28萬噸,與2011年的6.42萬噸相比,略有降低。
這正切合了此前的一個(gè)業(yè)界傳說:商務(wù)部正在調(diào)整稀有金屬出口政策,預(yù)計(jì)其出口配額將以2%至3%的幅度逐年遞減。
按有色金屬使用范圍和產(chǎn)量分類,可統(tǒng)分為基本金屬、貴金屬和小金屬三類。基本金屬即所謂大金屬,主要包括銅、鋁、鉛、鋅等儲(chǔ)量、產(chǎn)量和使用量都較大的品種;貴金屬主要指金、銀、鉑等;而小金屬,一般指除基本金屬和貴金屬之外的有色金屬。其中,鎢、鉬、錫、銻、銦、鍺、鎵、鈮、鉭、鋯,是涉及“十二五”國(guó)家戰(zhàn)略儲(chǔ)備的10種小金屬;我國(guó)重點(diǎn)保護(hù)的稀土類金屬,亦屬小金屬。
從此次配額情況看來,不僅總量微幅下降,其中初級(jí)原料的配額量更是大幅收縮。譬如,2012年鎢酸及鹽類的第一批出口配額下降了67.27%,氧化鎢配額也下降了13.24%,但鎢粉及其制品配額卻大幅提升了71.67%。
這清楚表明了我國(guó)對(duì)稀有小金屬的出口態(tài)度:提升產(chǎn)品附加值,不再以簡(jiǎn)單、初級(jí)產(chǎn)品的出口國(guó)面目出現(xiàn)。
這并不足為奇:國(guó)家統(tǒng)計(jì)局公布的10種有色金屬產(chǎn)量,小金屬產(chǎn)量占比雖不足5%,但卻是現(xiàn)代工業(yè)和戰(zhàn)略新興產(chǎn)業(yè)不可或缺的礦產(chǎn)。
長(zhǎng)期以來,我國(guó)對(duì)小金屬用途的研發(fā)有限,鎢、鉬、錫、銻、銦、鍺等戰(zhàn)略資源一直只是出口創(chuàng)匯的工具。上世紀(jì)90年代,國(guó)家下放采礦權(quán),各地出于對(duì)礦產(chǎn)利益的追逐,各種小金屬和煤礦一樣,都陷入了一哄而上、各自為戰(zhàn)、有水快流的亂局。
“金子賣了豆腐價(jià)”。小金屬礦產(chǎn)市場(chǎng)需求量本來不大,嚴(yán)重供應(yīng)過剩更是帶來了競(jìng)相壓價(jià)的惡性競(jìng)爭(zhēng),最終導(dǎo)致我國(guó)本該掌握的國(guó)際市場(chǎng)價(jià)格話語權(quán)徹底喪失。
比如錫,因?yàn)閮?chǔ)量有限,曾與鎢、銻、稀土并稱為中國(guó)“四大戰(zhàn)略資源”。在上世紀(jì)90年代,錫作為中國(guó)優(yōu)勢(shì)礦產(chǎn),產(chǎn)量一度占到全球1/3;但因大量出口,以及全球電子產(chǎn)業(yè)向中國(guó)轉(zhuǎn)移,2005年后中國(guó)竟成錫短缺大國(guó),反而大量進(jìn)口。
再如制作硬質(zhì)合金必不可少、被譽(yù)為“工業(yè)牙齒”的鎢。“中國(guó)正以65%的儲(chǔ)量,支持著世界85%以上的鎢資源供給,我國(guó)鎢資源優(yōu)勢(shì)快速弱化已是不爭(zhēng)的事實(shí)”,中國(guó)國(guó)土資源經(jīng)濟(jì)研究院研究員陳甲斌告訴《財(cái)經(jīng)國(guó)家周刊》記者,“目前,我國(guó)鎢精礦產(chǎn)量接近10萬噸,而國(guó)內(nèi)消耗不足3萬噸;全球稀缺的鎢礦,我們卻以氧化鎢、鎢酸鹽、鎢釬桿、粗鎢絲等初級(jí)產(chǎn)品形式,大量出口到國(guó)外”。
依照目前開采進(jìn)度,我國(guó)鎢資源僅能維持不到25年;而俄羅斯與加拿大的靜態(tài)儲(chǔ)采比分別達(dá)到100年和400年。
“從某種程度上說,中國(guó)的一些優(yōu)勢(shì)小金屬,又是‘下一個(gè)稀土’,面臨著行業(yè)混亂和開采失控的危機(jī)局面”,全國(guó)礦業(yè)聯(lián)合會(huì)產(chǎn)業(yè)發(fā)展部總工程師吳榮慶對(duì)《財(cái)經(jīng)國(guó)家周刊》記者表示。
“國(guó)儲(chǔ)”謀局
據(jù)工信部原材料工業(yè)司司長(zhǎng)陳燕海向《財(cái)經(jīng)國(guó)家周刊》記者介紹,中國(guó)的鎢、銦和稀土等稀有小金屬儲(chǔ)量居全球第一,產(chǎn)量占全球80%以上,鉬、鍺等稀有金屬儲(chǔ)量和產(chǎn)量也居全球前列;但由于國(guó)內(nèi)市場(chǎng)的惡性競(jìng)爭(zhēng)和低位價(jià)格戰(zhàn),使得中國(guó)稀有金屬資源浪費(fèi)嚴(yán)重。
必須迅速建立稀有金屬戰(zhàn)略儲(chǔ)備制度,提升中國(guó)在稀有金屬上的貿(mào)易定價(jià)權(quán)和話語權(quán)――這幾乎成為所有業(yè)界人士的一致呼聲。
《財(cái)經(jīng)國(guó)家周刊》記者了解到,即將出臺(tái)的《有色金屬工業(yè)“十二五”規(guī)劃》提出的“完整的國(guó)家儲(chǔ)備體系”,包括企業(yè)儲(chǔ)備、國(guó)家戰(zhàn)略實(shí)物儲(chǔ)備和礦產(chǎn)資源地儲(chǔ)備三種。
企業(yè)儲(chǔ)備也包含在國(guó)家儲(chǔ)備體系中,“這意味著,一些生產(chǎn)比較集中的小金屬,如果企業(yè)儲(chǔ)備能夠達(dá)到控制產(chǎn)量、穩(wěn)定價(jià)格的目的,國(guó)家財(cái)政就不會(huì)做過多投入”,業(yè)界人士如此分析;
業(yè)界人士告訴《財(cái)經(jīng)國(guó)家周刊》記者,對(duì)那些產(chǎn)量較小、戰(zhàn)略地位突出的礦產(chǎn),如南方重稀土,或者主要依賴進(jìn)口的礦產(chǎn),如鈮、鉭、鋯等,可能會(huì)更早實(shí)施國(guó)家實(shí)物儲(chǔ)備;對(duì)于一些伴生礦,如銦、鍺、鎵等涉及我國(guó)下一步新技術(shù)轉(zhuǎn)型,且目前下游開發(fā)不足,又受主體礦產(chǎn)影響、市場(chǎng)波動(dòng)較大的礦產(chǎn),也會(huì)優(yōu)先考慮國(guó)家實(shí)物儲(chǔ)備;
而對(duì)于產(chǎn)量較大、超采嚴(yán)重的品種,如北方輕稀土、鎢、鉬、銻等礦產(chǎn),將會(huì)實(shí)施礦產(chǎn)資源地保護(hù)政策。
“十二五”期間,我國(guó)將在首先滿足國(guó)內(nèi)需求的基礎(chǔ)上,實(shí)施礦產(chǎn)資源總量控制,并形成幾個(gè)大型綜合礦業(yè)集團(tuán),結(jié)束礦產(chǎn)資源小散亂的生產(chǎn)局面,基本達(dá)到礦上生產(chǎn)與資源儲(chǔ)量相匹配的狀態(tài)”,吳榮慶對(duì)《財(cái)經(jīng)國(guó)家周刊》記者表示,“至于礦產(chǎn)價(jià)格將由市場(chǎng)自己決定”。
事實(shí)上,對(duì)于稀有金屬的收儲(chǔ)期待,由來已久。
在《國(guó)土資源“十一五”規(guī)劃綱要》中,曾經(jīng)明確提出建立礦產(chǎn)資源儲(chǔ)備機(jī)制,并推進(jìn)重要礦產(chǎn)資源戰(zhàn)略領(lǐng)略,啟動(dòng)鐵、銅、鋁、錳、鉻、鉀鹽等非能源短缺性礦產(chǎn)和稀土、鎢等優(yōu)勢(shì)礦產(chǎn)的礦產(chǎn)品戰(zhàn)略儲(chǔ)備,逐步推進(jìn)探明礦產(chǎn)地的戰(zhàn)略儲(chǔ)備。
再往前追溯到上世紀(jì)八十年代中期,由于鎢產(chǎn)品供過于求,諸多國(guó)有鎢企生存艱難,國(guó)家也一度對(duì)鎢砂進(jìn)行了收儲(chǔ)。
“小金屬國(guó)儲(chǔ)政策何時(shí)出臺(tái)我不知道。但是,建立小金屬國(guó)家戰(zhàn)略儲(chǔ)備、建立礦產(chǎn)儲(chǔ)備資源基地和采礦權(quán)清理整頓的工作正在進(jìn)行。只是國(guó)內(nèi)外對(duì)此過于敏感,我們要悄悄進(jìn)行”,國(guó)土資源部?jī)?chǔ)備司副司長(zhǎng)許大純?cè)诮邮堋敦?cái)經(jīng)國(guó)家周刊》記者采訪時(shí)表示。
許大純認(rèn)為,小金屬資源保護(hù),其意圖就是要提高礦產(chǎn)資源綜合利用能力、環(huán)保能力、后續(xù)深加工能力,實(shí)施產(chǎn)業(yè)升級(jí),對(duì)不能達(dá)標(biāo)的企業(yè)實(shí)施淘汰。
前車之鑒
事實(shí)上,在國(guó)家層面的收儲(chǔ)尚未出臺(tái)之前,地方政府早已經(jīng)開始了小金屬的收儲(chǔ)嘗試,其中,以包頭和贛州最具代表性。
2008年,全球金融危機(jī)導(dǎo)致國(guó)際有色金屬行情下滑,出口滯銷,一些以小金屬為支柱產(chǎn)業(yè)的地方政府難以承受,于是展開收儲(chǔ)。
2008年12月,內(nèi)蒙古組建了包鋼稀土國(guó)際貿(mào)易有限公司,開始對(duì)包頭生產(chǎn)的稀土產(chǎn)品進(jìn)行儲(chǔ)備的初步嘗試;
2009年1月,江西贛州市政府決定收儲(chǔ)18億元的鎢和稀土產(chǎn)品,以支持當(dāng)?shù)劓u和稀土產(chǎn)業(yè);
2010年2月,內(nèi)蒙古人民政府批準(zhǔn)包鋼稀土國(guó)際貿(mào)易有限公司實(shí)施包頭稀土原料產(chǎn)品戰(zhàn)略儲(chǔ)備方案。其方案是,儲(chǔ)備資金主要由企業(yè)自行承擔(dān),自治區(qū)、包頭市、包鋼集團(tuán)共同給予貼息支持,自治區(qū)貼息1000萬元,包頭市貼息1000萬元,其余由包鋼集團(tuán)貼息。
2011年5月,小金屬重要組成部分的稀土,又開始新一輪行業(yè)整頓:大量從事開采、選礦、冶煉的民營(yíng)小企業(yè)紛紛被關(guān)停或被兼并重組,包鋼稀土(600111.SH)獲得了對(duì)包頭稀土礦產(chǎn)的統(tǒng)購、統(tǒng)銷大權(quán);在南方,以五礦、中鋁等央企為核心的稀土礦產(chǎn)整合也初具規(guī)模。
與之伴生的,是稀土價(jià)格的一路飛漲。2011年5~7月,3個(gè)月間稀土價(jià)格上漲超過1倍。
不料,2011年8月,稀土開始上演暴跌行情。一個(gè)月間,碳酸稀土價(jià)格下跌50%左右,氧化鐠釹價(jià)格下跌約30%。2011年9月19日,包鋼稀土以90萬元/噸的價(jià)格開始收儲(chǔ)回購,價(jià)格才得以穩(wěn)定。
“市場(chǎng)如此動(dòng)蕩,企業(yè)生產(chǎn)幾乎無法進(jìn)行,所以只能選擇停產(chǎn)、惜售,經(jīng)濟(jì)發(fā)展從何談起?”一位稀土永磁材料生產(chǎn)企業(yè)的負(fù)責(zé)人對(duì)《財(cái)經(jīng)國(guó)家周刊》記者表示。
“先要搞清小金屬價(jià)格暴漲暴跌的實(shí)質(zhì)。”全國(guó)礦業(yè)聯(lián)合會(huì)總工程師吳榮慶表示。
《財(cái)經(jīng)國(guó)家周刊》記者有幸獲得了一份由工信部委托調(diào)研的資料。資料顯示,目前國(guó)家對(duì)于北方輕稀土主產(chǎn)地包頭的年規(guī)劃產(chǎn)量只有4萬多噸,而實(shí)際調(diào)研產(chǎn)量卻達(dá)到了9萬多噸;南方重稀土失控更為嚴(yán)重,僅廣東河源等地,碳酸稀土規(guī)劃產(chǎn)量只有2000噸/年,而實(shí)際產(chǎn)量卻達(dá)到了3.5萬噸,超產(chǎn)近20倍。
“每一噸的超采都是非法生產(chǎn)。一個(gè)將價(jià)格建立在違法生產(chǎn)基礎(chǔ)上的產(chǎn)業(yè),勢(shì)必在政策的風(fēng)吹草動(dòng)前顯得驚恐不安。一旦政府按照規(guī)劃產(chǎn)量實(shí)施礦產(chǎn)封存儲(chǔ)備,那么,整個(gè)依托于非法生產(chǎn)支撐的小金屬市場(chǎng)必然坍塌。”吳榮慶說。
《財(cái)經(jīng)國(guó)家周刊》記者了解到,我國(guó)的非稀土類小金屬,如鎢、鉬、銻等,都存在著嚴(yán)重的非法生產(chǎn)、銷售問題。
以鎢為例,2009年鎢精礦的總量規(guī)劃指標(biāo)只有6.81萬噸,而實(shí)際產(chǎn)量卻達(dá)到9.91萬噸,超采45.5%;并且,各類加工企業(yè)利用國(guó)家出口政策漏洞大肆變相出口鎢資源。
金橘樹范文3
正如ESG的創(chuàng)始人兼首席分析師Steve Duplessie所言,數(shù)據(jù)增長(zhǎng)雖然是自然產(chǎn)生的,但是大部分?jǐn)?shù)據(jù)都是由于科學(xué)研究產(chǎn)生的。如數(shù)據(jù)擴(kuò)展、副本、副本的副本、備份副本的副本等等,就像細(xì)胞的裂變一樣,并且是無休止的。姑且不論數(shù)據(jù)的持續(xù)增長(zhǎng)帶來的是好事,還是壞事,但是很明確的一點(diǎn)就是,企業(yè)對(duì)于這些數(shù)據(jù)的依賴度越來越大,這些數(shù)據(jù)甚至可以影響到企業(yè)的生存。面對(duì)這樣龐大和重要的數(shù)據(jù),企業(yè)IT主管不得不開始考慮如何有效、經(jīng)濟(jì)地進(jìn)行數(shù)據(jù)存儲(chǔ)和保護(hù),來確保這些數(shù)據(jù)的完整性和安全性。ESG曾對(duì)企業(yè)面臨的數(shù)據(jù)保護(hù)難題進(jìn)行過調(diào)查訪問,雖然困擾終端用戶的數(shù)據(jù)保護(hù)難題不僅普遍還五花八門,但是位居首位的難題卻是如何減少備份次數(shù)、降低存儲(chǔ)系統(tǒng)成本、跟上被保護(hù)數(shù)據(jù)容量的步伐以及減少恢復(fù)次數(shù)。
根據(jù)企業(yè)規(guī)模和復(fù)雜程度,數(shù)據(jù)保護(hù)進(jìn)程可分很多種,主要包括從特定的手動(dòng)干預(yù)到高度復(fù)雜化的自動(dòng)連續(xù)進(jìn)程等。顯然,越來越多的企業(yè)將磁盤和磁帶存儲(chǔ)系統(tǒng)(本地和異地)視為數(shù)據(jù)保護(hù)架構(gòu)的一部分來部署,作為一種新的廣域/遠(yuǎn)程備份技術(shù)和第三方服務(wù)。在圖1中,ESG調(diào)查的企業(yè)被分類顯示,來反映當(dāng)前市場(chǎng)動(dòng)態(tài)的高級(jí)類別。
ESG調(diào)查的企業(yè)中,大多數(shù)(55%)表示,數(shù)據(jù)最初是備份到本地存儲(chǔ)站點(diǎn),然后通過移動(dòng)介質(zhì)發(fā)(如磁帶)送至遠(yuǎn)程存儲(chǔ)站點(diǎn)以便長(zhǎng)期保存。其中的一部分企業(yè)完全依賴本地存儲(chǔ),并且不將數(shù)據(jù)轉(zhuǎn)移至遠(yuǎn)程站點(diǎn)進(jìn)行長(zhǎng)期保存。與大型企業(yè)(15%)相比,更多中小企業(yè)(24%)采取這種危險(xiǎn)系數(shù)頗高的做法。從這點(diǎn)來看,大型企業(yè)(21%)比中小型企業(yè)(13%)更有可能將復(fù)制并人二級(jí)站點(diǎn)作為整個(gè)數(shù)據(jù)保護(hù)戰(zhàn)略的一部分,并且更有可能通過廣域網(wǎng)將數(shù)據(jù)直接備份至二級(jí)企業(yè)站點(diǎn)。最后,在ESG的抽樣調(diào)查中,僅有1%的大型企業(yè)目前還依賴第三方提供的備份服務(wù),并將其作為管理備份和恢復(fù)進(jìn)程的主要手段,而中小型企業(yè)當(dāng)中結(jié)果幾乎沒有采取這種策略的。
低成本的數(shù)據(jù)保護(hù)技術(shù)
正如我們所見,當(dāng)今的企業(yè)困擾的眾多的數(shù)據(jù)保護(hù)難題都導(dǎo)致企業(yè)數(shù)據(jù)有遭受潛在損失的風(fēng)險(xiǎn)。因此,這就促使企業(yè)開始尋求更多樣更先進(jìn)的技術(shù)來切實(shí)進(jìn)行數(shù)據(jù)保護(hù)。然而,在當(dāng)前的經(jīng)濟(jì)形勢(shì)下,出于整體運(yùn)營(yíng)以及宏觀經(jīng)濟(jì)的考慮,很多企業(yè)都開始緊縮IT預(yù)算。因此,企業(yè)更青睞那些能夠在企業(yè)的IT預(yù)算內(nèi)優(yōu)化企業(yè)現(xiàn)有存儲(chǔ)資源的數(shù)據(jù)保護(hù)技術(shù),這些技術(shù)能夠提高存儲(chǔ)效率,降低成本,將更少的數(shù)據(jù)備份至磁盤,恢復(fù)速度更快,并且對(duì)企業(yè)的業(yè)務(wù)拓展也能夠提供助力。這些技術(shù)包括:
容量削減技術(shù):如重復(fù)數(shù)據(jù)刪除的使用,通過削減備份至磁盤的數(shù)據(jù)量,用戶可以最大限度減少冗余數(shù)據(jù)的存儲(chǔ),提高備份速度并最大限度增加磁盤空間。除了減少存儲(chǔ)系統(tǒng)和介質(zhì)成本,容量削減還意味著減少數(shù)據(jù)通過WAN遷移和復(fù)制所需的帶寬,從而帶來額外的潛在成本節(jié)省。除了以上的成本削減以外,部署重復(fù)數(shù)據(jù)刪除技術(shù)也許還有一個(gè)更加重要的原因:通過降低本地和遠(yuǎn)程數(shù)據(jù)保護(hù)所需的存儲(chǔ)量和帶寬,企業(yè)可以顯著提升數(shù)據(jù)保護(hù)水平,并快速、可靠、經(jīng)濟(jì)高效地進(jìn)行數(shù)據(jù)恢復(fù)。
虛擬磁帶庫(VTL):據(jù)ESG最近的調(diào)查報(bào)告顯示,隨著企業(yè)對(duì)業(yè)務(wù)連續(xù)性、安全性的要求日趨嚴(yán)苛,越來越多的用戶采用磁盤或磁盤與磁帶混合的方式來滿足數(shù)據(jù)保護(hù)需求。而在基于磁盤的備份解決方案中,虛擬磁帶庫(VTL)備受用戶的推崇。VTL不僅能夠加快備份和恢復(fù)的速度,提高備份成功率并增加數(shù)據(jù)可用性,同時(shí)降低數(shù)據(jù)保護(hù)成本。可通過軟件或基于軟件的應(yīng)用,來部署VTL。
虛擬化:虛擬化不僅可簡(jiǎn)化存儲(chǔ)管理的復(fù)雜性,降低存儲(chǔ)管理和運(yùn)行成本,同時(shí)還提高存儲(chǔ)效率,降低存儲(chǔ)投資的費(fèi)用。顯然,在當(dāng)前的經(jīng)濟(jì)拮據(jù)時(shí)期,虛擬化更是引起人們的關(guān)注。如精簡(jiǎn)技術(shù),不僅能降低50%的數(shù)據(jù)總成本,還可以減少預(yù)期存儲(chǔ)成本,幫助企業(yè)削減電能和冷卻開支,并能提高其10倍的管理效率。2008年10月的ThelnfoPro Wave 11存儲(chǔ)調(diào)研報(bào)告顯示,87%的受訪企業(yè)已經(jīng)認(rèn)識(shí)到精簡(jiǎn)配置對(duì)于其自身數(shù)據(jù)中心計(jì)劃的重要性。
分支機(jī)構(gòu)的遠(yuǎn)程備份:所謂遠(yuǎn)程備份解決方案,也就是通過廣域網(wǎng)將數(shù)據(jù)備份至集中管理的數(shù)據(jù)中心,降低遠(yuǎn)程和分支機(jī)構(gòu)的本地存儲(chǔ)硬件、介質(zhì)以及人力資源的利用率,從而幫助企業(yè)降低成本。目前,已經(jīng)有24%的企業(yè)將遠(yuǎn)程數(shù)據(jù)保護(hù)解決方案列入了未來幾個(gè)月最先考慮的存儲(chǔ)措施,達(dá)到實(shí)現(xiàn)企業(yè)成本縮減的目的。而那些不采用分支機(jī)構(gòu)的遠(yuǎn)程備份企業(yè)僅僅占到12%,這也就不足為奇了。
磁盤到磁盤的備份:將數(shù)據(jù)遷移至磁盤到磁盤的備份架構(gòu)可以直接或間接降低成本,所謂的直接,就是減少或消除磁帶介質(zhì)以及媒介管理成本;而間接則是通過減少恢復(fù)時(shí)間、提高可用性以及避免數(shù)據(jù)丟失和/或應(yīng)用宕機(jī)造成的成本,從而降低成本。
低成本串行ATA磁盤的使用:與主要采用FC磁盤相比,將廉價(jià)的串行ATA磁盤作為備份介質(zhì)能夠節(jié)省大量金錢。有知名調(diào)研機(jī)構(gòu)聲稱,自從2001年上市以來,串行ATA磁盤的出貨量超過了65000萬。大多數(shù)存儲(chǔ)廠商已經(jīng)將SATA磁盤納入其陣列。
數(shù)據(jù)保護(hù)將推動(dòng)專業(yè)服務(wù)發(fā)展
現(xiàn)在,企業(yè)都非常明白對(duì)數(shù)據(jù)進(jìn)行保護(hù)的重要性。但是對(duì)于中小型企業(yè)而言,由于人力資源以及專業(yè)技能的缺乏,他們很難對(duì)數(shù)據(jù)實(shí)施全面的保護(hù),這個(gè)時(shí)候,他們就迫切需要尋求第三方企業(yè)來提供專業(yè)服務(wù)。ESG曾就面臨數(shù)據(jù)保護(hù)難題(備份和恢復(fù)是頭號(hào)存儲(chǔ)難題)拇企業(yè)與那些尋求相關(guān)專業(yè)服務(wù)的企業(yè)之間的相互關(guān)系進(jìn)行過調(diào)訪。如圖3所示,關(guān)注備份的受訪者中有31%表示,在未來12個(gè)月內(nèi)他們很有可能尋求第三方專業(yè)服務(wù)公司進(jìn)行備份和恢復(fù)的評(píng)估、設(shè)計(jì)或?qū)嵤⒉灰晜浞莺突謴?fù)為首要的存儲(chǔ)難題的受訪企業(yè)中只有19%有此計(jì)劃。這表明,中型企業(yè)將尋求第三方協(xié)助來設(shè)計(jì)和實(shí)施必要的新技術(shù)和進(jìn)程,從而提高備份和恢復(fù)成功率。將備份和恢復(fù)視為首要存儲(chǔ)挑戰(zhàn)的企業(yè)也更為傾向于尋求以災(zāi)難恢復(fù)為目的的評(píng)估、設(shè)計(jì)和實(shí)施服務(wù),這表明部分客戶期望更全面地了解其企業(yè)的數(shù)據(jù)保護(hù)環(huán)境。
管理大師Peter Drucker曾說過:“預(yù)測(cè)未來就好比是夜間在沒有路燈的鄉(xiāng)間小道中行駛,并不時(shí)地透過后背窗看外面的風(fēng)景。”
金橘樹范文4
電信業(yè)的競(jìng)爭(zhēng)正在全方位地展開,這種競(jìng)爭(zhēng)必然帶來新的價(jià)值鏈模式以及新的計(jì)費(fèi)方式,這些變化對(duì)目前的電信運(yùn)營(yíng)支撐系統(tǒng)是一個(gè)挑戰(zhàn)。比如,多種業(yè)務(wù)的計(jì)費(fèi)環(huán)節(jié)將不再是單一的按照時(shí)長(zhǎng)或通信距離收取費(fèi)用,而可能是根據(jù)時(shí)長(zhǎng)、內(nèi)容、使用量等多種參數(shù)的組合計(jì)費(fèi)。為了應(yīng)對(duì)這些挑戰(zhàn),電信企業(yè)先后引入了內(nèi)存數(shù)據(jù)庫,以提高后臺(tái)數(shù)據(jù)管理的實(shí)時(shí)性、精確性和靈活性。
內(nèi)存數(shù)據(jù)庫
內(nèi)存數(shù)據(jù)庫,顧名思義就是將數(shù)據(jù)放在內(nèi)存中直接操作的數(shù)據(jù)庫。相對(duì)于磁盤,內(nèi)存的數(shù)據(jù)讀寫速度要高出幾個(gè)數(shù)量級(jí),將數(shù)據(jù)保存在內(nèi)存中相比從磁盤上訪問能夠極大地提高應(yīng)用的性能。同時(shí),內(nèi)存數(shù)據(jù)庫拋棄了磁盤數(shù)據(jù)管理的傳統(tǒng)方式,基于全部數(shù)據(jù)都在內(nèi)存中重新設(shè)計(jì)了體系結(jié)構(gòu),并且在數(shù)據(jù)緩存、快速算法、并行操作方面也進(jìn)行了相應(yīng)的改進(jìn),所以數(shù)據(jù)處理速度比傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)處理速度要快很多,一般都在10倍以上。內(nèi)存數(shù)據(jù)庫的最大特點(diǎn)是其“主拷貝”或“工作版本”常駐內(nèi)存,即活動(dòng)事務(wù)只與實(shí)時(shí)內(nèi)存數(shù)據(jù)庫的內(nèi)存拷貝打交道。顯然,它要求較大的內(nèi)存量,但并非任何時(shí)刻整個(gè)數(shù)據(jù)庫都存放在內(nèi)存,即內(nèi)存數(shù)據(jù)庫系統(tǒng)還是要處理I/O。
盡管內(nèi)存數(shù)據(jù)庫已不是傳統(tǒng)磁盤數(shù)據(jù)庫的概念,但是內(nèi)存數(shù)據(jù)庫本質(zhì)上還是數(shù)據(jù)庫,它也具有一般數(shù)據(jù)庫的基本功能:
■ 永久數(shù)據(jù)的管理,包括數(shù)據(jù)庫的定義、存儲(chǔ)、維護(hù)等;
■ 完成各種數(shù)據(jù)操作,如查詢處理、存取、完整性檢查;
■ 事務(wù)管理,包括調(diào)度與并發(fā)控制等;
■ 對(duì)存取的控制和安全性檢驗(yàn);
■ 具有數(shù)據(jù)庫的可靠性恢復(fù)機(jī)制。
相對(duì)于利用程序開發(fā)手段調(diào)用內(nèi)存處理來說,內(nèi)存數(shù)據(jù)庫自有其優(yōu)勢(shì)。首先,內(nèi)存數(shù)據(jù)庫是產(chǎn)品化的數(shù)據(jù)庫管理軟件,極大縮短了開發(fā)周期; 其次,內(nèi)存數(shù)據(jù)庫有著開放的平臺(tái)和接口,程序開發(fā)和移植更加靈活便捷,也便于維護(hù)和二次開發(fā); 第三,可以通過使用統(tǒng)一的SQL語言方便地查詢內(nèi)存中的數(shù)據(jù); 最后,能在數(shù)據(jù)庫中保障數(shù)據(jù)的安全性和完整性。這些優(yōu)勢(shì),對(duì)于快速部署和簡(jiǎn)化維護(hù)都是有利的。
但內(nèi)存數(shù)據(jù)庫也有其不可避免的缺點(diǎn),比如: 不容易恢復(fù),內(nèi)存數(shù)據(jù)庫中的數(shù)據(jù)不總是永久的,為了保證實(shí)時(shí),也不一定是一致和絕對(duì)正確的,有的是短暫的,有的是暫時(shí)不一致或非絕對(duì)正確的。
電信企業(yè)一直是內(nèi)存數(shù)據(jù)庫的主要用戶,近幾年來,隨著計(jì)算機(jī)硬件技術(shù)的飛速發(fā)展、內(nèi)存容量的提高、價(jià)格下跌以及計(jì)算機(jī)進(jìn)入64位時(shí)代操作系統(tǒng)后可以支持更大的地址,為內(nèi)存數(shù)據(jù)庫的實(shí)現(xiàn)提供了可能。目前內(nèi)存數(shù)據(jù)庫在電信行業(yè)的應(yīng)用也日趨成熟,已有超過90G的電信系統(tǒng)案例,能自動(dòng)擴(kuò)展內(nèi)存空間,不需要重啟數(shù)據(jù)庫,提供ESOL自定義存儲(chǔ)過程,支持多線程,開發(fā)效率高,程序移植容易等等。下面以兩個(gè)例子來介紹內(nèi)存數(shù)據(jù)庫的應(yīng)用。
電信計(jì)費(fèi)數(shù)據(jù)的加載
電信的二次批價(jià)和實(shí)時(shí)累賬是計(jì)費(fèi)系統(tǒng)中的兩個(gè)必備功能。所謂二次批價(jià)是相對(duì)于一次批價(jià)來說的。一次批價(jià)是按照國(guó)家標(biāo)準(zhǔn)資費(fèi)來進(jìn)行價(jià)格計(jì)算,比如: 全球通每分鐘本地通話為0.4元,在一次批價(jià)完成后,會(huì)根據(jù)這個(gè)用戶的套餐進(jìn)行再一次的計(jì)算。以北京全球通用戶接聽4分鐘的電話為例,一次批價(jià)完成后,這條話單的價(jià)格是1.6元,如果這個(gè)用戶參加了10元包月接聽套餐,那么在二次批價(jià)后,這次通話的費(fèi)用就為0元。一次批價(jià)是用于各大運(yùn)營(yíng)商之間結(jié)算的,而二次批價(jià)是針對(duì)用戶個(gè)人的。
實(shí)時(shí)累賬是將用戶從每月1號(hào)到目前為止的所有費(fèi)用累加起來,也就是用戶目前可以通過10086查到截止到前一天的實(shí)時(shí)話費(fèi)。累賬值可以幫助用戶控制高額話費(fèi)或是供用戶即時(shí)查詢消費(fèi)信息。
二次批價(jià)和實(shí)時(shí)累賬過程涉及用戶資料、用戶套餐等與用戶相關(guān)的信息,電信支撐系統(tǒng)在開始批價(jià)時(shí)必須加載這些數(shù)據(jù)。稍大一點(diǎn)的省級(jí)運(yùn)營(yíng)商的這些數(shù)據(jù)就會(huì)超過1000萬條,計(jì)費(fèi)處理模型也由于套餐的組合、產(chǎn)品的組合以及不同的優(yōu)惠規(guī)則變得相當(dāng)復(fù)雜,加載這部分?jǐn)?shù)據(jù)對(duì)系統(tǒng)而言是一筆不小的開銷,這就使得現(xiàn)在的計(jì)費(fèi)處理速度比較慢,而且很難做到對(duì)數(shù)據(jù)的實(shí)時(shí)更新。內(nèi)存數(shù)據(jù)庫的引入在一定程度上解決了這個(gè)問題。
在計(jì)費(fèi)二次批價(jià)過程中數(shù)據(jù)量最大的是詳單數(shù)據(jù),這部分?jǐn)?shù)據(jù)不用放在內(nèi)存數(shù)據(jù)庫中,每處理完一個(gè)話單文件或達(dá)到設(shè)定的提交記錄數(shù)時(shí)直接操作磁盤數(shù)據(jù)庫,不會(huì)影響系統(tǒng)性能。最急切的是將用戶資料、套餐、營(yíng)業(yè)套餐和計(jì)費(fèi)套餐對(duì)應(yīng)關(guān)系數(shù)據(jù)、計(jì)費(fèi)套餐模型數(shù)據(jù)及用戶累計(jì)數(shù)據(jù)放到內(nèi)存數(shù)據(jù)庫中,這部分?jǐn)?shù)據(jù)查詢操作遠(yuǎn)比數(shù)據(jù)新增和更新操作要頻繁。除了這些數(shù)據(jù)外,當(dāng)然還有應(yīng)用需要的其他數(shù)據(jù)也都可以加載到內(nèi)存數(shù)據(jù)庫。
在采用內(nèi)存數(shù)據(jù)庫后,用戶通過營(yíng)業(yè)部或客戶查詢實(shí)時(shí)話費(fèi)的時(shí)候完全可以做到實(shí)時(shí),比目前只能提供查詢到前一天的實(shí)時(shí)話費(fèi)在業(yè)務(wù)上有了質(zhì)的飛躍。因?yàn)橄到y(tǒng)在處理這部分?jǐn)?shù)據(jù)時(shí)查詢流程和以前的完全一樣,但系統(tǒng)省去了以往內(nèi)存中的數(shù)據(jù)和磁盤數(shù)據(jù)庫數(shù)據(jù)同步的環(huán)節(jié),所以就能做到了實(shí)時(shí)查詢。對(duì)于信控來說也同樣,以往系統(tǒng)在累完賬后要按照一定周期刷新信控?cái)?shù)據(jù),這就存在一個(gè)時(shí)間差,不能夠完全做到實(shí)時(shí)。
而采用內(nèi)存數(shù)據(jù)庫后,信控可以直接取得內(nèi)存數(shù)據(jù)庫中的實(shí)時(shí)話費(fèi)累計(jì)表中的數(shù)據(jù),完全實(shí)現(xiàn)實(shí)時(shí)預(yù)警、停機(jī)。二次批價(jià)和累賬中采用內(nèi)存數(shù)據(jù)庫后,對(duì)防欺詐、收入保障系統(tǒng)也有相當(dāng)大的好處,這樣能夠充分保證運(yùn)營(yíng)商的切身利益。
另外,在采用內(nèi)存數(shù)據(jù)庫后,整體提高了系統(tǒng)批價(jià)、累賬的處理速度,大大緩解訪問磁盤數(shù)據(jù)庫的壓力,提高數(shù)據(jù)查詢、修改、刪除的效率,也為后付費(fèi)和預(yù)付費(fèi)的融合提供了可能。
電信計(jì)費(fèi)數(shù)據(jù)的同步
電信營(yíng)業(yè)數(shù)據(jù)和計(jì)費(fèi)系統(tǒng)中的數(shù)據(jù)總是在不斷的變化中,這就涉及內(nèi)存數(shù)據(jù)庫中的數(shù)據(jù)和磁盤數(shù)據(jù)庫數(shù)據(jù)的同步問題(為了描述清楚,這里的磁盤數(shù)據(jù)庫以O(shè)racle DB為例來說明)。數(shù)據(jù)同步包括兩部分: 從內(nèi)存數(shù)據(jù)庫到Oracle DB數(shù)據(jù)同步和從Oracle DB到內(nèi)存數(shù)據(jù)庫的同步。
1. Oracle DB到內(nèi)存數(shù)據(jù)庫同步
這部分?jǐn)?shù)據(jù)同步采用增量表的方式,營(yíng)業(yè)系統(tǒng)或CRM新增或更新的數(shù)據(jù)將生成到Oracle的增量表中,計(jì)費(fèi)后臺(tái)程序先到這些增量表中查詢數(shù)據(jù)。如果能在這些增量表中查到數(shù)據(jù)就把這些數(shù)據(jù)更新到內(nèi)存數(shù)據(jù)庫對(duì)應(yīng)表中,如果查不到,就直接從內(nèi)存數(shù)據(jù)庫中直接查詢,從而保證了數(shù)據(jù)的完整性和實(shí)時(shí)性。由于增量表的數(shù)據(jù)量一般會(huì)很小,所以這部分操作不會(huì)影響系統(tǒng)的性能。
2. 內(nèi)存數(shù)據(jù)庫到Oracle DB同步
由于Oracle的計(jì)費(fèi)后臺(tái)批價(jià)、累賬數(shù)據(jù)幾乎都加載到了內(nèi)存數(shù)據(jù)庫中,所以O(shè)racle數(shù)據(jù)庫對(duì)應(yīng)的數(shù)據(jù)表將主要用于對(duì)內(nèi)存數(shù)據(jù)庫的數(shù)據(jù)備份。
金橘樹范文5
關(guān)鍵詞:聚類分析;初始中心點(diǎn);K-原型算法;聚類算法;混合屬性數(shù)據(jù)
中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2010)11-2713-04
A K-prototypes Algorithm Based on Improved Initial Center Points
CHEN Dan, WANG Zhen-hua
(Faculty of Computer, Guangdong University of Technology, Guangzhou 510006, China)
Abstract: The K-prototypes is the main clustering algorithm that capable of handling mixed numeric and categorical data. However, K-prototypes sensitive to its initial center points, is parameter-dependent and susceptible to noise interference. In order to overcome them, a method is proposed to build initial center points heuristically through the neighbors of objects, and then calculate according the K-prototypes algorithm's procedures. At last, use a rule to optimize the clustering results which able to identify the abnormal points. The proposed algorithm successfully resolved the defects of the traditional algorithm, improves the accuracy of clustering results and stability of the algorithm. Experiments show the proposed algorithm leads to better accurate and scalable, superior to the traditional K-prototypes.
Key words: Clustering analysis; Initial center points; K-prototypes; Clustering algorithm; mixed numeric and categorical data
聚類是數(shù)據(jù)挖掘中的一種數(shù)據(jù)分析技術(shù),具有重要意義和很強(qiáng)的挑戰(zhàn)性。其基本原理是將數(shù)據(jù)劃分成有意義的簇,相同簇的對(duì)象之間具有較高的相似性,而不同簇的對(duì)象之間則相似程度較低。這種數(shù)據(jù)分析技術(shù)廣泛應(yīng)用于模式識(shí)別、數(shù)據(jù)分析、圖像處理和商業(yè)研究等方面。目前已劃分出多種聚類算法,常見的聚類算法有基于劃分的K-均值,基于密度的DBSCAN算法,基于層次的BRICH算法等。基于劃分的聚類算法K-means簡(jiǎn)單快速,對(duì)處理大數(shù)據(jù)集,但它是基于歐氏距離的劃分,難以滿足混合屬性集聚類的要求。文獻(xiàn)[1-2]對(duì)K-means算法進(jìn)行擴(kuò)展,先后出現(xiàn)了K-modes算法和K-prototypes算法。K-prototypes算法能夠有效地處理混合屬性數(shù)據(jù)集聚類的問題,但它的缺點(diǎn)也很明顯:1) 對(duì)于不同的初始值,可能會(huì)導(dǎo)致不同的聚類結(jié)果;2) 需要用戶給定初始參數(shù),這些參數(shù)的選擇需要用戶具備大量的先驗(yàn)知識(shí)才能確定,而用戶通常對(duì)數(shù)據(jù)集缺乏先驗(yàn)知識(shí)導(dǎo)致所選參數(shù)對(duì)聚類結(jié)果產(chǎn)生很大的影響;3) 算法非常容易受“噪聲”干擾,導(dǎo)致聚類精度下降。
近鄰法是由Cover和Hart于1968年提出的,是非參數(shù)法中最重要的方法之一。它的原理是以全部訓(xùn)練樣本作為代表點(diǎn),計(jì)算測(cè)試樣本與所有樣本的距離,并以最近鄰樣本的類別作為決策,具有原理直觀,方法簡(jiǎn)單等優(yōu)點(diǎn)。因此,本文提出了一種基于近鄰法的初始中心點(diǎn)選擇策略對(duì)算法進(jìn)行改進(jìn),利用近鄰法,啟發(fā)式地獲得初始中心點(diǎn)和k值。最后用一個(gè)基于最小距離的規(guī)則來識(shí)別異常數(shù)據(jù)點(diǎn),防止“噪聲”的干擾。
改進(jìn)后的算法能有效地解決傳統(tǒng)K-prototypes算法的缺點(diǎn),基本特征有三點(diǎn):1) 在選擇初始中心點(diǎn)的時(shí)候,采用近鄰法,有依據(jù)的選擇初始中心,避免了傳統(tǒng)K-prototypes算法對(duì)初值選擇的盲目性;2)它可以自動(dòng)的獲取k個(gè)聚類,解決了K-prototypes算法k值必須預(yù)先給定的問題;3)為了避免算法中的“噪聲”干擾,采用了一個(gè)基于最大距離的啟發(fā)式規(guī)則,將離聚類中心最遠(yuǎn)的數(shù)據(jù)點(diǎn)識(shí)別為“異常數(shù)據(jù)點(diǎn)”;經(jīng)過實(shí)驗(yàn)證明,其聚類后的精度和穩(wěn)定性要優(yōu)于原算法。
1 K-prototypes算法
K-prototypes算法是由Huang提出的可以對(duì)分類屬性和數(shù)值屬性相混合的數(shù)據(jù)進(jìn)行聚類的一種有效算法[2]。其基本思想和K-均值算法類似,只是在K-prototypes算法中定義了一個(gè)對(duì)數(shù)值與分類兩種屬性都計(jì)算的相似性度量,以此作為聚類的目標(biāo)函數(shù),通過不斷更新聚類原型來達(dá)到優(yōu)化目標(biāo)函數(shù),獲得最優(yōu)聚類效果的目的。
算法描述如下:假定待聚類對(duì)象集合為X={X1,X2, …,Xn},由n個(gè)觀測(cè)對(duì)象組成,屬于混合型數(shù)據(jù)集,且每個(gè)觀測(cè)對(duì)象Xi={Xi1,Xi2, …,Xin}有 個(gè)屬性,由A1A2, …Am來表示,其中A1A2, …Ap為數(shù)字屬性,Ap+1A p+2,…Am為可分類屬性,屬性Aj取值域用Dom(Aj)表示,且xij∈Dom(Aj)。對(duì)于可分類屬性有Dom(Aj)={aj(1),aj(2), …,aj(nj)},其中nj指屬性Aj取值的數(shù)目。聚類中心用Z表示,相應(yīng)的,簡(jiǎn)單記作Za=(za1,za2, …,zam)。
K-prototypes算法的距離函數(shù)d由數(shù)值型和可分類型兩部分組成[3-4]:
d(Xi,Za)=dr(Xi,Za)+rdc(Xi,Za)(1)
其中:γ∈[0,1],為分類屬性的權(quán)重參數(shù);
dr(Xi,Za)=(xij-zaj)2,由歐式距離度量;
rdc(Xi,Za)= γδ(xij,zaj),
當(dāng)xij≠zaj時(shí),δ(xij,zaj)=1;
當(dāng)xij=zaj時(shí),δ(xij,zaj)=0.
K-prototypes算法最小化目標(biāo)函數(shù)[4]:
F(W,Z)=wiad(Xi,Za)(2)
滿足:
wia∈[0,1];1≤i≤n;1≤a≤k
wia=1;1≤i≤n
0≤waai≤n;1≤a≤k
綜上所述,K-prototypes聚類算法具體步驟如下:
1) 初始化初始聚類數(shù)k和聚類中心Z,即從數(shù)據(jù)集中隨機(jī)選取k個(gè)初始聚類原型;
2) 按照2)式定義的目標(biāo)函數(shù)最小化原則,將數(shù)據(jù)集中的各個(gè)對(duì)象劃分到離它最近的聚類原型所代表的類中;
3) 對(duì)于每個(gè)聚類, 重新計(jì)算新的聚類原型;
4) 計(jì)算每個(gè)數(shù)據(jù)對(duì)象對(duì)于新的數(shù)據(jù)原型的差異度,如果離一個(gè)數(shù)據(jù)對(duì)象最近的聚類原型不是當(dāng)前數(shù)據(jù)對(duì)象所屬聚類原型,則重新分配這兩個(gè)聚類的對(duì)象;
5) 重復(fù)Step 3和Step 4,直到各個(gè)聚類中不再有數(shù)據(jù)對(duì)象發(fā)生變化。
2對(duì)K-prototypes算法的改進(jìn)
針對(duì)上面列出的K-prototypes的不足,該文提出一種基于近鄰的初始點(diǎn)選擇算法,該算法思想來源于近鄰方法[6],可確定初始的中心點(diǎn)集和 值。并在原型算法中加入適當(dāng)?shù)膯l(fā)式規(guī)則,使算法能夠有效地辨識(shí)異常數(shù)據(jù)點(diǎn),綜合這三點(diǎn)改進(jìn),算法獲得更好的穩(wěn)定和聚類結(jié)果。算法流程圖如圖1。
2.1 基于近鄰方法的初始中心點(diǎn)選擇策略
基于近鄰方法的初始聚類中心選擇策略基本思想為:以全部樣本數(shù)據(jù)作為代表點(diǎn),計(jì)算測(cè)試數(shù)據(jù)點(diǎn)與所有樣本之間的距離,如果小于初始閾值,就把該點(diǎn)劃分為與測(cè)試數(shù)據(jù)點(diǎn)相同的類,記數(shù)變量增1,同時(shí)更新最短距離。最后選擇鄰居數(shù)目最多的數(shù)據(jù)對(duì)象作為初始中心點(diǎn)。
樣本點(diǎn) 的鄰居定義為P=Neigbour(x, θ):
{
判斷P是否為x的鄰居;
IfDist(P,x)≤θ返回1;
Else 返回0;
}
其中 為兩個(gè)數(shù)據(jù)對(duì)象的相似度量函數(shù)。
算法描述如下:
1) 定義一個(gè)初始閥值θ和中心點(diǎn)集Z,Z初始值為空;
2) 從數(shù)據(jù)集中隨機(jī)選一個(gè)點(diǎn)Q作為起始點(diǎn);從Q開始遞歸地按照深度優(yōu)先方式遍歷各點(diǎn),P=Neigbour(Q, θ) ;如果返回值為1,則判斷P屬于以Q為中心的聚類,更新閥值θ,并使初始值為0的局部變量m=m+1(用于記錄Q的鄰居數(shù)目);否則退回到前一點(diǎn)繼續(xù)搜索。遍歷數(shù)據(jù)集中的每一個(gè)數(shù)據(jù)點(diǎn);
3) 選擇鄰居數(shù)目最多的數(shù)據(jù)對(duì)象作為第一個(gè)初始中心點(diǎn),加入到Z中,初始值為0的全局變量k=k+1;
4) 將原數(shù)據(jù)集刪除中心點(diǎn)及其鄰居,如果還有未被聚簇的點(diǎn),即在這些數(shù)據(jù)點(diǎn)集中重復(fù)執(zhí)行(2)-(4);
5) 輸出初始聚類中心Z和k。
2.2 對(duì)異常數(shù)據(jù)點(diǎn)的識(shí)別
聚類算法是將數(shù)據(jù)集中相似的數(shù)據(jù)歸為一類,因此理論上,一個(gè)簇中的所有數(shù)據(jù)點(diǎn)都應(yīng)該離簇中心點(diǎn)比較近。然而可能存在一些異常點(diǎn),它們不屬于任何聚簇。為了有效識(shí)別這些異常點(diǎn),在K-prototypes中加入以下啟發(fā)式規(guī)則,在算法進(jìn)行全局搜索的時(shí)候,引導(dǎo)算法避免異常數(shù)據(jù)點(diǎn)的干擾。
加入的算法啟發(fā)式規(guī)則描述如下:
Min{d(Xi,Za)} ≤ε; 1≤i≤n; 1≤a≤k(3)
其中ε為距離閥值。
算法在最后利用這個(gè)啟發(fā)式規(guī)則來檢驗(yàn)聚類結(jié)果是否滿足這個(gè)條件,不滿足則標(biāo)記為異常點(diǎn);如果所有的異常點(diǎn)數(shù)目小于閥值ψ,則算法結(jié)束;否則,則將所有的異常點(diǎn)歸為一類,令k=k+1; 重新迭代,直到所有的異常點(diǎn)數(shù)目小于ψ。
2.3 改進(jìn)后K-prototypes算法步驟
綜上所述,改進(jìn)后的算法描述如下:
輸入:待處理數(shù)據(jù)集S,參數(shù) θ,ε,ψ,γ
輸出:k個(gè)聚簇
步驟:
Step 1:使用數(shù)據(jù)預(yù)處理技術(shù)處理不完整、有噪聲的數(shù)據(jù)集,為后續(xù)聚類做準(zhǔn)備。
Step 2:使用基于近鄰的初始中心點(diǎn)選擇方法獲得初始中心點(diǎn)集Za=(za1,za2,…,zam)和聚類數(shù)k;
Step 3: 按照(2)式的目標(biāo)函數(shù)最小化原則,將數(shù)據(jù)集中的各個(gè)對(duì)象劃分到離它最近的聚類原型所代表的類中;
Step 4:對(duì)于每個(gè)聚類,重新計(jì)算新的聚類原型Za’;計(jì)算每個(gè)數(shù)據(jù)對(duì)象 對(duì)于新的數(shù)據(jù)原型Za’的差異度d(x,Za’),如果離一個(gè)數(shù)據(jù)對(duì)象最近的聚類原型不是當(dāng)前數(shù)據(jù)對(duì)象所屬聚類原型,則重新分配這兩個(gè)聚類的對(duì)象;
Step 5:重復(fù)Step 3和step 4,如果各個(gè)聚類無數(shù)據(jù)對(duì)象發(fā)生變化,轉(zhuǎn)至Step6;
Step 6:利用啟發(fā)式規(guī)則(3)來檢驗(yàn)聚類結(jié)果,標(biāo)記異常數(shù)據(jù)點(diǎn),如果異常數(shù)據(jù)點(diǎn)數(shù)小于ψ,算法結(jié)束;否則將這些異常數(shù)據(jù)點(diǎn)歸為一類,并使k=k+1,轉(zhuǎn)至Step3,反復(fù)迭代,直至使異常數(shù)據(jù)點(diǎn)控制在較小范圍內(nèi),算法結(jié)束。
3 實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證所改進(jìn)后的K-prototypes算法的有效性和可行性, 實(shí)驗(yàn)過程分別采用隨機(jī)選擇初始點(diǎn)的K-prototypes算法和改進(jìn)后的K-prototypes算法對(duì)給定數(shù)據(jù)集進(jìn)行測(cè)試,并比較分析聚類結(jié)果。
系統(tǒng)配置為:Intel 酷睿2 雙核 CPU,1G內(nèi)存,Windows XP,應(yīng)用Matlab6.5平臺(tái)進(jìn)行實(shí)驗(yàn)仿真。
3.1 實(shí)驗(yàn)1:人造數(shù)據(jù)實(shí)驗(yàn)
為了顯示的直觀性,我們構(gòu)造的數(shù)據(jù)樣本共有300個(gè)樣本,可以劃分為3類,分別為A類、B類和C類。每個(gè)樣本具有2個(gè)特征:一個(gè)數(shù)值型和一個(gè)分類型。使用隨機(jī)選取十組初始聚類中心所得到的最壞與最好結(jié)果與優(yōu)化選取初始聚類中心的算法所得到的結(jié)果進(jìn)行比較。如圖2所示。
實(shí)驗(yàn)1參數(shù)設(shè)置:θ=0.20,ε=4.5,ψ=50;γ取0.5。
從圖4可以直觀地看出,傳統(tǒng)K-prototypes算法對(duì)于不同的初始聚類中心會(huì)得到差別很大的聚類結(jié)果;這說明初始聚類中心的選擇對(duì)算法的分類性能有很大的影響;圖5是采用改進(jìn)后的K-prototypes算法,相比之下,改進(jìn)后的K-prototypes算法具有更好的分類效果。
3.2 實(shí)驗(yàn)2:標(biāo)準(zhǔn)數(shù)據(jù)庫數(shù)據(jù)實(shí)驗(yàn)
實(shí)驗(yàn)2采用UCI機(jī)器學(xué)習(xí)庫[7]中的真實(shí)數(shù)據(jù)集Voting和Cleve作為聚類對(duì)象,其中Voting為分類型數(shù)據(jù)集,而Cleve為混合類型的數(shù)據(jù)集,分別用原始K-prototypes算法和改進(jìn)后的K-prototypes算法對(duì)其進(jìn)行聚類分析,數(shù)據(jù)集描述如表1所示。
上述數(shù)據(jù)集Voting、Cleve都包含多個(gè)屬性,不能直觀地顯示其聚類結(jié)果,故從正確識(shí)別率和穩(wěn)定性兩個(gè)方面進(jìn)行分析。
3.2.1 評(píng)價(jià)標(biāo)準(zhǔn)
為了將原始數(shù)據(jù)的分類特征與算法得到的聚類結(jié)果作比較,本文采用聚類結(jié)果正確率作為聚類實(shí)驗(yàn)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)。
評(píng)價(jià)聚類效果的指標(biāo)如下:
E=(n/N) ×100%
其中:n為正確分類的對(duì)象數(shù),N為總對(duì)象數(shù)。E∈[0,1],為正確識(shí)別率,其值越大,表明聚類結(jié)果越精確;反之,聚類結(jié)果誤差越大。
4.2.2 聚類性能分析
實(shí)驗(yàn)過程中,兩個(gè)算法的參數(shù)設(shè)置分別如下:在改進(jìn)后的K-prototypes算法中,對(duì)于Voting,Cleve兩個(gè)數(shù)據(jù)集,分別設(shè)置閾值θ=0.15,ε=4.5,ψ=70;θ=0.20,ε=4.8,ψ=50,…,每組閾值分別運(yùn)行5次;γ分別取1,0.7。
將傳統(tǒng)算法運(yùn)行10次,通過打亂數(shù)據(jù)集的各個(gè)數(shù)據(jù)位置,反復(fù)仿真得出以下聚類結(jié)果。
表2是對(duì)兩組實(shí)驗(yàn)數(shù)據(jù)的聚類精度值的對(duì)表,從表2可以直觀地看出:采用改進(jìn)后K-prototypes算法進(jìn)行聚類,得到的聚類精度都在90%以上,比原始K-prototypes算法聚類精度高很多。而采用原始K-prototypes算法聚類得到的結(jié)果有時(shí)高,有時(shí)低,波動(dòng)比較大,說明原始K-prototypes算法對(duì)初始值很敏感,對(duì)于不同輸入順序的初始值而得到不同的聚類精度;相比,采用改進(jìn)后的K-prototypes算法,每組實(shí)驗(yàn)的聚類結(jié)果波動(dòng)很小,聚類精度高。由此可證明,改進(jìn)后的K-prototypes算法成功地解決了原始算法對(duì)初始值非常敏感,參數(shù)必須預(yù)先設(shè)定和對(duì)易受“噪聲” 影響等缺點(diǎn)。因此,實(shí)驗(yàn)結(jié)果表明:本文提出的基于近鄰法的K-prototypes算法在分類精度和穩(wěn)定性兩個(gè)方面都是十分有效的。
4 結(jié)論
該文提出了一種改進(jìn)的K-prototypes混合屬性數(shù)據(jù)聚類算法,通過近鄰法獲取初始中心點(diǎn)集和初始聚類數(shù)目,避免了初始中心點(diǎn)選擇的盲目性和對(duì)聚類數(shù)目k值的依賴性;同時(shí)加入啟發(fā)式規(guī)則,防止了“噪聲點(diǎn)”的干擾。通過實(shí)驗(yàn)可以看出該算法成功解決了原K-prototypes算法對(duì)初始敏感的缺點(diǎn),并且自動(dòng)獲取初始中心點(diǎn)集和初始聚類。通過對(duì)聚類結(jié)果的精度分析和穩(wěn)定性分析,可看出改進(jìn)后的算法優(yōu)于傳統(tǒng)的K-prototypes聚類算法。
參考文獻(xiàn):
[1] Ralambondrainy H. A Conceptual Version of the k-means Algorithm[J].Pattern recognition Letters,1995(16):1147-1157.
[2] Huang Zhexue. Extension to the k-means algorithm for clustering large data sets with categorical values[J]. Data Mining and Knowledge Discovery,1998(2):283-304.
[3] 陳寧, 陳安等. 數(shù)值型和分類型混合數(shù)據(jù)的模糊K-prototypes聚類算法[J].軟件學(xué)報(bào),2001,12(8):1107-1119.
[4] 尹波,何松華.基于PSO的模糊K-prototypes聚類[J].計(jì)算機(jī)工程與設(shè)計(jì),2008(11):2283-2285.
[5] 吳孟書,吳喜之.一種改進(jìn)的K-prototypes聚類算法[J].統(tǒng)計(jì)與決策,2008(5).
金橘樹范文6
集群(Cluster)技術(shù)是使用特定的連接方式,將價(jià)格相對(duì)較低的硬件設(shè)備結(jié)合起來,同時(shí)也能提供高性能相當(dāng)?shù)娜蝿?wù)處理能力。
本文試圖對(duì)當(dāng)前主要的數(shù)據(jù)庫集群用到的具體技術(shù)和市場(chǎng)上的主流產(chǎn)品進(jìn)行分析并作點(diǎn)評(píng),從而為讀者提供一個(gè)數(shù)據(jù)庫集群的評(píng)價(jià)參考。
下面討論的數(shù)據(jù)庫集群技術(shù)分屬兩類體系:基于數(shù)據(jù)庫引擎的集群技術(shù)和基于數(shù)據(jù)庫網(wǎng)關(guān)(中間件)的集群技術(shù)。
1關(guān)鍵技術(shù)
在復(fù)雜的數(shù)據(jù)庫集群技術(shù)之間做比較,其實(shí)就是比較它所包含的各項(xiàng)子技術(shù)性能和它們之間的協(xié)調(diào)運(yùn)作能力,下面的文字將介紹數(shù)據(jù)庫集群最需要得到重視的核心技術(shù),同時(shí)也關(guān)注到了一些技術(shù)細(xì)節(jié)。
提高處理速度的四種辦法
提高磁盤速度:主要思想是提高磁盤的并發(fā)度。盡管實(shí)現(xiàn)方法各不相同,但是它們最后的目的都是提供一個(gè)邏輯數(shù)據(jù)庫的存儲(chǔ)映象。
【點(diǎn)評(píng)】系統(tǒng)為了提高磁盤訪問速度,建立一個(gè)虛擬的涵蓋所有數(shù)據(jù)“大”數(shù)據(jù)庫,而不用去考慮數(shù)據(jù)的實(shí)際物理磁盤存放位置。
分散數(shù)據(jù)的存放:利用多個(gè)物理服務(wù)器來存放數(shù)據(jù)集的不同部分,使得不同的服務(wù)器進(jìn)行并行計(jì)算成為可能。
ORACLE RAC是共享磁盤的體系結(jié)構(gòu),用戶只需簡(jiǎn)單地增加一個(gè)服務(wù)器節(jié)點(diǎn),RAC就能自動(dòng)地將這節(jié)點(diǎn)加入到它的集群服務(wù)中去,RAC會(huì)自動(dòng)地將數(shù)據(jù)分配到這節(jié)點(diǎn)上,并且會(huì)將接下來的數(shù)據(jù)庫訪問自動(dòng)分布到合適的物理服務(wù)器上,而不用修改應(yīng)用程序;UDB是非共享磁盤的體系結(jié)構(gòu),需要手工修改數(shù)據(jù)分區(qū),MSCS和ASE也是同樣情況。ICX是一種基于中間件的數(shù)據(jù)庫集群技術(shù),對(duì)客戶端和數(shù)據(jù)庫服務(wù)器都是透明的。可以用來集群幾個(gè)數(shù)據(jù)庫集群。
【點(diǎn)評(píng)】系統(tǒng)通過化整為零的策略,將數(shù)據(jù)表格分散到多個(gè)服務(wù)器或者每個(gè)服務(wù)器分管幾個(gè)內(nèi)容不同的表格,這樣做的目的在于通過多服務(wù)器間并行運(yùn)算以提高訪問速度。
對(duì)稱多處理器系統(tǒng):
利用多處理機(jī)硬件技術(shù)來提高數(shù)據(jù)庫的處理速度。
所有基于數(shù)據(jù)庫引擎的集群都支持這個(gè)技術(shù)。
【點(diǎn)評(píng)】將多CPU處理器進(jìn)行合理調(diào)度,來同時(shí)處理不同的訪問要求,但這種技術(shù)在數(shù)據(jù)庫上的應(yīng)用的實(shí)際收益是很有限的。
交易處理負(fù)載均衡:在保持?jǐn)?shù)據(jù)集內(nèi)容同步的前提下,將只讀操作分布到多個(gè)獨(dú)立的服務(wù)器上運(yùn)行。因?yàn)榻^大多數(shù)的數(shù)據(jù)庫操作是瀏覽和查詢,如果我們能擁有多個(gè)內(nèi)容同步的數(shù)據(jù)庫服務(wù)器,交易負(fù)載均衡就具有最大的潛力(可以遠(yuǎn)遠(yuǎn)大于上面敘述的最多達(dá)四個(gè)處理器的對(duì)稱多處理器系統(tǒng))來提高數(shù)據(jù)庫的處理速度,同時(shí)會(huì)具有非常高的數(shù)據(jù)可用性。
所有基于數(shù)據(jù)庫引擎的集群系統(tǒng)都只支持一個(gè)邏輯數(shù)據(jù)庫映象和一個(gè)邏輯或物理的備份。這個(gè)備份的主要目的是預(yù)防數(shù)據(jù)災(zāi)難。因此,備份里的數(shù)據(jù)只能通過復(fù)制機(jī)制來更新,應(yīng)用程序是不能直接更新它的。利用備份數(shù)據(jù)進(jìn)行交易負(fù)載均衡只適用于一些非常有限的應(yīng)用,例如報(bào)表統(tǒng)計(jì)、數(shù)據(jù)挖掘以及其它非關(guān)鍵業(yè)務(wù)的應(yīng)用。
【點(diǎn)評(píng)】負(fù)載平衡算是一項(xiàng)“老”技術(shù)了。但將性能提高到最大也是集群設(shè)計(jì)所追求的終極目標(biāo)。傳統(tǒng)意義上,利用備份數(shù)據(jù)進(jìn)行交易負(fù)載均衡只適用于一些非常有限的應(yīng)用。
上述所有技術(shù)在實(shí)際部署系統(tǒng)的時(shí)候可以混合使用以達(dá)到最佳效果。
提高可用性的四種方法
硬件級(jí)冗余:讓多處理機(jī)同時(shí)執(zhí)行同樣的任務(wù)用以屏蔽瞬時(shí)和永久的硬件錯(cuò)誤。有兩種實(shí)現(xiàn)方法:構(gòu)造特殊的冗余處理機(jī)和使用多個(gè)獨(dú)立的數(shù)據(jù)庫服務(wù)器。
基于數(shù)據(jù)庫的集群系統(tǒng)都是用多個(gè)獨(dú)立的數(shù)據(jù)庫服務(wù)器來實(shí)現(xiàn)一個(gè)邏輯數(shù)據(jù)庫,在任意瞬間,每臺(tái)處理器運(yùn)行的都是不同的任務(wù)。這種系統(tǒng)可以屏蔽單個(gè)或多個(gè)服務(wù)器的損壞,但是因?yàn)闆]有處理的冗余度,每次恢復(fù)的時(shí)間比較長(zhǎng)。
【點(diǎn)評(píng)】傳統(tǒng)意義上,硬件越貴,性能越高,但往往事與愿違。想通過追加和升級(jí)硬件設(shè)備來改善硬件級(jí)的冗余,要進(jìn)行詳細(xì)的需求分析和論證。
通訊鏈路級(jí)冗余:冗余的通訊鏈路可以屏蔽瞬時(shí)和永久的通訊鏈路級(jí)的錯(cuò)誤。
基于數(shù)據(jù)庫引擎的集群系統(tǒng)有兩種結(jié)構(gòu):共享磁盤和獨(dú)立磁盤。RAC, MSCS 可以認(rèn)為是共享磁盤的集群系統(tǒng)。UDB和ASE 是獨(dú)立磁盤的集群系統(tǒng)。共享磁盤集群系統(tǒng)的通訊的冗余度最小。
【點(diǎn)評(píng)】通訊鏈路級(jí)的冗余具有容錯(cuò)功能。
軟件級(jí)冗余:由于現(xiàn)代操作系統(tǒng)和數(shù)據(jù)庫引擎的高度并發(fā)性,由競(jìng)爭(zhēng)條件、死鎖、以及時(shí)間相關(guān)引發(fā)的錯(cuò)誤占據(jù)了非正常停機(jī)服務(wù)的絕大多數(shù)原因。采用多個(gè)冗余的運(yùn)行數(shù)據(jù)庫進(jìn)程能屏蔽瞬時(shí)和永久的軟件錯(cuò)誤。基于數(shù)據(jù)庫引擎的集群系統(tǒng)都用多個(gè)處理器來實(shí)現(xiàn)一個(gè)邏輯數(shù)據(jù)庫,它們只能提供部分軟件冗余,因?yàn)槊恳凰查g每個(gè)處理器執(zhí)行的都是不同的任務(wù)。
【點(diǎn)評(píng)】改善軟件設(shè)計(jì)來提高冗余性能和屏蔽軟件級(jí)錯(cuò)誤是每個(gè)技術(shù)開發(fā)商的夢(mèng)想。傳統(tǒng)的集群系統(tǒng)只能提供部分軟件冗余。
數(shù)據(jù)冗余:
1. 被動(dòng)更新數(shù)據(jù)集:所有目前的數(shù)據(jù)復(fù)制技術(shù)(同步或異步),例如磁盤鏡像、數(shù)據(jù)庫文件復(fù)制以及數(shù)據(jù)庫廠商自帶的數(shù)據(jù)庫備份工具都只能產(chǎn)生被動(dòng)復(fù)制數(shù)據(jù)集。它一般只用于災(zāi)難恢復(fù)。
【點(diǎn)評(píng)】大多數(shù)應(yīng)用都是采用被動(dòng)更新數(shù)據(jù)集的方法。這種方法容災(zāi)能力差,資源占用多,已面臨淘汰和革新。
2. 主動(dòng)更新數(shù)據(jù)集:這種數(shù)據(jù)集需要一臺(tái)或多臺(tái)備份數(shù)據(jù)庫服務(wù)器來管理,它可用于報(bào)表生成,數(shù)據(jù)挖掘,災(zāi)難恢復(fù)甚至低質(zhì)量負(fù)載均衡。分同步和異步兩種。
異步主動(dòng)復(fù)制數(shù)據(jù)集:先把事務(wù)處理交給主服務(wù)器來完成,然后事務(wù)處理再被串行地交給備份服務(wù)器以執(zhí)行同樣操作來保證數(shù)據(jù)一致性。所有的商用數(shù)據(jù)庫都支持異步主動(dòng)復(fù)制技術(shù)。
同步主動(dòng)復(fù)制數(shù)據(jù)集:要求所有并發(fā)事務(wù)處理在所有數(shù)據(jù)庫服務(wù)器上同時(shí)完成。直接好處就是解決了隊(duì)列管理問題,同時(shí)通過負(fù)載均衡實(shí)現(xiàn)更高性能和可用性。RAC, UDB, MSCS 和 ASE是用完全串行化并結(jié)合兩階段提交協(xié)議來實(shí)現(xiàn)的,設(shè)計(jì)目標(biāo)就是為了獲得一份可用于快速災(zāi)難恢復(fù)的數(shù)據(jù)集。
【點(diǎn)評(píng)】主動(dòng)更新數(shù)據(jù)集是目前比較先進(jìn)的數(shù)據(jù)冗余方法。專業(yè)人員還可以進(jìn)行更底層的技術(shù)細(xì)節(jié)比較。底層技術(shù)的差異直接影響著一些重要指標(biāo)。
提高安全和數(shù)據(jù)集可擴(kuò)性的技術(shù)
在提高數(shù)據(jù)庫安全性和數(shù)據(jù)集可擴(kuò)性這兩方面,可以創(chuàng)新的空間是很小的。數(shù)據(jù)庫最常見的安全辦法是口令保護(hù),要么是分布式的,要么是集中式的。在數(shù)據(jù)庫前面增加防火墻會(huì)增加額外的延遲,因此,盡管許多安全侵犯事件是來自于公司內(nèi)部,但是數(shù)據(jù)庫防火墻還是很少被采用。如果數(shù)據(jù)庫集群技術(shù)是基于中間件技術(shù)實(shí)現(xiàn)的,就有可能在不增加額外延遲的情況下,在數(shù)據(jù)經(jīng)過的路徑上實(shí)現(xiàn)防火墻功能。數(shù)據(jù)庫數(shù)據(jù)集的可擴(kuò)性只能通過將數(shù)據(jù)分布到多個(gè)獨(dú)立的物理服務(wù)器上來實(shí)現(xiàn)。
2主流產(chǎn)品
在數(shù)據(jù)庫集群產(chǎn)品方面,其中主要包括基于數(shù)據(jù)庫引擎的集群技術(shù)的Oracle RAC、Microsoft MSCS、IBM DB2 UDB、Sybase ASE,以及基于數(shù)據(jù)庫網(wǎng)關(guān)(中間件)的集群技術(shù)的ICX-UDS等產(chǎn)品。
Oracle RAC
Oracle RAC 支持 Oracle 數(shù)據(jù)庫在集群上運(yùn)行的所有類型的主流商業(yè)應(yīng)用程序。這包括流行的封裝產(chǎn)品,如 SAP、PeopleSoft 和 Oracle E-Business Suite 等,以及自主研發(fā)的應(yīng)用程序,其中包括 OLTP 和 DSS,以及 Oracle 有效支持混合 OLTP/DSS 環(huán)境的獨(dú)有能力。Oracle 是唯一提供具備這一功能的開放系統(tǒng)數(shù)據(jù)庫的廠商。 Oracle RAC 運(yùn)行于集群之上,為 Oracle 數(shù)據(jù)庫提供了最高級(jí)別的可用性、可伸縮性和低成本計(jì)算能力。如果集群內(nèi)的一個(gè)節(jié)點(diǎn)發(fā)生故障,Oracle 將可以繼續(xù)在其余的節(jié)點(diǎn)上運(yùn)行。如果需要更高的處理能力,新的節(jié)點(diǎn)可輕松添加至集群。為了保持低成本,即使最高端的系統(tǒng)也可以從采用標(biāo)準(zhǔn)化商用組件的小型低成本集群開始逐步構(gòu)建而成。
Oracle 的主要?jiǎng)?chuàng)新是一項(xiàng)稱為高速緩存合并的技術(shù),它最初是針對(duì) Oracle9i 真正應(yīng)用集群開發(fā)的。高速緩存合并使得集群中的節(jié)點(diǎn)可以通過高速集群互聯(lián)高效地同步其內(nèi)存高速緩存,從而最大限度地低降低磁盤 I/O。高速緩存最重要的優(yōu)勢(shì)在于它能夠使集群中所有節(jié)點(diǎn)的磁盤共享對(duì)所有數(shù)據(jù)的訪問。數(shù)據(jù)無需在節(jié)點(diǎn)間進(jìn)行分區(qū)。Oracle RAC 支持企業(yè)網(wǎng)格。Oracle RAC 的高速緩存合并技術(shù)提供了最高等級(jí)的可用性和可伸縮性。Oracle RAC能顯著降低了運(yùn)營(yíng)成本,增強(qiáng)了靈活性,從而賦予了系統(tǒng)更卓越的適應(yīng)性、前瞻性和靈活性。動(dòng)態(tài)提供節(jié)點(diǎn)、存儲(chǔ)器、CPU 和內(nèi)存可以在實(shí)現(xiàn)所需服務(wù)級(jí)別的同時(shí),通過提高的利用率不斷降低成本。
Oracle RAC采用了“sharing everything”的實(shí)現(xiàn)模式,通過CPU共享和存儲(chǔ)設(shè)備共享來實(shí)現(xiàn)多節(jié)點(diǎn)之間的無縫集群,用戶提交的每一項(xiàng)任務(wù)被自動(dòng)分配給集群中的多臺(tái)機(jī)器執(zhí)行,用戶不必通過冗余的硬件來滿足高可靠性要求。另一方面,RAC可以實(shí)現(xiàn)CPU的共享,即使普通服務(wù)器組成的集群也能實(shí)現(xiàn)過去只有大型主機(jī)才能提供的高性能。
Microsoft MSCS
數(shù)年以來,Microsoft一直致力于對(duì)自身服務(wù)器解決方案的伸縮能力、可用性與可靠性進(jìn)行擴(kuò)展。最初代號(hào)為Wolfpack且先后被稱為Microsoft集群服務(wù)器與Microsoft集群服務(wù)的MSCS是Microsoft在NT集群技術(shù)領(lǐng)域中的首次重拳出擊,它是公認(rèn)的最佳Microsoft集群解決方案。在MSCS群集中,MSCS軟件最多可以同四臺(tái)運(yùn)行在高速網(wǎng)絡(luò)上的物理計(jì)算機(jī)建立連接。通常情況下,群集中的計(jì)算機(jī)能夠按照“活動(dòng)--活動(dòng)”方式共享相同的存儲(chǔ)子系統(tǒng)與功能,這意味著所有集群計(jì)算機(jī)(節(jié)點(diǎn))均可主動(dòng)通過共享負(fù)載的方式協(xié)同完成工作,并在某個(gè)節(jié)點(diǎn)出現(xiàn)故障時(shí)分擔(dān)它的工作。MSCS的主要用途是通過自身提供的容錯(cuò)能力提高應(yīng)用程序可用性。容錯(cuò)能力是指將相關(guān)處理過程從某個(gè)節(jié)點(diǎn)上的故障應(yīng)用程序移植到集群中其它健康節(jié)點(diǎn)上的集群功能。當(dāng)故障應(yīng)用程序得到恢復(fù)后,集群應(yīng)當(dāng)能夠?qū)υ鹊募汗?jié)點(diǎn)實(shí)現(xiàn)“故障返回”。MSCS能夠在不丟失任何與故障應(yīng)用程序相關(guān)數(shù)據(jù)的前提下對(duì)集群上所運(yùn)行的應(yīng)用程序進(jìn)行故障恢復(fù)與故障返回管理,并且能夠在故障恢復(fù)過程中維護(hù)用戶及應(yīng)用程序狀態(tài)。這種類型的集群功能被稱作有狀態(tài)集群功能。MSCS同時(shí)還允許用戶在應(yīng)用程序升級(jí)過程中繼續(xù)進(jìn)行工作。您可以采取滾動(dòng)升級(jí)方式(例如每次在一個(gè)集群節(jié)點(diǎn)上升級(jí)應(yīng)用程序并確保其它節(jié)點(diǎn)上的應(yīng)用程序繼續(xù)處于可用狀態(tài))而不必在升級(jí)過程中停止使用應(yīng)用程序。
SQL Server 2005是微軟的下一代數(shù)據(jù)管理和分析解決方案,給企業(yè)級(jí)應(yīng)用數(shù)據(jù)和分析程序帶來更好的安全性、穩(wěn)定性和可靠性,更易于創(chuàng)建、部署和管理。它憑借針對(duì)故障轉(zhuǎn)移群集機(jī)制的支持能力,得以增強(qiáng)的多實(shí)例支持能力以及分析服務(wù)對(duì)象與數(shù)據(jù)備份及恢復(fù)能力,分析服務(wù)的可用性得到了提高。它提供了諸如表分區(qū)、快照隔離、64位支持等方面的高級(jí)可伸縮,使用戶能輕松構(gòu)建和部署關(guān)鍵應(yīng)用。表和索引的分區(qū)功能顯著增強(qiáng)了對(duì)大型數(shù)據(jù)庫的查詢性能。
3性能指標(biāo)
這部分將介紹集群系統(tǒng)的細(xì)節(jié)技術(shù)指標(biāo)。在做系統(tǒng)規(guī)劃時(shí),用戶就可去掉一些應(yīng)用中不太重要的指標(biāo),或賦予這些指標(biāo)以不同的權(quán)重,從而進(jìn)行專業(yè)的技術(shù)性能比較,選擇最適合自己的數(shù)據(jù)庫集群系統(tǒng)。
處理速度
磁盤技術(shù):所有集群系統(tǒng)都能很好地應(yīng)用磁盤技術(shù),但是由于DM,F(xiàn)M會(huì)對(duì)磁盤系統(tǒng)帶來傳輸速度的負(fù)面影響,因此這方面它們相對(duì)欠缺。
數(shù)據(jù)分割:所有基于數(shù)據(jù)庫引擎的集群系統(tǒng)都有很好數(shù)據(jù)分割能力。
SMP:所有基于數(shù)據(jù)庫引擎的集群系統(tǒng)的SMP性能指標(biāo)都比較接近。
負(fù)載均衡:一般的數(shù)據(jù)庫引擎的集群系統(tǒng)由于使用了備份的數(shù)據(jù)集,因此只能支持有限的負(fù)載均衡。這一指標(biāo)不同產(chǎn)品之間有差異。
數(shù)據(jù)可用性
處理器和軟件冗余:只有部分集群系統(tǒng)支持該功能。
通訊鏈路冗余:一般來說,共享磁盤的集群系統(tǒng)通訊鏈路冗余指標(biāo)較低,獨(dú)立磁盤的集群系統(tǒng)指標(biāo)較高。
數(shù)據(jù)冗余:
主動(dòng)異步復(fù)制:除了磁盤和文件鏡像外,其他集群系統(tǒng)支持該功能。
主動(dòng)同步復(fù)制:所有集群系統(tǒng)支持該功能,細(xì)節(jié)指標(biāo)略有不同。
被動(dòng)異步復(fù)制:所有集群系統(tǒng)該性能指標(biāo)都比較接近。
被動(dòng)同步更新:所有集群系統(tǒng)該性能指標(biāo)都比較接近。
通過廣域網(wǎng)的復(fù)制技術(shù):
遠(yuǎn)程主動(dòng)異步復(fù)制:所有的集群系統(tǒng)都支持這種復(fù)制技術(shù),只不過對(duì)隊(duì)列的管理能力有所不同。DM,F(xiàn)M和RAID的此性能相對(duì)較低。RAID不支持遠(yuǎn)程復(fù)制功能。
遠(yuǎn)程主動(dòng)同步復(fù)制:ICX在這方面做的比較好。
遠(yuǎn)程被動(dòng)異步復(fù)制:DM 和 FM支持這種類型的復(fù)制,因?yàn)镈M和FM對(duì)集群是透明的,是在集群系統(tǒng)的下一層工作的,所有的集群系統(tǒng)都可以利用它們提供的功能。
遠(yuǎn)程被動(dòng)同步復(fù)制:DM和FM支持這種類型的復(fù)制,因?yàn)檫@種復(fù)制方式只在距離很近的時(shí)候才能使用(使用雙模光纖,半徑五英里)。同樣地,因?yàn)镈M和FM對(duì)集群是透明的, 所有的集群系統(tǒng)都可以利用它們提供的功能, 如果部署的話,所有的集群系統(tǒng)都是類似的。
安全性
口令:這是所有集群系統(tǒng)的基本性能。分布式或集中式的口令保護(hù)基本上保證了數(shù)據(jù)的安全。
數(shù)據(jù)庫防火墻:大多數(shù)數(shù)據(jù)庫集群系統(tǒng)得數(shù)據(jù)庫防火墻很少被采用,而ICX則采用在數(shù)據(jù)經(jīng)過的路徑上實(shí)現(xiàn)防火墻功能。
數(shù)據(jù)集的可擴(kuò)性
數(shù)據(jù)分區(qū):所有基于數(shù)據(jù)庫引擎的集群系統(tǒng)都具備數(shù)據(jù)分區(qū)以保證數(shù)據(jù)集的可擴(kuò)展。
數(shù)據(jù)分區(qū)的可用性:所有集群系統(tǒng)該性能指標(biāo)比較接近。
集群管理
共享磁盤的集群系統(tǒng),比如RAC、MSCS,它們的管理比較方便,其中RAC的服務(wù)更多。但是,由于此種系統(tǒng)中的每一單獨(dú)的服務(wù)器需要特殊處理,和獨(dú)立磁盤的集群系統(tǒng)比較,就容易管理多了(雖然進(jìn)行初始化和修改配置的時(shí)候也不那么容易),但它們都要求應(yīng)用程序?qū)翰煌该鳎遗渲茫薷囊脖容^麻煩。
獨(dú)立磁盤的集群系統(tǒng)象 UDB、ASE此性能相對(duì)稍低,因?yàn)橛玫亩际欠枪蚕泶疟P,所以管理相對(duì)繁瑣。
ICX在易管理性(初始配置和將來的修改)方面和獨(dú)立磁盤集群系統(tǒng)的性能相當(dāng),但是在對(duì)底層數(shù)據(jù)管理復(fù)雜性方面做得比較好。在對(duì)數(shù)據(jù)庫引擎和數(shù)據(jù)進(jìn)行底層修復(fù)的時(shí)候任務(wù)需要直接到每臺(tái)數(shù)據(jù)庫處理器上去做。
那些磁盤工具,即DM、FM和RAID,它們對(duì)集群是透明的。管理相對(duì)簡(jiǎn)單得多。
應(yīng)用透明度
因?yàn)樵阱e(cuò)誤回復(fù)和分區(qū)方面對(duì)應(yīng)用程序不透明以及它們對(duì)應(yīng)用程序都有些特殊的要求,基于數(shù)據(jù)庫引擎的RAC、MSCS、UDB、ASE和ICX在這方面都有待提高的地方。而DM、FM和RAID它們對(duì)應(yīng)用程序可以說是完全透明的。
IBM DB2 UDB
DB2 UDB大量自動(dòng)或自我管理功能可使管理員能夠節(jié)省更多時(shí)間來集中精力考慮驅(qū)動(dòng)業(yè)務(wù)價(jià)值的問題,甚至可以消除較小的實(shí)施項(xiàng)目對(duì)專職管理員的需求。
UDB的優(yōu)勢(shì)體現(xiàn)在DB2的開放無界:支持Unix, Linux 以及Windows等主流操作系統(tǒng);支持各種開發(fā)語言和訪問接口;同時(shí)具有良好的數(shù)據(jù)安全性和穩(wěn)定性。DB2 V8.2的高可用性災(zāi)備技術(shù),可在極短時(shí)間內(nèi)使關(guān)鍵應(yīng)用得到恢復(fù)。利用DB2數(shù)據(jù)分區(qū)部件(DPF)實(shí)現(xiàn)橫向擴(kuò)展,可以支持多達(dá)1000臺(tái)服務(wù)器組成的龐大數(shù)據(jù)庫群集,為構(gòu)建企業(yè)級(jí)數(shù)據(jù)倉庫提供堅(jiān)實(shí)的技術(shù)基礎(chǔ)。利用DB2的數(shù)據(jù)分區(qū)部件以及DB2信息集成器(DB2 II)技術(shù),數(shù)據(jù)庫操作可綜合利用網(wǎng)格中的每臺(tái)服務(wù)器的運(yùn)算能力,實(shí)現(xiàn)真正意義上的網(wǎng)格運(yùn)算。
UDB V8.2應(yīng)用更多的創(chuàng)新技術(shù),Design Advisor可以幫助 DBA 制定全面的數(shù)據(jù)庫設(shè)計(jì)決策,包括集成復(fù)雜的功能劃分、物化查詢表,大大縮短部署時(shí)間。自動(dòng)生成統(tǒng)計(jì)信息概要代表了來自 IBM LEO研發(fā)項(xiàng)目的首次部署。自主對(duì)象維護(hù)特性可自動(dòng)執(zhí)行基于策略的管理和維護(hù)功能,如表重構(gòu)、統(tǒng)計(jì)信息收集和數(shù)據(jù)庫備份。高可用性災(zāi)難恢復(fù)和客戶機(jī)重路由特性實(shí)現(xiàn)了具備隨選能力的企業(yè)所需的24*7信息可用性和恢復(fù)力。此外,DB2 UDB 提供與 Java/Eclipse 和 Microsoft .NET IDE的深入集成或插件。
SYBASE ASE
ASE性能的提高是建立在虛擬服務(wù)器架構(gòu)上的,這是 Sybase 獨(dú)有的體系結(jié)構(gòu)。當(dāng)前的ASE版本是ASE15。與操作系統(tǒng)和相關(guān)軟件保持獨(dú)立讓ASE15可以更智能化地進(jìn)行系統(tǒng)自我調(diào)優(yōu)。VSA只需要很少的內(nèi)存資源和內(nèi)部交換開銷,所以ASE15可以管理大量的聯(lián)機(jī)用戶。能夠使ASE提高性能并控制成本的最主要原因是它采用了專利技術(shù)的、自調(diào)整的優(yōu)化器和查詢引擎。它可以智能地調(diào)整復(fù)雜的查詢操作并忽略那些未包含相關(guān)信息的分區(qū)上的數(shù)據(jù)。ASE15還通過一系列用來管理和診斷數(shù)據(jù)庫服務(wù)器的新特性來降低運(yùn)營(yíng)成本。
ASE15 擁有高可靠性和極低的運(yùn)行風(fēng)險(xiǎn)。個(gè)人數(shù)據(jù)的安全性是ASE特別關(guān)注的領(lǐng)域,使用了一種無需修改應(yīng)用的獨(dú)特加密系統(tǒng)。當(dāng)應(yīng)用和安全軟件進(jìn)行連接時(shí)將降低實(shí)施成本并避免產(chǎn)生新的安全漏洞。ASE15 還通過一種簡(jiǎn)單、直接和可編程的腳本語言來方便進(jìn)行加密和解密。在解決意外停機(jī)問題時(shí),ASE15 在其已證實(shí)的可靠性和高系統(tǒng)利用率的基礎(chǔ)上,增加了許多顯著的功能來增強(qiáng)系統(tǒng)的可用性和災(zāi)難恢復(fù)過程。新的存儲(chǔ)引擎支持四種數(shù)據(jù)分區(qū)方式,在不同的物理設(shè)備上進(jìn)行不同的分區(qū)操作。能幫助數(shù)據(jù)庫管理員迅速地建立冗余災(zāi)難恢復(fù)節(jié)點(diǎn)并在異構(gòu)的數(shù)據(jù)平臺(tái)上同步數(shù)據(jù)庫。
ASE15系統(tǒng)新的查詢和存儲(chǔ)引擎被設(shè)計(jì)用于支持下一代網(wǎng)格計(jì)算和集群技術(shù)。它結(jié)合了充分利用數(shù)據(jù)分區(qū)技術(shù)的查詢處理機(jī)制和適用于解決集群?jiǎn)栴}的優(yōu)化器技術(shù)。同時(shí)ASE15為事件驅(qū)動(dòng)的企業(yè)提供了一個(gè)絕好的數(shù)據(jù)庫平臺(tái)。與web services 和 XML的架構(gòu)將減少系統(tǒng)內(nèi)部的相互依賴性,并為應(yīng)用開發(fā)提供更大的靈活性。
ICX-UDS
ICX-UDS不受基于數(shù)據(jù)庫引擎的集群技術(shù)限制,可以支持不同的數(shù)據(jù)庫。
它類似通常的服務(wù)器。把ICX放置在關(guān)鍵的網(wǎng)絡(luò)路徑上,監(jiān)聽數(shù)據(jù)庫系統(tǒng)流量。ICX網(wǎng)關(guān)將自動(dòng)過濾出無狀態(tài)的查詢?cè)L問,并將負(fù)載均衡到所有服務(wù)器上。在這里,網(wǎng)關(guān)就象一個(gè)在線“編譯器”,它將所有對(duì)數(shù)據(jù)庫的更新操作發(fā)送到所有數(shù)據(jù)庫上執(zhí)行,而將無狀態(tài)的查詢操作只發(fā)送到其中某一數(shù)據(jù)庫服務(wù)器上。
對(duì)于統(tǒng)計(jì)報(bào)表和數(shù)據(jù)挖掘類應(yīng)用,可以通過復(fù)制和只讀去獲得更快的處理速度。還能指定更多的只讀來負(fù)載均衡。ICX 網(wǎng)關(guān)的容錯(cuò)可以通過備份網(wǎng)關(guān)來達(dá)到。加載一個(gè)非同步的數(shù)據(jù)庫可以造出不影響主服務(wù)機(jī)群的近于實(shí)時(shí)的數(shù)據(jù)源。
4應(yīng)用點(diǎn)評(píng)
Oracle RAC和Oracle數(shù)據(jù)庫提供的特定新管理性增強(qiáng)功能實(shí)現(xiàn)了企業(yè)網(wǎng)格。各種規(guī)模的企業(yè)都可以采用Oracle RAC來支持各類應(yīng)用程序。
企業(yè)網(wǎng)格采用大型標(biāo)準(zhǔn)化商用組件配置:處理器、網(wǎng)絡(luò)和存儲(chǔ)器。利用Oracle RAC的高速緩存合并技術(shù),Oracle數(shù)據(jù)庫實(shí)現(xiàn)了最高可用性和可伸縮性。現(xiàn)在,利用Oracle數(shù)據(jù)庫和Oracle RAC將大幅降低了運(yùn)行成本,進(jìn)一步增強(qiáng)了靈活性,其動(dòng)態(tài)提供節(jié)點(diǎn)、存儲(chǔ)器、CPU和內(nèi)存的特性可以更輕松、高效地保持服務(wù)級(jí)別,而通過提高的利用率又進(jìn)一步降低了成本。企業(yè)網(wǎng)格是未來的數(shù)據(jù)中心,使企業(yè)具備更高的適應(yīng)能力、前瞻性和敏捷性。
集群技術(shù)隨著服務(wù)器硬件系統(tǒng)與網(wǎng)絡(luò)操作系統(tǒng)的發(fā)展將會(huì)在可用性、高可靠性、系統(tǒng)冗余等方面逐步提高。我們匯集了市場(chǎng)上的主流產(chǎn)品,并從分析性能指標(biāo)的角度出發(fā),對(duì)產(chǎn)品進(jìn)行了簡(jiǎn)要評(píng)價(jià)。
Sybase ASE是一個(gè)深受用戶歡迎的高性能數(shù)據(jù)庫,它具有一個(gè)開放的、可擴(kuò)展的體系結(jié)構(gòu),易于使用的事務(wù)處理系統(tǒng),以及低廉的維護(hù)成本。
ASE可支持傳統(tǒng)的、關(guān)鍵任務(wù)的OLTP和DSS應(yīng)用,并且滿足Internet應(yīng)用的發(fā)展需要,Sybase可以很好地滿足關(guān)鍵任務(wù)的企業(yè)業(yè)務(wù)應(yīng)用的需求,提供數(shù)據(jù)庫可靠性、集成性和高性能。ASE有效的多線索結(jié)構(gòu),內(nèi)部并行機(jī)制和有效的查詢優(yōu)化技術(shù)提供了出色性能和可伸縮性;還可提供先進(jìn)的企業(yè)集成、強(qiáng)健和數(shù)據(jù)訪問與數(shù)據(jù)移動(dòng)技術(shù),支持跨越遠(yuǎn)程Sybase和non-Sybase數(shù)據(jù)庫的分布事務(wù)和查詢。ASE進(jìn)一步擴(kuò)展了這些功能,通過分布信息和管理商業(yè)事務(wù),支持通過企業(yè)信息門戶對(duì)商業(yè)系統(tǒng)進(jìn)行個(gè)性化的用戶訪問。
MSCS對(duì)于諸如電子郵件服務(wù)器、數(shù)據(jù)庫應(yīng)用程序之類的應(yīng)用程序,是一種良好的運(yùn)行方式。
假設(shè)您決定在一個(gè)4節(jié)點(diǎn)MSCS群集上運(yùn)行Microsoft Exchange 2000 Server。當(dāng)安裝MSCS軟件以及適用于群集的Exchange 2000版本后,您可以對(duì)群集進(jìn)行配置,以便使Exchange 2000能夠在主要節(jié)點(diǎn)發(fā)生故障時(shí)在備份節(jié)點(diǎn)上進(jìn)行故障恢復(fù)。當(dāng)故障發(fā)生時(shí),主服務(wù)器上肯定存在處于打開狀態(tài)的用戶會(huì)話,然而,MSCS能夠在不丟失任何數(shù)據(jù)的情況下快速、自動(dòng)的完成故障恢復(fù)。備份節(jié)點(diǎn)將從故障節(jié)點(diǎn)上接替工作負(fù)載及相關(guān)數(shù)據(jù),并繼續(xù)為用戶提供服務(wù)。
ICX的最大優(yōu)點(diǎn)是在數(shù)據(jù)庫集群技術(shù)面臨的挑戰(zhàn)上有了新的探索,此項(xiàng)基于中間件的數(shù)據(jù)庫集群技術(shù)為獲得具有高可擴(kuò)性的高性能數(shù)據(jù)庫提供了一條切實(shí)可行的途徑,同時(shí)能靈活地適應(yīng)未來的技術(shù)變化。
這種中間件復(fù)制技術(shù)可位于關(guān)鍵的網(wǎng)絡(luò)路徑上,監(jiān)聽所有進(jìn)出數(shù)據(jù)庫系統(tǒng)的流量,方便地提供防火墻和其它安全服務(wù),保護(hù)物理的數(shù)據(jù)庫服務(wù)器。通過多個(gè)服務(wù)器的并發(fā)處理很容易地隱藏了處理的延遲。實(shí)時(shí)并行同步交易復(fù)制:一旦我們突破了實(shí)時(shí)并行同步交易復(fù)制的技術(shù)障礙,用戶就能通過由多個(gè)數(shù)據(jù)庫服務(wù)器構(gòu)成的集群來獲得高性能,高可用性和高安全性。
DB2 UDB是一個(gè)可以隨企業(yè)增長(zhǎng)的數(shù)據(jù)庫。當(dāng)對(duì)網(wǎng)站的事務(wù)需求達(dá)到峰值時(shí)它可以迅速響應(yīng),它可以進(jìn)行擴(kuò)展以容納分布在許多不同數(shù)據(jù)庫中的數(shù)量不斷增長(zhǎng)的信息。
隨著信息基礎(chǔ)結(jié)構(gòu)從一個(gè)處理器發(fā)展到多個(gè)處理器再到高度并行的多個(gè)群集,它也隨之?dāng)U展。將分區(qū)技術(shù)和群集技術(shù)集成到新的 DB2 UDB Enterprise Server Edition 中意味著該版本很靈活。DB2 UDB還添加了自主數(shù)據(jù)庫技術(shù),它使數(shù)據(jù)庫管理員可以選擇使用增強(qiáng)的自動(dòng)化技術(shù)來配置、調(diào)優(yōu)和管理他們的數(shù)據(jù)庫。自主數(shù)據(jù)庫管理意味著管理員可以在管理日常任務(wù)上花費(fèi)較少的時(shí)間。表的多維群集減輕了 DBA 創(chuàng)建索引的工作負(fù)擔(dān),同時(shí)提供了數(shù)據(jù)群集以快速查詢。DB2內(nèi)置的已規(guī)劃的和未規(guī)劃的可用性能力確保了業(yè)務(wù)應(yīng)用程序在任何時(shí)候都可用。諸如索引重建、索引創(chuàng)建和表裝載之類的聯(lián)機(jī)實(shí)用程序以及可以不停止數(shù)據(jù)庫進(jìn)行更改的配置參數(shù),都意味著改進(jìn)的性能和高可用性。
【相關(guān)鏈接】
理想的數(shù)據(jù)庫集群應(yīng)具備的特點(diǎn)
提高速度:只通過簡(jiǎn)單地增加數(shù)據(jù)庫服務(wù)器就能相對(duì)提高數(shù)據(jù)庫處理速度。
數(shù)據(jù)同步:在任何時(shí)刻需要有多個(gè)隨時(shí)可用的實(shí)時(shí)同步數(shù)據(jù)服務(wù)。最好有多個(gè)異地的同步數(shù)據(jù)服務(wù)。
安全保證:除了密碼保護(hù)之外,我們最好能控制企業(yè)內(nèi)部對(duì)數(shù)據(jù)庫的非法訪問。
可擴(kuò)展性:應(yīng)保證我們能任意增大數(shù)據(jù)集而沒有對(duì)可用性產(chǎn)生負(fù)面影響。
一般來說,有關(guān)數(shù)據(jù)庫集群的技術(shù)都非常龐雜。更具挑戰(zhàn)性的是,實(shí)際應(yīng)用要求在提高速度、數(shù)據(jù)同步、安全保證、可擴(kuò)展性方面的指標(biāo)能同時(shí)提升,而不是單純提升某一指標(biāo)而犧牲其他指標(biāo)。全面提升這些技術(shù)指標(biāo)是數(shù)據(jù)庫集群技術(shù)都將面臨的重大課題。
【名詞解釋】
集群:是一組通過協(xié)同工作方式運(yùn)行同一套應(yīng)用程序并針對(duì)客戶端及應(yīng)用程序提供單一系統(tǒng)映像的獨(dú)立計(jì)算機(jī)。集群技術(shù)的目標(biāo)在于通過多層網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)一步提高伸縮能力、可用性與可靠性。
可伸縮性:是指一臺(tái)計(jì)算機(jī)在維持可接受性能的前提下處理不斷提高的工作負(fù)載的能力。