前言:中文期刊網(wǎng)精心挑選了解碼技術(shù)論文范文供你參考和學(xué)習(xí),希望我們的參考范文能激發(fā)你的文章創(chuàng)作靈感,歡迎閱讀。
解碼技術(shù)論文范文1
關(guān)鍵詞:RGB YCbCr FPGA 色彩空間轉(zhuǎn)換
中圖分類號:TN911 文獻標(biāo)識碼:A 文章編號:1672-3791(2014)09(a)-0023-01
1 常見色彩空間
我們主要介紹RGB和YCbCr色彩空間。RGB色彩空間是一種常用的色彩空間。它可以實現(xiàn)不同平臺的映射而不嚴重損失顏色信息。任何一種顏色都可以由三基色紅、綠、藍混合疊加而成。RGB三個分量彼此相互獨立,三個分量的值越小所代表的亮度越低。RGB色彩空間它所占用的帶寬和存儲量是很大的,如果使用該色彩空間進行圖像傳輸,非常不利于圖像的處理。所以引入另一種色彩空間YCbCr。該格式的色彩空間是演播室編碼方案中使用的顏色模型。Y,Cb,Cr分別代表亮度、藍度分量和紅度分量。YCbCr色彩空間有以下優(yōu)勢。首先它的構(gòu)成原理符合人類的視覺感知過程,再次它可以實現(xiàn)亮度和色度的分離,由于人眼對亮度的變化更敏感,所以我們在傳輸圖像時減小帶寬的同時引起的顏色損失小,人眼幾乎無法察覺。
2 總體設(shè)計方案
系統(tǒng)的總體設(shè)計框圖如圖1所示。
基于FPGA的色彩空間的轉(zhuǎn)換過程可以描述為:首先通過CCD攝像頭進行視頻圖像采集,采集來的RGB圖像為NTSC或PAL制式的,接著我們會把視頻數(shù)據(jù)送到解碼芯片TVP5150,它會將信號變?yōu)镮TU-R BT.656格式的數(shù)據(jù)流。我們選取的TVP5150芯片是和FPGA主控芯片集成在一個開發(fā)板上,它的功耗非常低,芯片小巧利于便攜。視頻解碼芯片在對視頻信號處理之前總線會對其進行配置。從解碼芯片出來的信號便進入FPGA芯片,進行串并轉(zhuǎn)換、解交織等操作最終實現(xiàn)色彩空間的轉(zhuǎn)換。最后信號送到ADV7123芯片進行編碼,并通過D/A轉(zhuǎn)換芯片在VGA顯示器上顯示出來。
3 仿真與硬件驗證
硬件部分我們采用了Alera公司的FPGA芯片EP2C8Q208C8N作為核心處理芯片,該芯片內(nèi)部含有豐富的可編程邏輯資源,可以非常方便的完成相關(guān)乘法器的例化。在使用乘法器IPCore時,我們需要進行優(yōu)化設(shè)置。硬件部分包括CCD攝像頭、FPGA主控芯片、視頻解碼芯片TVP5150、視頻編碼芯片ADV7123等。最終將VGA線和顯示器的VGA口相連接,便可以通過顯示屏觀察結(jié)果。
硬件實物圖如圖2所示。
軟件部分采用Quartusii 9.1進行Verilog語言的編寫,并進行時序仿真。進行時序仿真的結(jié)果圖3所示。
4 結(jié)語
生活中存在多種色彩空間,它們各自具有不同的特點。但是在很多情況下我們又得在它們之間進行轉(zhuǎn)換,這無論對于科研研究還是消費市場都是很有必要的。本篇論文是通過硬件實現(xiàn)的RGB色彩空間到Y(jié)CbCr色彩空間的轉(zhuǎn)換,采用的Alera公司的FPGA芯片EP2C8Q208C8N作為核心處理芯片,利用其內(nèi)部豐富的可編程邏輯資源實現(xiàn)空間的轉(zhuǎn)換,并采用Quartusii 9.1進行軟件編程與仿真,驗證了模塊的功能。
參考文獻
[1] 唐曉燕,賈鋒,韓磊.基于FPGA的視頻顏色空間轉(zhuǎn)換電路設(shè)計[J].電子與電腦,2006(8):47-49.
[2] 吳康,劉耀元,胡民山.用FPGA實現(xiàn)色彩空間RGB到Y(jié)CbCr的轉(zhuǎn)換[J].南昌高專學(xué)報,2007,22(6):140-142.
解碼技術(shù)論文范文2
統(tǒng)計機器翻譯在短時期能夠得以迅速發(fā)展,除了技術(shù)進步外,很大一方面要歸功于很多開放源碼的統(tǒng)計機器翻譯工具,有些時候,正是因為這些開放源碼的工具才使得某項技術(shù)被廣泛接受和使用。例如,20世紀90年代初IBM公司的Brown等人提出了5個模型來刻畫統(tǒng)計機器翻譯,取得了不錯的效果,但是在此之后很長一段時間內(nèi)都沒有被大家認可和接受,原因是他們的模型非常復(fù)雜,難以理解和實現(xiàn)。直到1999年,開源軟件包Egypt的出現(xiàn),才使得IBM的模型被廣泛研究和使用。可以說Brown等人的工作為現(xiàn)代統(tǒng)計機器翻譯奠定了深厚的基礎(chǔ),但其影響卻是通過開源軟件才得以實現(xiàn),由此可見開源軟件對于統(tǒng)計機器翻譯這樣一個復(fù)雜的研究課題的重要性。
1. 首個開源統(tǒng)計機器翻譯工具包Egypt
Egypt是在1999年約翰霍普金斯大學(xué)統(tǒng)計機器翻譯夏季討論班上,由一些研究人員共同合作開發(fā)的統(tǒng)計機器翻譯工具包。它包括4個模塊;
Whittle: 語料庫預(yù)處理模塊;
GIZA: 用于從句子對齊的雙語語料庫中訓(xùn)練詞語對齊;
Cairo: 詞語對齊的可視化工具;
Decoder: 解碼器,用來執(zhí)行具體的翻譯過程模塊,這一模塊沒有開放源碼。
其中,用于訓(xùn)練詞語對齊的模塊GIZA現(xiàn)在仍然被廣泛使用,利用它能夠非常方便地從大規(guī)模的雙語文本中獲得統(tǒng)計知識。GIZA++是GIZA的改進版,GIZA++實現(xiàn)了IBM公司提出的5個模型,其主要思想是利用EM算法對雙語語料庫進行迭代訓(xùn)練,由句子對齊得到詞語對齊。GIZA是獨立于語言的,能夠?qū)θ魏蝺煞N語言進行訓(xùn)練,這也是統(tǒng)計機器翻譯的優(yōu)點之一。現(xiàn)在幾乎所有的統(tǒng)計機器翻譯系統(tǒng)都利用這一工具進行詞語對齊的訓(xùn)練。
2.語言模型訓(xùn)練工具SRILM
SRILM是一個建立和使用統(tǒng)計語言模型的開源工具包,從1995年開始由SRI 口語技術(shù)與研究實驗室(SRI Speech Technology and Research Laboratory)開發(fā),現(xiàn)在仍然不斷推出新版本,被廣泛應(yīng)用于語音識別、機器翻譯等領(lǐng)域。這個工具包包含一組C++類庫、一組進行語言模型訓(xùn)練和應(yīng)用的可執(zhí)行程序等。利用它可以非常方便地訓(xùn)練和應(yīng)用語言模型。給定一組連續(xù)的詞,調(diào)用SRILM提供的接口,可以得到這組詞出現(xiàn)的概率。
3. 機器翻譯的自動評測工具Mteval
在一些著名的統(tǒng)計機器翻譯國際評測中普遍使用自動評測與人工評測相結(jié)合的方法,例如美國國家技術(shù)和標(biāo)準研究所(NIST)舉行的評測。Mteval便是他們開發(fā)的自動評測工具,最新版本是mteval-11b.pl,是用Perl語言寫成的。
4. 首個基于短語的統(tǒng)計機器翻譯系統(tǒng)“法老”(Pharaoh)
“法老”是較早公開的統(tǒng)計機器翻譯系統(tǒng),由美國南加州大學(xué)信息科學(xué)實驗室(Information Science Institute)的菲利普•科恩(Philipp Koehn)在2004年做博士論文期間編寫的。“法老”包括兩大部分: 訓(xùn)練和解碼。訓(xùn)練過程用來從語料庫中獲得統(tǒng)計知識。它利用了已有的開源軟件GIZA++和SRILM,GIZA++用來訓(xùn)練詞語對齊,SRILM訓(xùn)練語言模型,但解碼沒有公開源代碼。“法老”原理簡單,易于使用,它的出現(xiàn)對于推動機器翻譯研究起到了非常大的作用。
5. 中國首個開源的統(tǒng)計機器翻譯系統(tǒng)絲路(SilkRoad)
“法老”的出現(xiàn)揭開了統(tǒng)計機器翻譯的神秘面紗,然而其核心部分――解碼器的源碼仍然沒有公開。為此,中國的研究人員聯(lián)合開發(fā)了一個完全開放源代碼的統(tǒng)計機器翻譯系統(tǒng)――“絲路”。該系統(tǒng)由中國的五家研究機構(gòu)和高校(中科院計算所、中科院自動化所、中科院軟件所、廈門大學(xué)、哈爾濱工業(yè)大學(xué))聯(lián)合開發(fā),并在2006年中國第二屆統(tǒng)計機器翻譯研討會上。“絲路”包括以下模塊: 語料預(yù)處理及后處理模塊“仙人掌”、詞語對齊模塊“樓蘭”、短語抽取模塊“胡楊”、以及三個解碼器(“駱駝”、“綠洲”和“商隊”)。這是第一次將一個完整的統(tǒng)計機器翻譯系統(tǒng)公開,極大地促進了國內(nèi)統(tǒng)計機器翻譯的快速發(fā)展。
6.摩西(Moses)
“摩西”是“法老”的升級版本,它增加了許多功能,是由英國愛丁堡大學(xué)、德國亞琛工業(yè)大學(xué)等八家單位聯(lián)合開發(fā)的一個基于短語的統(tǒng)計機器翻譯系統(tǒng)。來自這些單位的研究人員于2006年在約翰霍普金斯大學(xué)召開了一次研討會,利用6個星期的時間共同開發(fā)了這一系統(tǒng)。整個系統(tǒng)用C++語言寫成,從訓(xùn)練到解碼完全開放源代碼,可以運行在Windows平臺和Linux平臺。
7. 基于句法的統(tǒng)計機器翻譯系統(tǒng)GenPar
GenPar工具包實現(xiàn)了一個基于句法的統(tǒng)計機器翻譯系統(tǒng)。基于句法的方法將句法結(jié)構(gòu)信息引入到統(tǒng)計機器翻譯中來,目前已成為統(tǒng)計機器翻譯領(lǐng)域的研究熱點。但是構(gòu)建基于句法的統(tǒng)計機器翻譯系統(tǒng)遠比構(gòu)建基于短語的要困難得多,為了讓研究者們很快進入這一領(lǐng)域,在JHU2005夏季研討會上,由紐約大學(xué)艾•丹•米拉姆德(I. Dan Melamed)等人組成的統(tǒng)計機器翻譯組開發(fā)了GenPar。
GenPar的基本原理是利用多文本語法(Multi-Text Grammar)實現(xiàn)多語言的句法分析、結(jié)構(gòu)對齊和翻譯。多文本語法是一種多種語言的同步語法,理論上比較完善,功能強大。GenPar有很多特點:首先,該系統(tǒng)是一個純粹基于句法的模型,在翻譯過程中充分利用了句法結(jié)構(gòu)信息; 其次,它具有很好的定制能力,可以實現(xiàn)各種不同類型的基于同步語法的統(tǒng)計機器翻譯,很適合于作為實驗各種理論的研究平臺。總的來看,該系統(tǒng)功能比較強大,但由于其比較復(fù)雜,掌握起來比較困難,性能比現(xiàn)有的基于短語的模型稍差。(本文作者米海濤為中科院計算所博士研究生)
鏈接
統(tǒng)計機器翻譯第一人與Google
在統(tǒng)計機器翻譯中有一位頗具傳奇色彩的人物,就是畢業(yè)于德國亞琛工業(yè)大學(xué)的博士生弗朗茨•約瑟夫•歐赫(Franz Joseph Och)。在1999年他開發(fā)出了著名的IBM模型訓(xùn)練工具Giza。在2002年NIST評測中,取得第一名的亞琛工業(yè)大學(xué)的機器翻譯系統(tǒng)也是由他開發(fā)的。2002年,歐赫從亞琛工業(yè)大學(xué)畢業(yè)后進入美國南加州大學(xué)信息科學(xué)研究所(ISI/USC)工作,同時作為Language Weaver公司的顧問,后來于2004年加盟了谷歌(Google)公司。
他所工作的每一個單位都穩(wěn)拿當(dāng)年NIST機器翻譯評測的第一名。尤其是2005年的NIST評測中,他所在的谷歌公司開發(fā)的漢英機器翻譯系統(tǒng)取得了0.35的BLEU值,比第二名的南加州大學(xué)(即他原來所在的單位)系統(tǒng)的性能提高了近5個百分點。在2006年評測中,除了漢英機器翻譯的受限語料項目,其他所有項目的第一名都是谷歌公司。
解碼技術(shù)論文范文3
編解碼技術(shù)。多媒體通信的一個顯著特點就是要傳輸?shù)男畔⒘糠浅4螅绕涫且曨l數(shù)據(jù),其編解碼技術(shù)在較大程度上影響著業(yè)務(wù)的質(zhì)量。IPTV采用了先進高效的視頻壓縮編碼技術(shù),使得視頻流在800Kb/s的有限帶寬上接近DVD(MPEG2)的視覺效果(DVD的視頻傳輸帶寬通常為3Mb/s)。目前主要編解碼技術(shù)是MPEG4、H.264與AVS三種。MPEG系列是重要的視頻編碼標(biāo)準,所有的視頻編碼技術(shù)都參照了MPEG技術(shù)。H.264是新一代視頻編碼標(biāo)準,H.264的壓縮率是MPEG-2的2倍以上,是MPEG-4的1.5至2倍,這樣超高的壓縮率是以犧牲編碼運算量為代價的,但其解碼的運算量漲幅較小,比較容易實現(xiàn)用戶接收播放。AVS是中國擁有自主知識產(chǎn)權(quán)的第二代信源編碼標(biāo)準音視頻編碼技術(shù)標(biāo)準,是高清晰度數(shù)字電視、寬帶網(wǎng)絡(luò)流媒體、移動多媒體通信、激光視盤等數(shù)字音視頻產(chǎn)業(yè)群的基礎(chǔ)性標(biāo)準。
流媒體傳送技術(shù)。對于傳送IPTV音視頻數(shù)據(jù)流而言,流媒體傳送技術(shù)極其重要,先進的技術(shù)可以節(jié)約系統(tǒng)帶寬、減輕系統(tǒng)負擔(dān)、優(yōu)化系統(tǒng)。流媒體傳送系統(tǒng)主要設(shè)備是中心/邊緣流媒體服務(wù)器與存儲分發(fā)網(wǎng)絡(luò)。流媒體服務(wù)器具有較高的穩(wěn)定性,支持多個并發(fā)流和直播流的需求,而存儲分發(fā)網(wǎng)絡(luò)由多個服務(wù)器組成,通過負載均衡(如CDN)來大規(guī)模組網(wǎng)。CDN網(wǎng)絡(luò)除了提高用戶響應(yīng)速度之外,還有一個更為重要的作用,就是減輕巨大的數(shù)據(jù)流量對骨干網(wǎng)的壓力。
數(shù)字版權(quán)管理(Digital Rights Management,DRM)。它是保護多媒體內(nèi)容免受未經(jīng)授權(quán)的播放和復(fù)制的一種方法,為內(nèi)容提供者提供視頻、音樂、彩鈴、論文、圖片等數(shù)字數(shù)據(jù)免受非法復(fù)制和使用保護的一種手段。數(shù)字多媒體內(nèi)容是IPTV中最為關(guān)鍵的節(jié)目來源。有了DRM技術(shù),可使各個平臺(無論是因特網(wǎng)、流媒體還是交互數(shù)字電視)的內(nèi)容提供商們放心地提供更多的內(nèi)容,采取更靈活的節(jié)目銷售方式,同時有效地保護知識產(chǎn)權(quán)。
IP機頂盒技術(shù)。IPTV系統(tǒng)的接收端包括計算機、電視機與手機。由于電視機本身并沒有存儲功能,不支持軟件安裝,也無法像手機那樣加裝流媒體支持功能,因而無法實現(xiàn)IP的支持功能,必須加裝一個IP數(shù)據(jù)流轉(zhuǎn)換成電視機可以接收的信號的機頂盒才能收看IPTV節(jié)目。機頂盒應(yīng)具備數(shù)據(jù)轉(zhuǎn)換、接入支持、協(xié)議支持、業(yè)務(wù)支持、解碼支持等功能。
在廣電系統(tǒng)數(shù)字電視平移模式中,杭州模式對IPTV技術(shù)的應(yīng)用最為成功。杭州數(shù)字電視模式實質(zhì)上就是用以太網(wǎng)接入,只是最后一段線路即樓道交換機到戶內(nèi)終端使用的是同軸電纜,它成功地將IPTV技術(shù)和廣電的數(shù)字電視進行了結(jié)合。現(xiàn)在,其他省市的廣電系統(tǒng)已經(jīng)在以杭州模式為示范建設(shè)自己的廣電網(wǎng)絡(luò)。江西省的情況和杭州的實際情況有差別,不具有發(fā)展IPTV業(yè)務(wù)的優(yōu)勢平臺,所以我們不能停留于模仿層面,而應(yīng)該在總結(jié)先行者的經(jīng)驗中,尋找更好的在廣電網(wǎng)絡(luò)中運用IPTV技術(shù)的方法。
一、數(shù)字電視平移是廣電網(wǎng)絡(luò)追求效益的增長點。IPTV能夠提供多種形式的內(nèi)容服務(wù),傳輸電視節(jié)目只是其功能應(yīng)用的一部分,它還可以提供其他的電視類業(yè)務(wù)、通信類業(yè)務(wù)和各種增值業(yè)務(wù),滿足我們的各種需求。
二、增加多種形式的內(nèi)容服務(wù)要求更寬的帶寬來進行傳輸,IPTV采用的編碼和壓縮技術(shù)是最新的高效視頻壓縮技術(shù),它壓縮了數(shù)據(jù),節(jié)約了帶寬。同時IPTV可以在傳輸?shù)倪^程中把視頻內(nèi)容按IP協(xié)議封裝成數(shù)據(jù)包,能根據(jù)用戶不同的需要,靈活解決網(wǎng)絡(luò)傳輸?shù)膯栴}。如果用戶的頻帶寬,就可以壓縮率低一些,傳的包多一些,質(zhì)量好一點;如果用戶對節(jié)目的清晰度沒有太高的要求,可以采用壓縮率高一些,傳的包少一些。這也解決了江西省現(xiàn)有SDH網(wǎng)絡(luò)帶寬不足、無法繼續(xù)添加業(yè)務(wù)的問題。
三、真正實現(xiàn)互動是IPTV最重要的一個優(yōu)勢。IPTV不僅能滿足受眾觀看節(jié)目的個性化需求,而且能讓受眾參與到電視節(jié)目中來,與電視臺一起完成節(jié)目。
解碼技術(shù)論文范文4
[關(guān)鍵詞]圖像壓縮;圖像編碼;壓縮標(biāo)準
中圖分類號:Tp311 文獻標(biāo)識碼:A 文章編號:1009-914X(2014)45-0358-01
0 引言
當(dāng)今社會正處于高速發(fā)展的信息時代,而信息本身就需要進行存儲、圖像信息是人類認識世界和感知世界的重要源泉。圖像具有確切性、直觀性、高效性、時空性等特征,圖像信息的這些特性導(dǎo)致它的數(shù)據(jù)量特別龐大。圖像壓縮就是對數(shù)值矩陣進行處理,用相對少的數(shù)據(jù)來表示這個數(shù)值矩陣。這個過程要在圖像數(shù)據(jù)存儲、處理和傳輸之前進行,在這之后要對壓縮過的圖像進行解壓縮來重建圖像,這就是圖像壓縮和解壓縮,也稱圖像編碼和圖像解碼。
1 圖像壓縮的原理
從信息論的觀點來看,圖像作為一個信源,描述信源的數(shù)據(jù)是信息量和信息冗余量之和。所以在圖像數(shù)據(jù)的表示中存在著大量的冗余,如時間冗余、空間冗余、知識冗余、視覺冗余等,可以利用圖像本身的一些特點和人眼的視覺特性,去除這些冗余數(shù)據(jù)就可以使原始圖像數(shù)據(jù)量極大的減少,從而解決圖像數(shù)據(jù)量龐大的問題,實現(xiàn)圖像數(shù)據(jù)壓縮。
2 經(jīng)典圖像編碼
2.1 變換編碼
很多圖像編碼的原理是通過消除圖像的冗余度來達到壓縮的目的,而變換編碼則是改變了冗余度的表達方法,將原始數(shù)據(jù)用另一種更加緊湊的方法表示,有時可以實現(xiàn)更高的數(shù)據(jù)壓縮。離散余弦變換(DCT)即是一種分形變換編碼。DTC的出色之處是能將大部分圖像分成像塊,使像塊的能量集中到少數(shù)低頻DTC系數(shù)上,這樣一來DCT可以將圖像的能量很大程度的集中在一起,為壓縮打下了基礎(chǔ)。
2.2 嫡編碼
嫡編碼的原理是根據(jù)消息或消息序列出現(xiàn)概率的分布特性來尋找概率和碼字長度間的最優(yōu)匹配。游程編碼、霍夫曼編碼和算術(shù)編碼等都是目前使用較多的嫡編碼。
3 現(xiàn)代圖像編碼
現(xiàn)代圖像編碼和經(jīng)典圖像編碼的區(qū)別之處在于它不是像經(jīng)典圖像編碼那樣盡量去除圖像的相關(guān)性,而是利用圖像的相關(guān)性進行編碼。
3.1 分形編碼
分形編碼是一種直接在空間域?qū)ふ也⒆畲笙薅鹊乩脠D像的自相似性的編碼方法。
3.2 模型基圖像編碼
模型基圖像編碼主要是利用圖像的區(qū)域、輪廓等二維特征以及形狀、運動軌跡等三維特征進行建模,然后對圖像和模型進行分析得出模型的各種參數(shù),再對參數(shù)進行編碼傳輸,解碼端則由圖像綜合恢復(fù)出圖像。這種編碼方式可以實現(xiàn)較高的壓縮比,圖像的恢復(fù)質(zhì)量也有了大大的提高。
3.3 小波變換技術(shù)
小波變換理論是新的數(shù)學(xué)分支,其基本思想是將原始圖像通過一族小波函數(shù)轉(zhuǎn)換為小波域的系數(shù),再通過略去某一閾值下的系數(shù),保留部分原始能量保留較多的系數(shù)來壓縮圖像。在小波變換中,圖像被分解為不同空間、不同頻率的子圖像,一幅圖像每經(jīng)過一次小波變換,圖像就被分解為四幅大小為原來的四分之一的小塊頻帶區(qū)域,再將這四幅子圖針對人的視覺特點分別進行不同的編碼處理,可以得到比較高的壓縮比和好的壓縮質(zhì)量。
4 圖像壓縮的分類
圖像壓縮一般根據(jù)圖像數(shù)據(jù)是否有丟失分為有損壓縮和無損壓縮兩類,無損壓縮是理想的壓縮方法(無信息丟失),也稱可逆壓縮。有損壓縮也稱不可逆壓縮,經(jīng)過有損壓縮后,重建圖像中像素的值和原始圖像中對應(yīng)的像素的值不完全相等,圖像會發(fā)生畸變。
圖像無損壓縮編碼方法可分為兩大類:基于統(tǒng)計概率的算法和基于字典技術(shù)的算法。基于統(tǒng)計概率的算法是根據(jù)信息論中的變長編碼定理和信息嫡的相關(guān)知識,用較短的代碼代表出現(xiàn)概率大的符號,用較長代碼代表出現(xiàn)概率小的符號,從而實現(xiàn)數(shù)據(jù)壓縮。而基于字典技術(shù)生成的文件包含的是定長編碼,每個碼代表原文件中的一個特定序列。
和無損壓縮不同的是,有損壓縮編碼在圖像進行解碼還原之后的準確度上要求沒有那個高,因此會產(chǎn)生一定程度上的失真,但這種編碼方式可以提高圖像的壓縮能力。一般情況下,這種失真人眼看起來可能會比較明顯,也可能不明顯,不管是哪種,只要在人眼的容忍范圍之內(nèi),就說明這種壓縮時可行的。
5 圖像壓縮標(biāo)準
隨著圖像處理技術(shù)的發(fā)展,研究人員提出了多種圖像壓縮標(biāo)準。常用的圖像壓縮標(biāo)準分為靜止圖像壓縮標(biāo)準和視頻圖像壓縮標(biāo)準。
目前最常用的靜止圖像壓縮標(biāo)準是JPEG圖像壓縮標(biāo)準。JPEG標(biāo)準定義基于DCT得有損基本編碼系統(tǒng)、面向大規(guī)模壓縮得擴展的編碼系統(tǒng)和面向可逆壓縮的無損獨立編碼系統(tǒng)。JPEG具有有失真和無失真兩種編碼解碼的處理方式,其中無失真得到的解碼后圖像和原圖像數(shù)據(jù)基本相同,但壓縮率較低,而有失真可以實現(xiàn)高的壓縮比,但同時可能會導(dǎo)致圖像的失真較明顯。壓縮比的高低可以在算法中改變壓縮參數(shù)來調(diào)整。JPEG標(biāo)準的計算量不算很大,算法也易于實現(xiàn),所以具有較好的實用性能。
隨著多媒體技術(shù)的快速發(fā)展和廣泛應(yīng)用,為滿足用戶對更高壓縮效率和對壓縮圖像的互動性和可伸縮性的要求,JPEG2000應(yīng)運而生的。
JPEG2000標(biāo)準可以實現(xiàn)很高的壓縮性能,它還具有只對感興趣區(qū)域編碼、可進行有損壓縮和無損壓縮、對錯誤的魯棒性、對碼流做隨機訪問等特性。靈活使用這些特征,不僅可以達到很高的壓縮比,還可以滿足在移動和網(wǎng)絡(luò)環(huán)境下交互操作和可伸縮性的要求。JPEG2000的需求針對性以及技術(shù)先進性保證了它光明的應(yīng)用前景。
6 圖像壓縮性能的評價
一個圖像壓縮方法性能的評價主要從兩個方面來衡量:壓縮比和圖像質(zhì)量評價。壓縮比就是原始圖像文件大小與壓縮后生成文件大小的比值,比值越大,說明壓縮率越高。圖像質(zhì)量評價一般是通過保真度準則來判斷。保真度準則有兩種:客觀保真度準則和主觀保真度準則。
6.1 客觀保真度準則
客觀保真度準則是對解碼圖像和原始圖像的誤差進行定量計算的一種衡量標(biāo)準,一般是對整個圖像或者圖像中的某個指定區(qū)域進行某種平均計算得到均方誤差。
6.2 主觀保真度準則
圖像經(jīng)壓縮編碼和解碼還原之后,圖像質(zhì)量的好壞還有一個直接的評價者就是人眼,因此人的主觀印象也是衡量一個圖像壓縮編碼的重要因素。主觀保真度準則的實施過程是選定若干評價者對待評圖像打分,對這些分數(shù)求個平均值可以得到主觀評價分。但因為個體評價會受到個人喜好、光線、距離等因素的影響,很難對其制定一個統(tǒng)一的標(biāo)準,所以圖像的主觀質(zhì)量評價方法受到了一定的限制。
參考文獻
[1] 張偉.基于小波變換的圖像壓縮系統(tǒng)研究[D].廈門大學(xué)碩士論文.2005.2.
[2] 向輝.基于小波理論的圖像壓縮算法研究[D].華東師范大學(xué)碩士論文.2006.7.
[3] 張躍飛.基于稀疏分解的圖像壓縮[D].西南交通大學(xué)碩士論文.2006.9.
[4] 雷萌.數(shù)據(jù)壓縮算法的比較研究[J].2014.11.
注:基金項目:2012年民族學(xué)院校內(nèi)項目“基于哈希表的數(shù)據(jù)壓縮算法研究”,項目編號:12myZ05
作者簡介
解碼技術(shù)論文范文5
關(guān)鍵詞: VoIP; QoS; 編解碼; 顫音緩存; 語音通信質(zhì)量
中圖分類號:TP39 文獻標(biāo)志碼:A 文章編號:1006-8228(2013)07-17-02
0 引言
隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展和WiFi入網(wǎng)限制的解除,VoIP技術(shù)得到廣泛的應(yīng)用。通過無線移動通訊網(wǎng)絡(luò)的VoIP業(yè)務(wù),用戶手機可利用WiFi接入互聯(lián)網(wǎng),然后利用互聯(lián)網(wǎng)發(fā)送和接收語音數(shù)據(jù)。近兩年,隨著智能手機的迅速崛起,這種方式漸漸得到了人們的青睞,越來越多的人選擇以這種方式代替原有的通話模式。但是,由于網(wǎng)絡(luò)無法提供嚴格的QoS保障,以及時延和時延抖動等原因,使得無線通訊網(wǎng)絡(luò)中VoIP的傳輸質(zhì)量不夠理想。因此,研究如何提高VoIP語音的通信質(zhì)量有重要意義。
1 VoIP的關(guān)鍵技術(shù)
VoIP即Voice Over IP的縮寫,它是將模擬音頻信號進行采樣、壓縮、打包等一系列處理后,以IP數(shù)據(jù)報的形式在IP分組交換網(wǎng)絡(luò)上進行傳輸。簡單地說,它是將模擬話音轉(zhuǎn)換成可以在網(wǎng)絡(luò)中傳輸?shù)臄?shù)字信號。
在建立VoIP通話之前,先要進行呼叫,完成這一任務(wù)的信令系統(tǒng)。建立呼叫之后要對數(shù)據(jù)流進行實時傳輸,這就需要一種實時傳輸技術(shù)。要使音頻信號在分組交換網(wǎng)絡(luò)傳輸,還需要把模擬音頻信號轉(zhuǎn)成數(shù)字信號,并進行適當(dāng)?shù)膲嚎s、編碼以適應(yīng)這種傳輸環(huán)境,這就需要在傳輸之前對音頻進行編碼。在傳輸過程中,還需要對通話服務(wù)質(zhì)量進行實時監(jiān)控,因此還需要一種 QoS質(zhì)量保障技術(shù)來完成這個工作。VoIP中的關(guān)鍵技術(shù)總結(jié)起來就是:信令技術(shù)、語音編碼技術(shù)、實時傳輸技術(shù)、QoS質(zhì)量保障技術(shù)[1]。
1.1 信令技術(shù)
所謂信令技術(shù),可以理解為是一種控制機制。在VoIP系統(tǒng)中常用的信令技術(shù)有兩個:一個是由國際電信標(biāo)準(ITU一T)制定的H.323;另一個是由因特網(wǎng)工作組(IETF)制定的會話初始協(xié)議SIP。這兩種技術(shù)相比,H.323是一個完整的體系,提供了完成VoIP通信的所有子協(xié)議,但是由于H.323更龐大與復(fù)雜,不易于管理與維護,并且它不是一個開放性的協(xié)議。與此相比,SIP則顯得更靈活,擴展性強。SIP協(xié)議只提供會話建立、呼叫控制的功能,因而建立呼叫的時間相對較短,SIP還需要與其他協(xié)議協(xié)同合作完成VoIP的具體通話任務(wù)。SIP協(xié)議目前已被廣泛應(yīng)用到IMS網(wǎng)絡(luò)中,負責(zé)VoIP業(yè)務(wù)的實現(xiàn)。
1.2 語音編碼技術(shù)
由于傳輸用到的帶寬有限,因此需要將數(shù)據(jù)壓縮得盡可能小,來降低傳輸比特率。目前主流的編碼技術(shù)有波形編碼、參量編碼和混合編碼。VoIP應(yīng)用中主流的波形編碼有 G.711、G.721、G.723、G.726和G.727,而G.728、G.729、Speex等則是主流的參數(shù)和混合編碼。這些編碼各有自己獨特的算法,速率、復(fù)雜度也不盡相同。
1.3 實時傳輸技術(shù)
實時傳輸技術(shù)用來保障壓縮數(shù)據(jù)可以有序,同步地到達接收方,便于接收方對數(shù)據(jù)進行解碼。目前VoIP系統(tǒng)中的實時傳輸技術(shù)主要是通過RTP協(xié)議實現(xiàn)的[2]。
1.4 QoS質(zhì)量保障技術(shù)
為了保障服務(wù)質(zhì)量,VoIP采用了資源預(yù)留協(xié)議RSVP以及實時傳輸控制協(xié)議RTCP。
RSVP信令協(xié)議,可以為網(wǎng)絡(luò)上的任何終端、主機之間建立的路徑保留帶寬,為數(shù)據(jù)傳輸預(yù)定、保證 QoS。RTCP在進程之間交換控制信息,對傳輸質(zhì)量進行管理。在 RTP會話期間,參加會話的成員會間隔的傳送包含了已發(fā)送數(shù)據(jù)包數(shù)量、丟包數(shù)量等統(tǒng)計數(shù)據(jù)的RTCP包。利用這些信息,服務(wù)器就可以動態(tài)調(diào)整傳輸速率乃至改變載荷類型。RTCP和RTP一般捆綁使用,可以有效地反饋,優(yōu)化傳輸效率[1]。
2 影響VoIP語音質(zhì)量的因素
由于VoIP業(yè)務(wù)是通過因特網(wǎng)來傳輸封包,因此會產(chǎn)生封包延遲、掉包等。影響VoIP語音質(zhì)量的因素主要有:時延、時延抖動、丟包率。
2.1 時延
數(shù)據(jù)從發(fā)話端傳輸?shù)浇邮斩怂枰臅r間即形成了時延。語音通信系統(tǒng)中,時延的增加會讓通話雙方感覺話音傳輸?shù)耐nD感,同時也會造成回音。對于公用電話網(wǎng),延時一般只有50~70ms,而IP電話的延時較大、通常為150~250ms,因此,VoIP系統(tǒng)的時延一般控制在100ms~150ms內(nèi),否則語音質(zhì)量難以保證。VoIP系統(tǒng)中,時延由存儲轉(zhuǎn)發(fā)時延,傳播時延及處理時延組成。
2.2 時延抖動
在一個VoIP呼叫過程中,所有發(fā)送的數(shù)據(jù)包經(jīng)不同路徑到達目的地的時間差異即形成了時延抖動。VoIP不同于傳統(tǒng)PSTN網(wǎng)絡(luò),以固定速率進行傳輸,由于它在IP網(wǎng)絡(luò)上存在不同路由,而導(dǎo)致同一數(shù)據(jù)包之間也會有不同的時延,存在傳輸時間差,因此產(chǎn)生抖動 [3]。
2.3 丟包率
IP數(shù)據(jù)包傳輸?shù)倪^程中,丟失的數(shù)據(jù)包數(shù)量占所發(fā)送數(shù)據(jù)包總量的比率即形成了丟包率指。不僅數(shù)據(jù)包在網(wǎng)絡(luò)中間傳輸過程中可能產(chǎn)生丟包,當(dāng)話音網(wǎng)絡(luò)中超出抖動緩沖區(qū)所能承受的最大時延時也會產(chǎn)生丟包。丟包會造成話音信息的缺失,嚴重時會導(dǎo)致話音的不連貫,甚至無法準確收聽到對方的話音。丟包率主要與網(wǎng)絡(luò)的流量有關(guān),它是影響話音質(zhì)量的重要因素。通常情況下,語音業(yè)務(wù)的丟包率須要控制在1%以內(nèi)。
3 改善VoIP語音通信質(zhì)量的方法
為了保證VoIP通話的要求,可以從以下幾個方面進行改善。
3.1 優(yōu)化網(wǎng)絡(luò)環(huán)境
通過增加DSL或其他設(shè)備的頻寬,使得語音質(zhì)量得到改善。需要注意編解碼所占頻寬的大小,還應(yīng)該考慮封包成本。例如,G.711雖然只占64kbps,但是把封包成本計算在內(nèi),所需的實際頻寬超過100kbps。改善網(wǎng)絡(luò)環(huán)境就會增加投資成本,包括更換設(shè)備和增加頻寬。而且,由于網(wǎng)絡(luò)跨越范圍很廣,眾多設(shè)備當(dāng)中可能有部分會發(fā)生故障,這時就會使得丟包率瞬間提高,這對于需要即時傳輸?shù)恼Z音封包來說有致命的影響。
3.2 選擇合適的編解碼
選擇合適的編解碼可以對抗瞬間爆發(fā)的丟包率。在窄頻環(huán)境中可使用iLBC,寬帶環(huán)境中可使用ISAC或G.711,這些編解碼可以在丟包率超過20%的情況下,MOS值仍然超過3.0的優(yōu)異效果。在選擇合適的編解碼的同時,還要保證當(dāng)前頻寬能夠滿足編解碼的需求。如:iLBC至少在30kbps以上,G.711至少在80kbps以上。
3.3 服務(wù)質(zhì)量保障(QoS)
QoS是將不同的封包(協(xié)議)進行標(biāo)簽化處理,使得帶有特定標(biāo)簽的封包(協(xié)議)能夠被優(yōu)先處理并傳送。QoS的算法多達數(shù)十種,有的機制可以通過結(jié)合其他的規(guī)則使得效果加以優(yōu)化。有的機制將不同的封包(協(xié)議)通過優(yōu)先等級隊列的方式,來保證優(yōu)先級別高的封包(協(xié)議)可以“插隊”處理與傳送。有的機制是將可用的帶寬進行分割、編制等級,讓不同的封包(協(xié)議)以不同的帶寬傳輸。更復(fù)雜的算法設(shè)計,還能使用“借用頻寬”的方式來加速封包的傳送。設(shè)備端能判斷鄰近的頻寬是否使用中,如果發(fā)現(xiàn)“隔壁”頻寬并未使用,就可以允許特定封包(協(xié)議)借用隔離的頻寬。有些算法甚至于針對優(yōu)先等級來決定頻寬借用問題,高優(yōu)先等級的封包(協(xié)議)可以借用低優(yōu)先等級的頻寬。反之,低優(yōu)先等級的封包或協(xié)議無法借用高優(yōu)先等級的頻寬[4]。
在VoIP系統(tǒng)中,通過QoS的技術(shù)雖然能確保語音封包優(yōu)先處理與傳送,但是如果此時網(wǎng)絡(luò)環(huán)境不良,優(yōu)先傳送的封包發(fā)生丟包情形,語音質(zhì)量依舊會發(fā)生不穩(wěn)定或不良的情形。
3.4 使用顫音緩存
顫音是由于封包遲延產(chǎn)生的,可以在設(shè)備接受端使用部分內(nèi)存作為緩沖區(qū),將沒有到達的封包緩存,并對其進行排序,再按序播放,這樣可以改善顫音的現(xiàn)象。從理論上來講,緩存區(qū)越大效果越好,但是這樣會占用寶貴的內(nèi)存資源。而且,由于聲音是實時的,顫音的處理要在有限時間內(nèi)完成,因此,太大的緩存空間不但浪費內(nèi)存,而且還可能使封包延遲更嚴重。
4 結(jié)束語
經(jīng)過上述分析可知,要想提高VoIP語音的通信質(zhì)量,需要綜合多方面的因素考慮、權(quán)衡。要想徹底改變語音質(zhì)量應(yīng)該通過改善網(wǎng)絡(luò)環(huán)境,增加頻寬來實現(xiàn)。但是當(dāng)網(wǎng)絡(luò)環(huán)境無法在短期內(nèi)得到改善時,選擇合適的編解碼將優(yōu)于傳統(tǒng)的QoS的效果。本文提出的方法,將對VoIP系統(tǒng)語音通信質(zhì)量的提高,推動VoIP業(yè)務(wù)的普及具有實際意義。
參考文獻:
[1] 林輝.基于SIP的嵌入式AndroidVoIP語音終端的研究與實現(xiàn)[D].華南理工大學(xué)碩士學(xué)位論文,2012.
[2] 徐韜.基于Android終端的小型VoIP系統(tǒng)設(shè)計與實現(xiàn)[D].大連理工大學(xué)碩士學(xué)位論文,2011.
解碼技術(shù)論文范文6
摘
要
隨著Internet的迅猛發(fā)展,人們已經(jīng)不滿足于在網(wǎng)絡(luò)上傳輸簡單的文本圖像信息,更加豐富的多媒體信息,特別是連續(xù)的媒體內(nèi)容(視頻和音頻)已經(jīng)開始在互聯(lián)網(wǎng)上普及。通過網(wǎng)絡(luò)傳輸連續(xù)媒體數(shù)據(jù)為人們呈現(xiàn)出一個極具吸引力的信息交流場景。為了適應(yīng)這種新的需求,視頻編碼的目標(biāo)逐漸由傳統(tǒng)的面向存儲變?yōu)楝F(xiàn)在的面向傳輸。
本文首先分析了Internet環(huán)境下多媒體數(shù)據(jù)傳輸?shù)母鞣N解決方法,討論適合網(wǎng)絡(luò)傳輸?shù)囊曨l編解碼方案。在目前的Internet環(huán)境下,由于網(wǎng)絡(luò)的異構(gòu)性和傳輸速率的不穩(wěn)定性,媒體流數(shù)據(jù)在傳輸?shù)倪^程中會出現(xiàn)延時、丟失等意外狀況,影響了傳輸?shù)馁|(zhì)量。針對這個問題,國內(nèi)外的學(xué)者提出了各種解決方案,主要從網(wǎng)絡(luò)體系結(jié)構(gòu)和視頻編解碼框架兩個方面進行考慮。然而網(wǎng)絡(luò)體系結(jié)構(gòu)的改變不是一朝一夕的事情,因此,設(shè)計新的適合網(wǎng)絡(luò)傳輸?shù)囊曨l編碼算法成為本文研究的重點。
在目前實際應(yīng)用的網(wǎng)絡(luò)多媒體技術(shù)中,流媒體技術(shù)是主要的應(yīng)用成果。本文以最新的流媒體解決方案為基礎(chǔ)設(shè)計了一個網(wǎng)絡(luò)多媒體教學(xué)系統(tǒng),通過該系統(tǒng)的設(shè)計與實現(xiàn),本文分析了現(xiàn)有網(wǎng)絡(luò)多媒體技術(shù)在Internet環(huán)境下所存在的不足。針對這些缺陷,本文提出了一個改進型FGS編碼框架。該框架以基本的FGS編碼方案為基礎(chǔ),引入了改進的預(yù)測算法和碼率的自適應(yīng)策略等新技術(shù)。通過實驗結(jié)果證明,該框架在一定的條件下提高了FGS算法的性能。
最后,本文對分析結(jié)果進行了總結(jié),提出了相應(yīng)的觀點和對未來網(wǎng)絡(luò)多媒體數(shù)據(jù)傳輸發(fā)展方向的展望。
關(guān)鍵詞:面向傳輸,流媒體,精細可擴展性
:34000多字的工學(xué)碩士學(xué)位論文
有中英文摘要、目錄、參考文獻、大量圖片
400元