前言:中文期刊網(wǎng)精心挑選了計(jì)算機(jī)視覺的研究方向范文供你參考和學(xué)習(xí),希望我們的參考范文能激發(fā)你的文章創(chuàng)作靈感,歡迎閱讀。
計(jì)算機(jī)視覺的研究方向范文1
【關(guān)鍵詞】農(nóng)產(chǎn)品 計(jì)算機(jī)視覺技術(shù) 品質(zhì)檢測
農(nóng)產(chǎn)品品質(zhì)檢測工作中除了采取人工檢測法以外,還可以采取半自動(dòng)或自動(dòng)檢測法,如在水果分級(jí)檢測工作中的質(zhì)量分級(jí)檢測法、光電分選法以及大小分級(jí)法等。然而農(nóng)產(chǎn)品品質(zhì)會(huì)受到自然生長環(huán)境或人為因素等方面的影響,農(nóng)產(chǎn)品的色澤、大小及形狀等并不相同,無法采取單一指標(biāo)進(jìn)行檢測。因此充分應(yīng)用計(jì)算機(jī)視覺技術(shù),對農(nóng)產(chǎn)品的品質(zhì)進(jìn)行檢測,極為重要。
1 計(jì)算機(jī)視覺技術(shù)
計(jì)算機(jī)視覺技術(shù)又被稱為機(jī)器視覺技術(shù),指的是通過人類設(shè)計(jì),在計(jì)算機(jī)環(huán)境下,達(dá)到再現(xiàn)或模擬人類視覺相關(guān)的職能行為的一種技術(shù),包括了印刷和手寫文字的識(shí)別技術(shù),圖像模式識(shí)別技術(shù),物體三維表面形狀識(shí)別技術(shù)、距離識(shí)別以及速度感知等技術(shù)。該技術(shù)是諸多學(xué)科的結(jié)合與交叉,涉及到數(shù)學(xué)、生理學(xué)、信息處理、物理學(xué)、光學(xué)以及計(jì)算機(jī)等多種學(xué)科。探究計(jì)算機(jī)視覺技術(shù)的目的在于實(shí)驗(yàn)人類視覺的再現(xiàn)及延伸,即再現(xiàn)高等動(dòng)物的視覺系統(tǒng),并對物體形狀以及類別進(jìn)行識(shí)別。
此外,計(jì)算機(jī)視覺技術(shù)處理的原始資料多是圖像,所以該技術(shù)和圖像處理以及模擬識(shí)別等有著緊密的聯(lián)系?,F(xiàn)階段,計(jì)算機(jī)視覺技術(shù)在諸多領(lǐng)域有著較為廣泛的運(yùn)用,包括了醫(yī)學(xué)輔助診斷、資源調(diào)查、衛(wèi)星圖像解釋、軍事指導(dǎo)、災(zāi)害監(jiān)測、氣象以及工業(yè)產(chǎn)品的外觀篩選及檢測等。同時(shí)研究該技術(shù)在農(nóng)業(yè)工程領(lǐng)域中的應(yīng)用,也成為了熱門話題。
2 在農(nóng)產(chǎn)品品質(zhì)檢測中,計(jì)算機(jī)視覺技術(shù)的具體應(yīng)用
筆者在查閱相關(guān)文獻(xiàn)資料的基礎(chǔ)上,探究在農(nóng)產(chǎn)品品質(zhì)檢測工作中,計(jì)算機(jī)視覺技術(shù)在產(chǎn)品表面缺陷以及損傷識(shí)別工作中的具體應(yīng)用;果形識(shí)別工作中的具體應(yīng)用;農(nóng)產(chǎn)品尺寸以及面積檢測工作中的具體應(yīng)用。
2.1 在產(chǎn)品表面缺陷以及損傷識(shí)別工作中的具體應(yīng)用
在對農(nóng)產(chǎn)品進(jìn)行分級(jí)的過程中,依然存在著一大問題,即農(nóng)產(chǎn)品表面缺損以及損傷識(shí)別。而早在1984年就已經(jīng)出現(xiàn)了采取線掃描和模擬攝像機(jī)針對蘋果表面損傷進(jìn)行檢測的實(shí)驗(yàn)報(bào)道,實(shí)驗(yàn)結(jié)果顯示,采取數(shù)據(jù)技術(shù)能夠檢測出蘋果表面損傷,其檢測結(jié)果完全能夠達(dá)到人工分級(jí)的精度。與此同時(shí),還出現(xiàn)了一種機(jī)器視覺系統(tǒng),該系統(tǒng)將不規(guī)則的圖像信息與正常的圖像信息區(qū)分開來,在去除蔬菜內(nèi)的雜物以及檢測農(nóng)產(chǎn)品的污點(diǎn)等方面能夠取得較好的應(yīng)用效果。此外,在1989年,國外出現(xiàn)了一種全新的計(jì)算方法,即運(yùn)用紅外線掃描攝像機(jī),處理蘋果表面的灰度圖像,既能夠確定蘋果表面的損傷面積,還能夠區(qū)分不同損傷區(qū)。然而還技術(shù)是以機(jī)械裝置的設(shè)定為基礎(chǔ),需要消耗2s的時(shí)間,對一個(gè)蘋果進(jìn)行檢測,蘋果表面缺陷分級(jí)精度以及損傷分級(jí)進(jìn)度并不高。
我國在1997年,出現(xiàn)了運(yùn)用計(jì)算機(jī)圖像處理技術(shù)對蘋果損壞自動(dòng)化檢測的試驗(yàn)研究,該試驗(yàn)結(jié)果顯示,該技術(shù)的損壞檢出率較高,能夠規(guī)避果梗區(qū)以及花萼區(qū)對于壞損區(qū)域識(shí)別的具體影響,且該檢測技術(shù)的魯棒性較強(qiáng)。
2.2 在果形識(shí)別工作中的具體應(yīng)用
果形識(shí)別是影響水果質(zhì)量的重要因素之一,對于水果品質(zhì)檢測有著重大意義。當(dāng)水果成熟后,水果的外形將會(huì)發(fā)生巨大的改變,且無法采取數(shù)學(xué)方法進(jìn)行鑒別,采取其他方式進(jìn)行果形識(shí)別極為重要。
在1981年,有研究人員就針對形狀識(shí)別中的圖像特征進(jìn)行了探討,提倡采取結(jié)構(gòu)分析法以及外形輪廓曲線檢測法,針對水果外形進(jìn)行識(shí)別。并在1985年,以數(shù)字圖像分析技術(shù)以及模式識(shí)別技術(shù)為依據(jù),針對番茄定向、番茄形狀、表面缺陷以及尺寸進(jìn)行分類的特殊算法,運(yùn)用灰度梯度曲線,明確番茄表面缺陷以及花萼位置等。而我國則在2000年,按照果實(shí)形狀分析,通過連續(xù)性指標(biāo)、半徑指標(biāo)、連續(xù)指標(biāo)對稱性、半徑指標(biāo)對稱性等特征參數(shù),表示果形,并首次采取參數(shù)形狀分析法。
2.3 在農(nóng)產(chǎn)品尺寸以及面積檢測工作中的具體應(yīng)用
農(nóng)產(chǎn)品分級(jí)中,以農(nóng)產(chǎn)品外形尺寸為依據(jù)。在1987年,國外就已經(jīng)開始研究機(jī)械視覺技術(shù)在牡蠣肉分級(jí)以及尺寸檢測工作中的具體應(yīng)用。并在1992年,針對人工檢測以及機(jī)器視覺檢測進(jìn)行進(jìn)行了對比分析,試驗(yàn)結(jié)果顯示,和人工檢測技術(shù)相比,采取視覺檢測技術(shù),能夠提高檢測的精確度,減少檢測消耗時(shí)間;同時(shí)在評價(jià)以及推廣種質(zhì)資源中,準(zhǔn)確的測量以及詳細(xì)的記錄種質(zhì)形態(tài)的指標(biāo),有著極為重要的意義。為了能夠精確、快速地計(jì)算出玉米種質(zhì)尺度,在1995年,有研究人員就提出了自動(dòng)化選擇技術(shù),該技術(shù)在處理玉米種質(zhì)圖像中,其辨別精度極高。
而我國在2002年,有研究人員就針對水果品質(zhì)進(jìn)行動(dòng)態(tài)、實(shí)時(shí)監(jiān)測的智能化分級(jí)生產(chǎn)線進(jìn)行了研究,該生產(chǎn)線,首先通過水果輸送翻轉(zhuǎn)系統(tǒng),利用滾筒式輸送翻轉(zhuǎn)裝置,將水果往前輸送,在輸送過程中,以水平軸為中心,保證水果表面能夠被系統(tǒng)檢測到,以此獲得圖像信息。然后利用計(jì)算機(jī)視覺識(shí)別系統(tǒng),對水果等級(jí)進(jìn)行判斷,明確圖像信息。該系統(tǒng)具備了視覺識(shí)別功能。最終通過分級(jí)系統(tǒng),完成水果分級(jí)工作。
3 結(jié)語
在二十世紀(jì)七十年代以后,計(jì)算機(jī)視覺技術(shù)就已經(jīng)得到了較為迅速的發(fā)展,在我國,該技術(shù)在農(nóng)產(chǎn)品品質(zhì)檢測中的具體應(yīng)用也得到了人們的高度關(guān)注,同時(shí)也取得了一定的成效。計(jì)算機(jī)視覺技術(shù)作為人眼的延伸技術(shù)之一,其具備了人腦功能,運(yùn)用該技術(shù)代替以往的人工操作技術(shù),已經(jīng)成為了農(nóng)產(chǎn)品品質(zhì)檢測工作的必然發(fā)展趨勢。
參考文獻(xiàn)
[1]朱從容.計(jì)算機(jī)視覺技術(shù)在水產(chǎn)養(yǎng)殖中的應(yīng)用[J].浙江海洋學(xué)院學(xué)報(bào)(自然科學(xué)版),2008,10(04):191-192.
[2]王勃,徐靜.計(jì)算機(jī)視覺技術(shù)在蘋果葉片營養(yǎng)診斷上的應(yīng)用[J].農(nóng)機(jī)化研究,2008,(03):887-888.
[3]李朝東,崔國賢,盛暢,等.計(jì)算機(jī)視覺技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用[J].農(nóng)機(jī)化研究,2009,10(12):667-668.
作者簡介
陳超(1995-),男,福建省福州市人。現(xiàn)為北京交通大學(xué)在校學(xué)生。研究方向為電子科學(xué)與技術(shù)。
計(jì)算機(jī)視覺的研究方向范文2
關(guān)鍵詞:計(jì)算機(jī)視覺技術(shù) 鐵路檢測 應(yīng)用
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-3973(2012)002-075-03
1 前言
自1825年世界第一條鐵路在英國出現(xiàn)以來,鐵路已經(jīng)成為人們不可或缺的交通工具,越來越多的人在使用鐵路出行,由于近年來鐵路事故頻頻發(fā)生,促使了計(jì)算機(jī)視覺技術(shù)在鐵路檢測上的廣泛使用并大力發(fā)展。
傳統(tǒng)的鐵路檢測一直是靠人工和靜態(tài)檢測,這種檢測缺乏實(shí)時(shí)性和準(zhǔn)確性,并且效率低下,根本無法滿足鐵路的發(fā)展。這就要求研究一種新的檢測方法來適應(yīng)環(huán)境的發(fā)展,人們就試圖將計(jì)算機(jī)視覺技術(shù)應(yīng)用于鐵路檢測上,并取得了很好的效果。將計(jì)算機(jī)視覺技術(shù)應(yīng)用在鐵路檢測上顯著提高了鐵路檢測的實(shí)時(shí)性、準(zhǔn)確性,有效的減輕了人工檢測中工作條件惡劣,工作量大等缺點(diǎn)。它能在列車行駛的過程中就能對鐵路和列車狀況進(jìn)行檢測,并及時(shí)的做出預(yù)警,防止安全事故的發(fā)生。目前有關(guān)鐵路檢測主要集中在鐵路信號(hào)檢測、軌道檢測、接觸網(wǎng)檢測、電力機(jī)車檢測及站臺(tái)環(huán)境監(jiān)測等五個(gè)方面。
2 計(jì)算機(jī)視覺技術(shù)
計(jì)算機(jī)視覺,也稱機(jī)器視覺。它是利用一個(gè)代替人眼的圖像傳感器獲取物體的圖像,將圖像轉(zhuǎn)換成數(shù)字圖像,并利用計(jì)算機(jī)模擬人的判別準(zhǔn)則去理解和識(shí)別圖像,達(dá)到分析圖像和作出結(jié)論的目的。
計(jì)算機(jī)視覺是多學(xué)科的交叉和結(jié)合,涉及到數(shù)學(xué)、光學(xué)、人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、圖像理解、模式識(shí)別等多個(gè)領(lǐng)域。計(jì)算機(jī)視覺已有多年的發(fā)展歷程。隨著計(jì)算機(jī)、控制理論、模式識(shí)別、人工智能和生物技術(shù)的發(fā)展,計(jì)算機(jī)視覺在機(jī)器人、工業(yè)檢測、物體識(shí)別的應(yīng)用越來越廣,研究方向也從二維到三維,從串行到并行,從直接依賴于輸入信號(hào)的低層處理到依賴于特征、結(jié)構(gòu)、關(guān)系和知識(shí)的高層處理。
一般的計(jì)算機(jī)視覺系統(tǒng)是有CCD(電荷耦合器件)攝像機(jī)、裝備有圖像采集板的計(jì)算機(jī)、光照系統(tǒng)以及專用圖像處理軟件等組成。CCD攝像機(jī)將所要研究的對象和背景以圖像的形式記錄下來,這其實(shí)是一個(gè)光電傳感器,將光學(xué)信號(hào)轉(zhuǎn)成電信號(hào),圖像采集板把采集的電信號(hào)轉(zhuǎn)為數(shù)字信號(hào),即數(shù)字化,一般情況下在攝取圖像時(shí)都需要一個(gè)照明系統(tǒng)提供光照,然后再用專用的圖像處理軟件對圖像進(jìn)行處理,輸出分析結(jié)果。
3 計(jì)算機(jī)視覺技術(shù)在鐵路信號(hào)中的應(yīng)用
鐵路信號(hào)燈和現(xiàn)在的交通公路上的紅綠燈是一個(gè)功能,但鐵路和公路不同,鐵路有限定的道路,列車必須在限定的股道上行駛,所以一旦與其他車輛相遇的話根本沒有辦法避讓,如果發(fā)生車禍將會(huì)對國家和人民的生命和財(cái)產(chǎn)造成嚴(yán)重的損失,因此列車必須嚴(yán)格按照信號(hào)燈的指示行駛。
鐵路信號(hào)燈識(shí)別主要是利用了信號(hào)燈在不同情況下會(huì)發(fā)出特定色彩光的特點(diǎn)。文獻(xiàn)[1]在HSV空間中對S分量圖像邊緣檢測和膨脹等,結(jié)合各種信號(hào)燈色調(diào)H分量的取值范圍得到信號(hào)燈區(qū)域,然后多次腐蝕直到消除孤立點(diǎn)得到信號(hào)燈的邊緣,最后填充信號(hào)燈區(qū)域,從而實(shí)現(xiàn)了信號(hào)燈的識(shí)別。在文獻(xiàn)[2]也與此類似。文獻(xiàn)[3]將彩色圖像由RGB模式轉(zhuǎn)化為HSI模式,用彩色特征聚類分析法來對圖像進(jìn)行分割,文中提出了基于顏色和形狀相結(jié)合的復(fù)雜環(huán)境中目標(biāo)檢測與識(shí)別方法,用Hough變化來提取目標(biāo)邊界,從而提取出特定目標(biāo),而后得到指示燈區(qū)域所有像素的H,S統(tǒng)計(jì)值確定信號(hào)燈的顏色。在文獻(xiàn)[4]提出一種基于改進(jìn)的Hough變化的吊車信號(hào)燈識(shí)別算法。Roberto將攝取的圖片轉(zhuǎn)換到HIS顏色空間,用基于形狀特征和模板匹配的方法探測到相關(guān)的鐵路標(biāo)志而放棄無關(guān)的基礎(chǔ)設(shè)施。
為了部分消除因?yàn)楣庹諚l件、背景和拍攝角度對目標(biāo)識(shí)別的影響,文獻(xiàn)[5]提出使用一種利用sift特征的方法,它首先建立已知樣本模型的特征集,然后將視頻流每幀灰度圖像的sift特征與之比較,從而實(shí)現(xiàn)對目標(biāo)的檢測或跟蹤。實(shí)驗(yàn)表明該方法不僅能避免目標(biāo)的錯(cuò)誤識(shí)別,而且也明顯優(yōu)于基于邊緣檢測的算法,在識(shí)別準(zhǔn)確率上達(dá)到了90%。
4 計(jì)算機(jī)視覺技術(shù)在軌道檢測中的應(yīng)用
隨著世界鐵路運(yùn)營速度的不斷提高,列車在行駛時(shí)對軌道的撞擊、摩擦加劇,這就會(huì)造成軌道的變形、零件松動(dòng)、磨損乃至缺失等,這些都會(huì)對列車的安全性造成嚴(yán)重影響,極有可能會(huì)造成鐵路安全事故的發(fā)生。因此軌道設(shè)備具備良好的狀態(tài)是鐵路運(yùn)輸安全的重要保證。
隨著電子技術(shù)和檢測技術(shù)的發(fā)展,軌道檢測技術(shù)也經(jīng)歷了翻天覆地的變化,其中也有不少研究機(jī)構(gòu)將計(jì)算機(jī)視覺技術(shù)應(yīng)用于軌道檢測上,且取得了若干有效的檢測方法。
軌道表面缺陷對列車行駛的質(zhì)量和鐵路系統(tǒng)的安全性會(huì)造成嚴(yán)重的影響,文獻(xiàn)[7]提出了一種軌道表面缺陷檢測的實(shí)時(shí)視覺檢測系統(tǒng)。利用跟蹤提取算法分割出軌道的灰度圖像,然后用局部歸一化法增強(qiáng)軌道圖像的對比度,最后用基于投影輪廓的缺陷定位法檢測缺陷。該算法對噪聲有較強(qiáng)的魯棒性和計(jì)算速度快,在一定程度上克服了光照不均和軌道表面反射性質(zhì)不同對圖像的影響,但對局部歸一化過程中參數(shù)的選擇有待進(jìn)一步研究,以使該系統(tǒng)有更強(qiáng)的魯棒性。該系統(tǒng)在216km/h速度下能進(jìn)行實(shí)時(shí)檢測,但隨著檢測速度的提高檢測的準(zhǔn)確度會(huì)明顯下降且缺乏實(shí)時(shí)性。
文獻(xiàn)[8]利用一排結(jié)構(gòu)光視覺傳感器,將鋼軌輪廓的大圓周和小圓周的中心作為檢查點(diǎn)。首先結(jié)構(gòu)光視覺傳感器拍攝鐵軌側(cè)面并且將其標(biāo)記 在參考坐標(biāo)幀中,最后通過比較測量的鋼軌輪廓與參考輪廓的比較計(jì)算出鐵軌磨損程度。該方法簡單快速精確且不需要特殊的圖像處理設(shè)備,在列車較高速度時(shí)仍然能達(dá)到良好效果。
5 計(jì)算機(jī)視覺技術(shù)在接觸網(wǎng)檢測中的應(yīng)用
接觸網(wǎng)是沿鐵路線上空架設(shè)的向電力機(jī)車供電的特殊形式的輸電線路。其由接觸懸掛、支持裝置、定位裝置、支柱與基礎(chǔ)幾部分組成。它是軌道交通的主要組成部分,主要為機(jī)車提供動(dòng)力,接觸網(wǎng)的連接件由于受外界因素的影響容易產(chǎn)生過熱現(xiàn)象,嚴(yán)重時(shí)會(huì)導(dǎo)致供電中斷,引發(fā)列車停運(yùn)事故。
我國的計(jì)算機(jī)視覺技術(shù)的接觸網(wǎng)檢測系統(tǒng)是基于德國相關(guān)技術(shù)而建立起來的,目前基于計(jì)算機(jī)視覺技術(shù)的接觸網(wǎng)磨耗檢測主要有兩種方案:(1)基于鏡面反射,激光照射接觸線,線性CCD照相機(jī)捕獲反射圖像;(2)基于漫反射原理和CMOS(互補(bǔ)金屬氧化物半導(dǎo)體)照相機(jī)。由于長期的頻繁摩擦,接觸網(wǎng)與受電弓接觸部分很少被空氣氧化,所以用光進(jìn)行照射時(shí)該部分光反射率明顯高于其他部分,因此這也為計(jì)算機(jī)視覺技術(shù)用于接觸網(wǎng)檢測提供了可能。
基于機(jī)器視覺的接觸網(wǎng)檢測系統(tǒng)主要是建立在圖像識(shí)別和圖像處理等視覺技術(shù)基礎(chǔ)之上的,檢測的內(nèi)容涵蓋接觸網(wǎng)的所有基本幾何參數(shù)。隨著鐵路的發(fā)展,原有的檢測系統(tǒng)已經(jīng)暴露出了一些問題,已無法滿足需求,所以研究人員在系統(tǒng)硬件設(shè)備不變的情況下提出了許多改進(jìn)的算法,如文獻(xiàn)[9]針對現(xiàn)行的接觸網(wǎng)定位器傾斜度檢測方法效率低下、精確度不高的缺點(diǎn),提出了一種基于計(jì)算機(jī)視覺的接觸網(wǎng)定位器傾斜度自動(dòng)測量裝置,應(yīng)用圖像分割、剔除干擾線、圖像細(xì)化等算法,對采集的圖像進(jìn)行處理,然后利用改進(jìn)的霍夫(Hough)變換檢測細(xì)化后的圖像,對相鄰的特征像素點(diǎn)進(jìn)行聚類并感知編組,最后用隨機(jī)Hough變換使感知編組后的每條線段更接近直線,進(jìn)而計(jì)算裝置中定位器的傾斜度,實(shí)驗(yàn)證明該算法精度高、速度快。
6 計(jì)算機(jī)視覺技術(shù)在電力機(jī)車檢測中的應(yīng)用
在列車的行進(jìn)過程中,機(jī)車車輪與鋼軌接觸面不斷發(fā)生摩擦,也就是輪緣與踏面的摩擦。從而會(huì)造成踏面的擦傷或剝離,而剝離會(huì)嚴(yán)重影響列車運(yùn)行的安全性和平穩(wěn)性以及軌道設(shè)施的使用壽命,因此需要對輪緣進(jìn)行定期的檢測和維修。
傳統(tǒng)的檢測方法需要人工逐項(xiàng)檢測,存在費(fèi)時(shí)費(fèi)力、工作量大、工作環(huán)境差、效率低等缺點(diǎn),所以人們就提出了一種基于計(jì)算機(jī)視覺技術(shù)的檢測技術(shù),該技術(shù)是一種非接觸式檢測方法,它能檢測出所有關(guān)于火車輪緣輪廓的幾何參數(shù),從而計(jì)算出火車輪緣的磨損情況。這種檢測方法檢測速度快、準(zhǔn)確率高且大大減輕了勞動(dòng)強(qiáng)度,在實(shí)驗(yàn)中取得了滿意的效果,并且在實(shí)際檢測中也得到了廣泛的應(yīng)用。
文獻(xiàn)[10]中研發(fā)設(shè)計(jì)了一種利用CCD成像測量技術(shù)、圖像處理理論和計(jì)算機(jī)控制等相關(guān)技術(shù),提出了一種非接觸式的在線測量系統(tǒng)。采用二元多項(xiàng)式方法對由于硬件裝置引起的誤差的圖像進(jìn)行幾何校正,用統(tǒng)計(jì)均值法對圖像進(jìn)行分割,從而求出車輪踏面的各項(xiàng)參數(shù),通過在實(shí)驗(yàn)室對標(biāo)準(zhǔn)物進(jìn)行測試實(shí)驗(yàn)而得到的測量數(shù)據(jù)結(jié)果進(jìn)行分析而得出。此系統(tǒng)能夠完成對火車輪對幾何參數(shù)的測量,并且可得到相對準(zhǔn)確的測量結(jié)果。
為了解決檢測輪緣高度和寬度存在精度難以保證及穩(wěn)定性不高的問題,文獻(xiàn)[11]提出了一種基于三角法測量的在線監(jiān)測系統(tǒng),該系統(tǒng)由CCD高速攝像機(jī)和結(jié)構(gòu)光發(fā)射器完成數(shù)據(jù)的采集,然后利用三角測量原理導(dǎo)出測量模型和計(jì)算模型,根據(jù)輪緣高度和寬度的定義完成對高度和寬度的測量,最終對輪緣磨損程度進(jìn)行量化,實(shí)驗(yàn)表明該算法測量精度高,結(jié)果穩(wěn)定可靠。
7 計(jì)算機(jī)視覺技術(shù)在站臺(tái)環(huán)境監(jiān)測中的應(yīng)用
近年來鐵路交通事業(yè)發(fā)展迅速,鐵路客流量也不斷增大,如中國每年的春運(yùn)期間都有上億人次通過火車返鄉(xiāng),各種危害乘客安全的事故也時(shí)有發(fā)生,因此世界各國特別是中國站臺(tái)監(jiān)控就顯得越來越重要,目前的站臺(tái)監(jiān)控主要是依靠安裝在各個(gè)角落的閉路電視或?qū)I(yè)技術(shù)人員,這不僅需要專業(yè)技術(shù)知識(shí)還需要大量的人力物力。隨著計(jì)算機(jī)、圖像處理等技術(shù)的快速發(fā)展,對站臺(tái)的自動(dòng)監(jiān)控也逐漸成為發(fā)展趨勢。
近年來人們做了許多關(guān)于站臺(tái)人群檢測的研究,這些研究大都使用鐵路站臺(tái)中的閉路電視(CCTV)系統(tǒng),在現(xiàn)代的CCTV系統(tǒng)中基本上使用的是數(shù)字化圖像,在人群監(jiān)測過程中大量使用了數(shù)字圖像處理技術(shù),如邊緣檢測、細(xì)化、像素計(jì)算等,通過圖像的處理可以輕易的得到想要的結(jié)果。
文獻(xiàn)[12]仍采用原有的CCTV監(jiān)控系統(tǒng)拍攝的灰度圖像作為處理對象,利用基于視覺的經(jīng)過最小二乘法和全局搜索的混合算法訓(xùn)練的工業(yè)的額神經(jīng)網(wǎng)絡(luò)來估算站臺(tái)的擁擠程度,該系統(tǒng)在實(shí)際的運(yùn)行中獲得了較高的精確度,雖然不能計(jì)算人數(shù)但卻能實(shí)時(shí)的預(yù)測人群的密度。
文獻(xiàn)[13]所設(shè)計(jì)的系統(tǒng)就較為復(fù)雜,它利用多臺(tái)攝像頭對站臺(tái)進(jìn)行檢測。首先判斷站臺(tái)上列車的四種狀態(tài),如:沒有列車、有列車、列車正在出站、列車正在入站等,然后對物體或行人檢測及跟蹤,最后對所檢測的結(jié)果綜合分析,做出合理的預(yù)警或警告。
8 計(jì)算機(jī)視覺技術(shù)在鐵路檢測上的發(fā)展趨勢
隨著計(jì)算機(jī)視覺技術(shù)的鐵路檢測中的應(yīng)用越來越廣泛和深入,并且隨著計(jì)算機(jī)視覺技術(shù)等關(guān)鍵技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺技術(shù)在鐵路檢測上應(yīng)用發(fā)揮更大的作用,它就目前而言在鐵路檢測的應(yīng)用上仍然存在技術(shù)難題需要研究:
計(jì)算機(jī)視覺的研究方向范文3
近年來,計(jì)算機(jī)視覺在安防領(lǐng)域的應(yīng)用正備受關(guān)注,身份識(shí)別是核心問題。人臉識(shí)別是一種基于臉部特征信息進(jìn)行身份識(shí)別的技術(shù),人臉檢測是其中的基礎(chǔ)和關(guān)鍵部分。介紹了四種不同的人臉檢測技術(shù),分析了相關(guān)的算法和理論,概述了各自的優(yōu)缺點(diǎn)。最后,討論了人臉檢測技術(shù)今后的研究方向及發(fā)展趨勢。
【關(guān)鍵詞】計(jì)算機(jī)視覺 身份識(shí)別 人臉檢測
1 人臉檢測問題綜述
在國土安全和社會(huì)安全問題日益突顯的背景下,世界各國家都對安防領(lǐng)域進(jìn)行不遺余力地投入。隨著計(jì)算機(jī)視覺技術(shù)的不斷發(fā)展,基于生物特征識(shí)別的身份識(shí)別技術(shù)受到人們的廣泛關(guān)注,在未來一段時(shí)間內(nèi)生物識(shí)別技術(shù)將成為信息產(chǎn)業(yè)的一次革命。其中人臉識(shí)別技術(shù)作為一種極具潛力的生物識(shí)別方式,以其識(shí)別速度快,主動(dòng)性強(qiáng),性價(jià)比高等顯著的技術(shù)優(yōu)勢,在各個(gè)領(lǐng)域都體現(xiàn)出了巨大的商業(yè)價(jià)值和社會(huì)價(jià)值。
人臉檢測是人臉識(shí)別的前提和關(guān)鍵,一般采用相機(jī)實(shí)時(shí)采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中對人臉進(jìn)行檢測和跟蹤。人臉的自動(dòng)檢測是一項(xiàng)頗有難度的工作,主要體現(xiàn)在:(1)不同族群年齡等問題導(dǎo)致人臉的差異性。(2)人臉上的胡須等附屬物對檢測造成的干擾。(3)人體姿態(tài)變化和遮擋物存在對檢測的影響。(4)環(huán)境和硬件條件對圖像采集效果的影響。針對這些問題,國內(nèi)外著名高校和科研機(jī)構(gòu)進(jìn)行了很多相關(guān)的研究,致力于解決在復(fù)雜背景下如何準(zhǔn)確高效地進(jìn)行人臉檢測的問題。
2 實(shí)現(xiàn)人臉檢測的相關(guān)技術(shù)
根據(jù)近年來計(jì)算機(jī)視覺領(lǐng)域人臉檢測問題的研究進(jìn)展,本文在這里進(jìn)行總結(jié)性綜述,目前人臉檢測的方法可以分為基于知識(shí)和統(tǒng)計(jì)兩類,有以下四種常用的檢測算法。
2.1 模板匹配
模板匹配可以分成固定模板和變形模板。固定模板指的是根據(jù)先驗(yàn)數(shù)據(jù)歸納出一個(gè)統(tǒng)一的模板,然后根據(jù)一個(gè)能量函數(shù)確定被檢測區(qū)域中和模板相關(guān)程度較高的位置,即人臉位置。由于不同人物之間臉部的差異性很大,加上環(huán)境等因素的影響,此方法并不具有很強(qiáng)的實(shí)用性。變形模板原理上和固定模板的操作方式相同,不過變形模板自身的參數(shù)模型在一定范圍內(nèi)具有可變性,因此檢測的動(dòng)態(tài)范圍更大,檢測效果相對較好一些。
2.2 樣本學(xué)習(xí)
由于人臉的復(fù)雜性,顯式描述十分困難,因此基于統(tǒng)計(jì)模式的檢測方法受到了人們的廣泛關(guān)注。此方法將人臉看做一種模式,通過對大量樣本圖像的機(jī)器學(xué)習(xí)完成分類器的構(gòu)造,利用分類器實(shí)現(xiàn)對人臉的檢測判別,在這里問題被轉(zhuǎn)化為模式識(shí)別中的二分類的形式。
首先,需要建立一個(gè)樣本空間,其中包括“人臉”和“非人臉”的正負(fù)兩種樣本,對樣本圖片歸一化處理后,順序展開后進(jìn)行主分量分解,在大量樣本形成的高維矩陣中計(jì)算其特征值和特征向量,然后采用一定的學(xué)習(xí)機(jī)制在特征空間中建立分類,以此可得到用來檢測樣本圖片是否為人臉的正負(fù)判別規(guī)則式,二者為互斥關(guān)系。此檢測方法具有較高的準(zhǔn)確度,但是需要大量的正負(fù)樣本圖片,MIT等一些高校和研究機(jī)構(gòu)建立了開放的人臉庫。
2.3 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(ANN )是將模式的統(tǒng)計(jì)特性包含在ANN的結(jié)構(gòu)和參數(shù)中,對于人臉這類復(fù)雜的、難以顯式描述的抽象型模式,這一檢測方法具有其自身特別的優(yōu)勢。
神經(jīng)網(wǎng)絡(luò)方法本質(zhì)上也是基于樣本學(xué)習(xí),首先使用經(jīng)過預(yù)處理的“人臉”樣本以及采用“自舉”方法收集分類器錯(cuò)分的樣本作為正負(fù)樣本訓(xùn)練各個(gè)ANN,然后根據(jù)結(jié)果進(jìn)一步對分類器進(jìn)行修正,構(gòu)造多層感知器(MLP)網(wǎng)絡(luò)作為分類器對人臉進(jìn)行檢測。人工神經(jīng)網(wǎng)絡(luò)是并行分布式系統(tǒng),采用了與傳統(tǒng)人工智能和信息處理技術(shù)不同的原理,模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行目標(biāo)檢測。神經(jīng)網(wǎng)絡(luò)模型克服了傳統(tǒng)的基于算數(shù)邏輯符號(hào)的人工智能在處理直覺、非結(jié)構(gòu)化信息方面的缺陷,具有自適應(yīng)、自組織和實(shí)時(shí)學(xué)習(xí)的特點(diǎn),應(yīng)用在人臉檢測問題中性能表現(xiàn)突出。
2.4 基于隱馬爾可夫模型
隱馬爾可夫模型(HMM)是一種雙重隨機(jī)過程,一種是有限狀態(tài)的馬爾可夫鏈,另一種是序列的觀察值。由于只能通過觀察值得到馬爾可夫鏈的狀態(tài),因此稱之為隱馬爾可夫模型。對于人臉而言,可以把它分為前額、眼睛、鼻子、嘴巴、下巴五個(gè)部分來檢測。根據(jù)這五個(gè)區(qū)域位置順序不變性,可以分別用相應(yīng)的觀察向量序列檢測每一個(gè)部分,使用一個(gè)包含五個(gè)狀態(tài)的一維連續(xù)HMM來表示人臉。接著對各塊進(jìn)行KL變換,提取每塊一些最大的特征向量作為觀察值對HMM進(jìn)行訓(xùn)練。此后,還提出了一種嵌入式隱馬爾可夫模型,該方法除了將人臉劃分為五塊外,還在每塊中從左至右嵌入了一個(gè)HMM。接著進(jìn)行二維DCT變換,把變換后得到的系數(shù)作為訓(xùn)練值。
3 結(jié)束語
人臉檢測是個(gè)發(fā)展很快的研究方向,人臉檢測技術(shù)的發(fā)展趨勢是利用多特征,多種分類方式進(jìn)行啟發(fā)式知識(shí)與統(tǒng)計(jì)學(xué)習(xí)方法的結(jié)合,未來對人臉檢測的研究將會(huì)更注重其實(shí)時(shí)的應(yīng)用,這就對檢測算法的效率提出了更高的要求。另外,可以消除光照對人臉成像影響的紅外人臉識(shí)別技術(shù),加入相互對比機(jī)制的包含正臉、側(cè)臉三維信息的人臉三維模型重建檢測技術(shù)也正在研究當(dāng)中。隨著技術(shù)的不斷進(jìn)步和市場逐漸的規(guī)范化,人臉檢測識(shí)別技術(shù)會(huì)越來越多地應(yīng)用于社會(huì)的各個(gè)領(lǐng)域,在促進(jìn)社會(huì)發(fā)展的同時(shí)方便人們的生活。
參考文獻(xiàn)
[1]許燕,王維蘭.基于視覺運(yùn)動(dòng)人臉檢測技術(shù)的研究[J].計(jì)算機(jī)仿真, 2014(1):434-437.
[2]孫寧,鄒采榮,趙力.人臉檢測綜述[J].電路與系統(tǒng)學(xué)報(bào),2006,11(6):101-108.
作者簡介
姚坤(1990-),男,現(xiàn)為聊城大學(xué)物理科學(xué)與信息工程學(xué)院碩士研究生,主要研究方向?yàn)闄C(jī)器視覺。
計(jì)算機(jī)視覺的研究方向范文4
關(guān)鍵詞:圖像處理 教學(xué)改革 研究生教學(xué)
中圖分類號(hào):G642.4 文獻(xiàn)標(biāo)識(shí)碼:C DOI:10.3969/j.issn.1672-8181.2014.05.098
《數(shù)字圖像處理》課程是計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)研究生的重要基礎(chǔ)課程,對于研究生綜合能力的培養(yǎng)及學(xué)術(shù)思維的訓(xùn)練具有關(guān)鍵性意義。作為一個(gè)經(jīng)典研究方向,數(shù)字圖像處理已經(jīng)有較為悠久的研究歷史[1,2],因此作為一門研究生課程,《數(shù)字圖像處理》有眾多關(guān)鍵性重要內(nèi)容可以教授,是培養(yǎng)研究生科研能力的重要基石。
作為一個(gè)重要的科研方向乃至領(lǐng)域,數(shù)字圖像處理已經(jīng)與模式識(shí)別、計(jì)算機(jī)視覺以及機(jī)器學(xué)習(xí)等學(xué)科建立起密不可分的聯(lián)系,因此該門課程可以極大地拓寬學(xué)生的學(xué)術(shù)視野,為學(xué)生將來的學(xué)習(xí)和科研鋪設(shè)道路。同時(shí),數(shù)字圖像處理方向相關(guān)的人臉識(shí)別[3]、圖像拼接[4, 5]、輪廓提取[6]等課題,已成為計(jì)算機(jī)學(xué)科中最為熱門的科研課題之一,充分反映了該研究方向的關(guān)鍵性地位。
在本科階段相應(yīng)課程的基礎(chǔ)上,除講授相關(guān)基礎(chǔ)知識(shí)之外,研究生階段的《數(shù)字圖像處理》課程應(yīng)更加注重學(xué)生專業(yè)能力的培養(yǎng)和科研能力的積淀,以指導(dǎo)科研作為該門學(xué)科的靈魂。本文對如何在研究生階段的《數(shù)字圖像處理》課程中增加對科研內(nèi)容的強(qiáng)調(diào)進(jìn)行了初步研究和探索,并將相關(guān)具體實(shí)施措施總結(jié)如下。
1 對頂級(jí)期刊和會(huì)議進(jìn)行介紹
在研究生的各項(xiàng)科研綜合能力中,具備一定科學(xué)文獻(xiàn)閱讀能力是不可或缺的一環(huán),而進(jìn)行文獻(xiàn)閱讀的前提是必須首先學(xué)會(huì)辨別文獻(xiàn)的質(zhì)量。在各種文獻(xiàn)肆意泛濫的今天,缺乏這項(xiàng)能力,學(xué)生將很容易陷入垃圾文獻(xiàn)的陷阱,從而影響其對科學(xué)研究的理解,甚至徹底歪曲學(xué)生的科研精神。因此我們認(rèn)為,在研究生階段的《數(shù)字圖像處理》課程中,必須對IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE Transactions on Image Processing、International Conference on Computer Vision等相關(guān)的頂級(jí)科研期刊和會(huì)議進(jìn)行適當(dāng)介紹和說明,使學(xué)生明白真正的科研巔峰在何處。
2 介紹經(jīng)典算法
數(shù)字圖像處理學(xué)科中,擁有眾多以Adaboost[7]為代表的經(jīng)典算法,它們是構(gòu)成整個(gè)學(xué)科的關(guān)鍵性支柱,也是學(xué)科發(fā)展中每個(gè)階段的里程碑。僅僅注重表面基礎(chǔ)知識(shí),而忽略經(jīng)典算法的講解,是舍本逐末的短視行為。
3 強(qiáng)調(diào)與相關(guān)學(xué)科的關(guān)聯(lián)
數(shù)字圖像處理學(xué)科發(fā)展到今天,已經(jīng)與模式識(shí)別、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、概率統(tǒng)計(jì)等學(xué)科建立起了密不可分的內(nèi)在聯(lián)系。在解決某一個(gè)具體任務(wù)時(shí),已經(jīng)不再是單一學(xué)科知識(shí)可以應(yīng)對的,而往往需要多學(xué)科知識(shí)的綜合發(fā)揮。因此,為切合實(shí)際應(yīng)用,在講解《數(shù)字圖像處理》課程時(shí),必須同時(shí)對相關(guān)學(xué)科進(jìn)行介紹。使得學(xué)生明白在何時(shí)、可以從何種學(xué)科,獲得相應(yīng)幫助。
4 相關(guān)專業(yè)工具的介紹
工欲善其事必先利器,數(shù)字圖像處理是計(jì)算機(jī)學(xué)科中的上層次內(nèi)容,必須依托在相關(guān)專業(yè)工具基礎(chǔ)上才能開展研究。如若缺乏對相關(guān)工具的了解,往往會(huì)事倍功半。以讀取圖像為例,依托相關(guān)工具可能只需要編寫一行代碼,而如果自行編寫代碼,可能需要數(shù)百行之多。因此,我們認(rèn)為,必須在《數(shù)字圖像處理》課程中,對Matlab、Opencv等專業(yè)工具進(jìn)行專門介紹。從而節(jié)省學(xué)生在進(jìn)行相關(guān)研究時(shí),在摸索基礎(chǔ)工具方面所花費(fèi)的時(shí)間。
5 突出最新技術(shù)進(jìn)展
發(fā)展迅速是信息學(xué)科的突出特點(diǎn),作為研究熱點(diǎn)的數(shù)字圖像處理學(xué)科的更新更是日新月異。為相關(guān)科學(xué)研究服務(wù),必須時(shí)時(shí)關(guān)注最新的科研熱點(diǎn),使學(xué)生隨時(shí)了解最新的科研動(dòng)向,為他們在將來進(jìn)行科研方向選擇時(shí),提供更多的指引和選擇。
參考文獻(xiàn):
[1]Gonzalez R.C., Richard E. W. Digital Image Processing [M]. Prentice Hall, 2007.
[2]Szeliski R. Computer Vision: Algorithms and Applications [M]. Springer, 2010.
[3]Li S.Z., Jain A.K. Handbook of Face Recognition [M]. Springer, 2011.
[4]李月龍,封舉富.基于最小扭曲變換的正面人臉圖像合成[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2011,23(6):1085-1090.
[5]Li Y., Feng J. Frontal face synthesizing according to multiple non-frontal inputs and its application in face recognition [J]. Neurocomputing, 2012,(91):77-85.
[6]Li Y., Feng J. Sparse representation shape model. 17th IEEE International Conference on Image Processing (ICIP) [C]. 2010:2733-2736.
計(jì)算機(jī)視覺的研究方向范文5
AlphaGo的出現(xiàn)加速了人們對人工智能(Artificial Intelligence以下簡稱AI)的理解,但AI極客們的野心遠(yuǎn)非19行的棋盤可以局囿,他們擁有酷炫的技術(shù)和非凡自信,并想以此來改變世界。
美國暢銷書作者、發(fā)明家雷.庫茲韋爾(Ray.Kurzweil)在《奇點(diǎn)臨近》一書中為人工智能的出現(xiàn)設(shè)定了三個(gè)條件:強(qiáng)大的計(jì)算能力、海量的知識(shí)儲(chǔ)備,最后還需要教會(huì)計(jì)算機(jī)擁有認(rèn)知能力,通過機(jī)器學(xué)習(xí)技術(shù)讓計(jì)算機(jī)不斷的自行進(jìn)化。
前兩者已經(jīng)實(shí)現(xiàn)。第三點(diǎn),如何讓機(jī)器擁有認(rèn)知能力是AI極客們關(guān)注的重點(diǎn)。
機(jī)器學(xué)習(xí)是人工智能的核心。機(jī)器學(xué)習(xí)將教會(huì)計(jì)算機(jī)認(rèn)識(shí)現(xiàn)實(shí)世界,知道自然界的日升日落、陰晴圓缺,并能理解人類的行為和語言。機(jī)器學(xué)習(xí)的常用領(lǐng)域包括數(shù)據(jù)挖掘、視覺理解、語音識(shí)別和自然語言處理等方面。我們采訪了數(shù)位科技公司高層、新銳創(chuàng)業(yè)者,他們有一個(gè)共同的身份―國內(nèi)從事機(jī)器學(xué)習(xí)的應(yīng)用和研發(fā)的專家。他們講述了中國人工智能發(fā)展的現(xiàn)狀,而一旦科技出現(xiàn)新突破,也預(yù)示著新一輪的商業(yè)變革。 先知
坐在記者對面,臉龐消瘦的陳運(yùn)文笑得有些靦腆,言語卻充滿自信,“很多事情都是可以預(yù)測的”。
陳運(yùn)文是國內(nèi)大數(shù)據(jù)方面的專家,曾任百度核心技術(shù)研發(fā)工程師和盛大文學(xué)首席數(shù)據(jù)官?,F(xiàn)在他是個(gè)創(chuàng)業(yè)者,達(dá)觀數(shù)據(jù)創(chuàng)始人兼CEO。他為公司新入職的同事下發(fā)了一套題――如何預(yù)測泰坦尼克號(hào)上的幸存者。整套題通過獲取泰坦尼克號(hào)上所有乘客的真實(shí)信息,包括性別、年齡、職業(yè)、票價(jià)、艙位等,然后編寫程序來預(yù)測這2000余名乘員中哪些人最終得以生還。
在陳運(yùn)文眼里,將所有信息加以綜合挖掘,就能夠推演出最終的答案―“705名生還者都可以準(zhǔn)確預(yù)測。”
預(yù)測這樣的事件只是數(shù)據(jù)挖掘的一個(gè)案例,對于極客而言,只要給他們足夠的信息,這個(gè)世界就沒有意外和偶然。
現(xiàn)在,陳運(yùn)文用自己的技術(shù)幫助企業(yè)進(jìn)行商業(yè)決策。雖然只成立不到半年,但這個(gè)隱藏在張江天之驕子公寓里的創(chuàng)業(yè)公司已經(jīng)獲得真格基金和盛大網(wǎng)絡(luò)創(chuàng)始人陳大年的投資。
陳運(yùn)文將第一批客戶瞄準(zhǔn)為自媒體人,通過數(shù)據(jù)分析,為自媒體提供可以引發(fā)熱議的話題,并告訴這些作者,什么人喜愛看他們的文章、會(huì)關(guān)注什么話題。
讓機(jī)器自己學(xué)會(huì)分析信息早就在商業(yè)行為中廣泛存在。在百度工作期間,陳運(yùn)文負(fù)責(zé)搜索引擎的核心算法研究,主要“為用戶提供最有價(jià)值的信息”。 工作的難點(diǎn)不在于搜索信息,而在于讓機(jī)器認(rèn)知用戶的搜索意圖。
用戶經(jīng)常會(huì)在搜索框中輸入“口語詞匯或者模糊的語句”,服務(wù)器要從人們的搜索語句中判斷真正的需求。陳運(yùn)文就需要設(shè)計(jì)算法讓搜索引擎理解用戶的語義,從數(shù)百億的網(wǎng)頁中迅速找到對用戶最有價(jià)值的結(jié)果。這種“算法”就屬于人工智能。百度每天的搜索有數(shù)十億次,每當(dāng)陳運(yùn)文改進(jìn)了算法都能看到用戶點(diǎn)擊的滿意度在上升。
今天這種依靠數(shù)據(jù)挖掘技術(shù)來提高企業(yè)運(yùn)作效率的方法變得更常見,業(yè)內(nèi)將其稱為“商業(yè)智能”(Business Intelligence)技術(shù)。陳運(yùn)文計(jì)劃將這種技術(shù)在云端運(yùn)用,另一些同類公司則將這種技術(shù)直接運(yùn)用在軟件上。2010年在美國納斯達(dá)克上市的Qlik公司就是商業(yè)智能軟件的代表企業(yè)。他們的QlikView軟件為用戶提供“可視化”的大數(shù)據(jù)服務(wù)。
“我們的軟件可以理解數(shù)據(jù),挖掘數(shù)據(jù)并將其用更直觀的方式展現(xiàn)給客戶,以幫助管理層做出決策?!?Qlik亞太區(qū)制造業(yè)和高科技市場開發(fā)總監(jiān)Jeremy Sim對《財(cái)經(jīng)天下》周刊表述。
這些帶有“預(yù)測”功能的軟件已經(jīng)在服務(wù)并改變?nèi)藗兊纳?,比如根?jù)顧客的購買信息QlikView會(huì)提示便利店店長,售貨架上的麥片不應(yīng)該和面包擺在一起,雖然它們都是早餐食品,但如果將麥片和酸奶擺在一起,銷售數(shù)字會(huì)更好看。此類預(yù)測還進(jìn)一步提醒物流部門,盡量地在頭天晚上補(bǔ)足麥片和酸奶貨源。這類商業(yè)智能的應(yīng)用滲入所有人的生活,以這家公司為例,他們已經(jīng)在全球100多個(gè)國家招徠了3.8萬企業(yè)客戶,間接服務(wù)人群上千萬。
未來這些帶有“智力”的系統(tǒng)將會(huì)更多的出現(xiàn)在電商、醫(yī)療、教育、金融等領(lǐng)域?!氨热珉S著智能手環(huán)的增加,會(huì)有更多的健康數(shù)據(jù)被采集,那么我們會(huì)提供健康預(yù)警、治療方案推薦等服務(wù)?!标愡\(yùn)文說?,F(xiàn)在只是大數(shù)據(jù)挖掘的初級(jí)階段,人工智能時(shí)代也才剛剛開啟。 視覺理解,打造機(jī)器之目
2014年6月,比爾?蓋茨訪華,除了見政商要員外,他還專門造訪了一家剛成立一年的創(chuàng)業(yè)公司―格靈深瞳。對于這家初創(chuàng)公司,比爾蓋茨留下了兩句后來被廣泛引用的評語“This is very cool”和“IT界的下一個(gè)大事件是計(jì)算機(jī)視覺(computer vision)與深度學(xué)習(xí)(deep learning) 的結(jié)合”。
格靈深瞳就是這樣一個(gè)結(jié)合了計(jì)算機(jī)視覺和深度學(xué)習(xí)為一身的酷公司。創(chuàng)始人趙勇是致力于視覺理解的知名極客,雖然他本人并不喜歡這個(gè)稱謂。
“極客(Geek)在英文里形容書呆子,只會(huì)做技術(shù)不通世事,但我覺得我是一個(gè)懂技術(shù)的正常人?!彼麑Α敦?cái)經(jīng)天下》周刊說。
趙勇專攻計(jì)算機(jī)視覺和運(yùn)算影像學(xué),2009年入職谷歌總部研究院任資深研究員,是谷歌眼鏡項(xiàng)目的骨干?!拔覀儓F(tuán)隊(duì)負(fù)責(zé)谷歌眼鏡的場景識(shí)別技術(shù),利用谷歌街景來判斷使用者所處的位置。”簡單地說就是將谷歌眼鏡捕獲的圖像和谷歌街景做比對,然后快速地定位用戶所處位置和周邊信息。谷歌眼鏡可以在500毫米之內(nèi)將用戶的位置精確到米級(jí)別。趙勇說谷歌眼鏡并不是“進(jìn)化的產(chǎn)品,而是從無到有的突破”。
2013年初,趙勇回國創(chuàng)業(yè)成立格靈深瞳,并在三個(gè)月后拿到真格基金和聯(lián)創(chuàng)策源的聯(lián)合天使投資,同年6月格靈深瞳又拿到紅杉資本 A 輪高達(dá)數(shù)千萬美元的投資。
業(yè)內(nèi)傳播著投資人爭論其未來估值的段子,據(jù)說某次飯局上真格基金的徐小平、紅杉資本的沈南鵬和聯(lián)創(chuàng)策源的馮波討論格靈深瞳的未來估值,徐小平認(rèn)為起碼5000億美元,而沈南鵬認(rèn)為1000億美元,最后馮波折中地認(rèn)為3000億美元。而現(xiàn)在中國電商巨頭阿里巴巴的市值還不到1900億美元。
受到比爾?蓋茨和投資人如此追捧的原因在于趙勇的研究方向―計(jì)算機(jī)視覺,這是機(jī)器學(xué)習(xí)中極為復(fù)雜的領(lǐng)域。
將趙勇和陳運(yùn)一個(gè)對比就可以看出他們研究方向的不同。趙勇認(rèn)為數(shù)據(jù)挖掘是讓計(jì)算機(jī)理解“結(jié)構(gòu)化信息”,結(jié)構(gòu)化指那些人工制作的成型的信息數(shù)據(jù),例如一句話一段文字或者一份表格。但計(jì)算機(jī)視覺需要讓機(jī)器理解飄過鏡頭的一片樹葉,或者悄悄走過的一只貓。
陳運(yùn)文對此也做了比較,他認(rèn)為數(shù)據(jù)挖掘更多的是處理文本信息,而文字是具象的表達(dá),機(jī)器看到漢字“貓”或者英文“cat”就可以理解這是一種動(dòng)物,但圖片是抽象信息,給計(jì)算機(jī)看一張貓的圖片,讓它去理解貓的概念非常困難。
所以當(dāng)2012年6月谷歌X實(shí)驗(yàn)室宣布他們研發(fā)的“谷歌大腦”通過百萬張圖片的學(xué)習(xí)后可以識(shí)別“貓”的時(shí)候,全世界都為之震驚。這意味著谷歌培養(yǎng)的這個(gè)“孩子”具備視覺理解的能力可以“看圖說話”了。而參與“谷歌大腦”研發(fā)的吳恩達(dá)博士(Andrew Ng)也因?yàn)檫@個(gè)項(xiàng)目被譽(yù)為“谷歌大腦之父”,成為機(jī)器學(xué)習(xí)領(lǐng)域最權(quán)威的學(xué)者。
為了建造“谷歌大腦”,吳恩達(dá)使用了神經(jīng)網(wǎng)絡(luò)系統(tǒng),他們連接了1.6萬片處理器創(chuàng)造了一個(gè)擁有10億多條連接的神經(jīng)網(wǎng)絡(luò),并逐步地培訓(xùn)這個(gè)系統(tǒng),直到它擁有識(shí)圖的能力。
現(xiàn)在,趙勇做的事情與此類似。
他通過影像設(shè)備捕捉實(shí)時(shí)畫面,讓計(jì)算機(jī)識(shí)別這個(gè)真實(shí)世界,更為直接的說法或許是―趙勇正在研制“機(jī)器人之眼”。
像谷歌一樣,想讓計(jì)算機(jī)能識(shí)別圖像,趙勇也需要制作一個(gè)“深度神經(jīng)網(wǎng)絡(luò)”系統(tǒng)。
在人腦中有大約1000億個(gè)神經(jīng)元,神經(jīng)元通過神經(jīng)突出連接在一起就變成了一個(gè)神經(jīng)網(wǎng)絡(luò),人們思考問題的時(shí)候這些神經(jīng)網(wǎng)絡(luò)相互激發(fā),最終產(chǎn)生決策?,F(xiàn)在極客們用計(jì)算機(jī)來模擬這個(gè)過程,用計(jì)算程序建立起龐大的計(jì)算元素,這些程序運(yùn)算的結(jié)果通過網(wǎng)絡(luò)互為交換互相影響,最終產(chǎn)生結(jié)果,這就是初級(jí)的人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)層級(jí)越多規(guī)模越大,其“聰明程度”就越高,學(xué)習(xí)的能力就越強(qiáng)。
要培養(yǎng)這樣一個(gè)會(huì)“識(shí)圖的孩子”,趙勇除了要建立這樣一套龐大的神經(jīng)網(wǎng)絡(luò)之外,還需要不停訓(xùn)練這個(gè)網(wǎng)絡(luò)。
“可以將神經(jīng)網(wǎng)絡(luò)當(dāng)成一個(gè)黑盒子,我在里面設(shè)定了一些基本參數(shù),隨后不停的往里面輸入數(shù)據(jù)、圖片來訓(xùn)練它,通過這種大量的訓(xùn)練,黑盒子里面參數(shù)的連接會(huì)越來越緊密,整個(gè)網(wǎng)絡(luò)也會(huì)越來越聰明,最終變成一個(gè)可以識(shí)別圖片的智能系統(tǒng)。”
嚴(yán)格地說,人工智能不是人類設(shè)計(jì)出來的,而是人類訓(xùn)練出來的。即便是趙勇這樣的創(chuàng)建者也無法知道這些神經(jīng)網(wǎng)絡(luò)到底如何相互作用相互影響,并最終形成自己的智能系統(tǒng)。他能做的只是“選擇輸入數(shù)據(jù),控制訓(xùn)練方向”。
依舊以老師教育孩子做比喻,雖然趙勇這個(gè)老師不知道孩子是怎么理解圖片,識(shí)別這個(gè)世界的,但他可以控制教學(xué)的內(nèi)容,讓這個(gè)孩子朝某個(gè)方面學(xué)習(xí)。
趙勇花費(fèi)了兩年時(shí)間才為格靈深瞳培養(yǎng)出自己的“孩子”,并將這些有“識(shí)圖能力”的人工智能設(shè)備應(yīng)用到安防監(jiān)控和汽車識(shí)別方面。
去年格靈深瞳推出了名為“目”的行為分析儀,這是一個(gè)包含軟硬件于一體的智能監(jiān)控產(chǎn)品?!澳俊睍?huì)實(shí)時(shí)監(jiān)控場景內(nèi)的情況,發(fā)覺異常就立刻報(bào)警或者提醒工作人員注意。而在另一個(gè)名為“威目”的產(chǎn)品中,格靈深瞳做到了車輛識(shí)別,他們訓(xùn)練系統(tǒng)辨識(shí)超過5000種車輛,這幾乎涵蓋了地球上所有的汽車類型。這種能力為警方辦案提供了幫助,警方可以用“以圖搜圖”的方式讓“威目”提供他們需要的視頻資料?!熬教峁┮粡埰囌掌?,威目在識(shí)別照片之后可以從交通錄像中找出該車的行動(dòng)軌跡。”除此之外,該系統(tǒng)還可以搜索“結(jié)構(gòu)化信息”,例如在系統(tǒng)中輸入2004年生產(chǎn)車牌中含有5這個(gè)數(shù)字的紅色奧迪A4汽車,“威目”就會(huì)在資料中截取相關(guān)的圖像或者視頻,而此前這些工作都需要人工完成。
如果計(jì)算機(jī)視覺技術(shù)以這樣的速度繼續(xù),或許用不了幾年,當(dāng)我們站在攝像頭前時(shí),計(jì)算機(jī)會(huì)在屏幕上敲出那句讓人激動(dòng)的言語―“I see you .” 造物者
“谷歌大腦之父”吳恩達(dá)在完成了“認(rèn)貓”創(chuàng)舉兩年后離開了谷歌,加盟了百度,任職百度首席科學(xué)家并負(fù)責(zé)“百度大腦”的研發(fā)。
說服吳恩達(dá)做此決定的是他的好友,現(xiàn)任地平線機(jī)器人技術(shù)CEO的余凱。
余凱是國際知名的機(jī)器學(xué)習(xí)專家,他牽頭成立的百度深度學(xué)習(xí)研究院是國內(nèi)第一個(gè)研究深度神經(jīng)網(wǎng)絡(luò)的研究機(jī)構(gòu),加盟百度時(shí)被李彥宏稱為“鎮(zhèn)院之寶”。
“深度網(wǎng)絡(luò)學(xué)概起始于2006年,當(dāng)時(shí)主要有5個(gè)機(jī)構(gòu)從事這方面的研究,分別是多倫多大學(xué)、紐約大學(xué)、美國的NEC實(shí)驗(yàn)室、斯坦福大學(xué)和蒙特利爾大學(xué),而我當(dāng)時(shí)在NEC實(shí)驗(yàn)室工作?!庇鄤P說。有段時(shí)間他還在斯坦福大學(xué)執(zhí)教《人工智能概論》。他領(lǐng)導(dǎo)的團(tuán)隊(duì)在深度學(xué)習(xí)、圖像識(shí)別、文本挖掘、多媒體檢索、視頻監(jiān)控,人機(jī)交互等機(jī)器學(xué)習(xí)領(lǐng)域都有建樹。
去年余凱離開百度,在中關(guān)村的創(chuàng)富大廈租賃辦公室成立地平線機(jī)器人技術(shù)。成立僅4個(gè)月,這家公司就迎來了首輪投資,投資方包括晨興資本、高瓴資本、紅杉資本、金沙江創(chuàng)投等多家機(jī)構(gòu)。
比起商業(yè)上的追求,余凱更想用技術(shù)改變世界―為萬物裝上人工智能的大腦,讓它們變成擁有智能思維的機(jī)器人。
在余凱看來,他在百度的工作主要是在“云端”搭建人工智能深度神經(jīng)網(wǎng)絡(luò),其服務(wù)主要體現(xiàn)在“為用戶提供更智能的互聯(lián)網(wǎng)服務(wù)”,他希望通過人工智能技術(shù)應(yīng)用到物理世界中,讓人們的生活變得更方便和簡單。“現(xiàn)在很多電器都采用軟件結(jié)合互聯(lián)網(wǎng)操控,我希望未來都可以實(shí)現(xiàn)本地人工智能操控?!?/p>
他準(zhǔn)備讓汽車、空調(diào)、冰箱、微波爐等上千種產(chǎn)品或設(shè)備都具有從感知到?jīng)Q策的能力。比如用戶進(jìn)入房間時(shí)空調(diào)就可以感知人的位置和體溫自動(dòng)開機(jī)送風(fēng),并追隨人的移動(dòng)而改變送風(fēng)方向;冰箱則會(huì)讀取存儲(chǔ)食物的信息,及時(shí)提醒用戶食用或補(bǔ)充。
余凱利用深度神經(jīng)網(wǎng)絡(luò)算法來搭建他的人工智能框架。他將這種人工智能系統(tǒng)描述成“類似于安卓的智能硬件的大腦平臺(tái)”,這個(gè)系統(tǒng)可以安裝在不同的產(chǎn)品中。
他“改造萬物”的計(jì)劃先從家居產(chǎn)品和汽車兩個(gè)方面著手。地平線機(jī)器人技術(shù)研發(fā)了針對這兩個(gè)行業(yè)的人工智能操作系統(tǒng)。家居方面的基于深度神經(jīng)網(wǎng)絡(luò)的操作系統(tǒng)名為“安徒生”,汽車的則稱為“雨果”。
現(xiàn)在 “安徒生”已經(jīng)入駐家電產(chǎn)品,在剛剛過去的上海家博會(huì)展上,地平線機(jī)器人和某國內(nèi)知名家電廠商合作的兩款智能產(chǎn)品面世參展?!艾F(xiàn)在業(yè)界最大的智能家居廠商都是我們的客戶,我們向他們提供算法操作系統(tǒng),并告訴他們?nèi)绾闻渲糜布O(shè)備,就像安卓向手機(jī)廠商提供參考設(shè)計(jì)一樣?!?/p>
下一步余凱準(zhǔn)備讓“雨果”進(jìn)入汽車自動(dòng)駕駛領(lǐng)域,在安裝了傳感器、處理器和雨果大腦平臺(tái)后,汽車可以成為提供無人駕駛或智能駕駛的新型交通工具。
“定義萬物智能的大腦,這還要花很長時(shí)間,但是我覺得一步一步往那邊靠近。” 余凱知道地平線機(jī)器人的征程漫漫,但對于AlphaGo對戰(zhàn)李世石這樣的人機(jī)大戰(zhàn)新聞他卻無比篤定。“賽前幾乎所有專家都說這次機(jī)器贏不了,但我在接受網(wǎng)易采訪的時(shí)候就公開預(yù)測機(jī)器會(huì)贏,因?yàn)槲伊私釧lphaGo的算法?!?/p>
陳運(yùn)文也表達(dá)了相同的猜測。3月9日下午,陳運(yùn)文就興奮地預(yù)測AlphaGo能夠獲勝,那時(shí)首爾的李世石剛在棋盤上落下自己的第一枚黑子。
3個(gè)小時(shí)后,對弈到186手時(shí)李世石投子推枰宣告認(rèn)輸。
計(jì)算機(jī)視覺的研究方向范文6
>> 基于機(jī)器視覺的瓷磚素坯表面缺陷無損檢測算法研究 基于機(jī)器視覺檢測的輪廓提取算法的研究 基于機(jī)器視覺的西瓜體積估測算法 SMD晶體器件檢測中機(jī)器視覺的應(yīng)用分析 基于計(jì)算機(jī)視覺的實(shí)時(shí)車輛運(yùn)動(dòng)速度檢測算法研究 雙目視覺中的角點(diǎn)檢測算法研究 異常證據(jù)及其檢測算法研究 高效運(yùn)動(dòng)目標(biāo)檢測算法研究 DDoS攻擊的檢測算法研究 圖像邊緣檢測算法研究 自動(dòng)目標(biāo)檢測算法研究 機(jī)器視覺在半導(dǎo)體器件塑封缺陷檢測中的應(yīng)用 針對SMD晶體器件檢測的機(jī)器視覺系統(tǒng)的設(shè)計(jì) 機(jī)器人仿真系統(tǒng)中碰撞檢測算法的優(yōu)化 一種基于立體視覺的運(yùn)動(dòng)目標(biāo)檢測算法 感知無線電頻譜檢測算法的研究 自適應(yīng)閾值Canny邊緣檢測算法研究 遙感圖像變化檢測算法研究 基于Vega的碰撞檢測算法研究 語音信號(hào)基音檢測算法研究 常見問題解答 當(dāng)前所在位置:l~type=v5_one&label=rela_nextarticle
[3]Mark S.Nixon,Alberto S.Aguado.李實(shí)英,楊高波,譯.特征提取與圖像處理(第二版)[M].北京:電子工業(yè)出版社,2011.
[4]National Instruments.選擇視覺軟件需要考慮的10個(gè)方面[OL].,2008.
[5]黃文明,徐錦法.基于機(jī)器視覺的通孔元器件檢驗(yàn)[J],中國科技博覽,中國包裝總公司,2013(13).
[6]NI,NI Vision Concept Manual,2005.
[7]NI,NI Vision Online Help,2000-2008.