前言:中文期刊網精心挑選了卷積神經網絡的難點范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
卷積神經網絡的難點范文1
【關鍵詞】照相軟件 人臉識別技術 計算機
人臉識別作為一項現代化科技技術,具有極大的發展空間。1964年,人臉識別(AFR)這一領域逐漸出現在人們的視野里,至于1991年至1997年,若干具有代表性的人臉識別算法誕生于世,到如今,以支持向量機為代表的統計學習理論被應用到了人臉識別中來。前人的側重點在于對其算法的延伸探究,但就筆者而言,存在一定程度上專業知識的限制,因而根據自身的知識儲備與探究能力,將人臉識別技術這一寬泛概念的探討縮小至相對更貼近生活,且較為容易理解與研究的一個主題――對于照相機軟件中人臉識別技術的探究,并由此展開對計算機人臉識別的部分性探究。
1 對于人臉識別技術的初步了解
科幻性質的故事往往以其并不符合實際的奇幻情節,模糊得描繪了現實世界未來的發展藍圖。這里不得不提及一部具有啟發意義的電影――《生化危機》,電影中追蹤主角行蹤的衛星定位人臉識別技術,是否未來也將存在于我們的現實社會當中?由此,便聯想到生活中照相軟件的人臉識別是否也是通過相似的原理而執行的。
關于人臉識別,其本質上隸屬于生物特征識別的一支。其余包含指紋識別,虹膜識別,DNA識別等技術。當今最為廣泛運用的是指紋識別,但隨之而來產生的是一定的安全性問題。例如去年熱門的高考替考話題,指紋貼的出現使指紋識別的安全性受到質疑。而人臉識別仍處于一個不完全成熟的發展階段,就目前現狀來說,其所具有的不可復制性、自然性、不可察覺性,使其安全性與實用性都處于相對較高的水平。但同樣,其技術難度也呈正比例增長。
通過對與計算機信息科技的學習,能夠得出這樣一個總結性結論:“人臉識別是通過計算機視覺的一些算法所實現的?!?/p>
前人對從不斷更新的研究中得出,人臉識別的基本算法有四種:
(1)基于人臉特征點的識別算法(Feature-based recognition algorithms)。
(2)基于整幅人臉圖像的識別算法(Appearance-based recognition algorithms)。
(3)基于模板的識別算法(Template-based recognition algorithms)。
(4)利用神經網絡進行識別的算法(Recognition algorithms using neural network)。
當然,如今也早已存在許多其他的的算法能夠支持人臉識別技術的實現。而對于該項技術的應用的范圍也在逐漸擴大,門禁考勤系統、住宅安全管理、電子身份等等,都將在很大程度上的得益于其的不斷發展。
讓我們回到主題:照相機的人臉跟蹤究竟是如何實現的呢?圍繞這一問題,由淺及深,筆者將本文中的探究內容主要分為以下三個部分:
(1)圖像在計算機內部的存儲方式。
(2)計算機如何區分出物體與其所在背景。
(3)計算機如何定位人臉并從而實現識別功能。(注:由于照相軟件只是作為一個對于人臉識別問題的切入點,單單深究照相軟件會帶來一定的局限性,因此二、三兩點將跳過作為載體的照相軟件,直接對于照相機功能背后的原理作進一步探究。)
1.1 圖像在計算機內部的儲存方式
計算機通過往往通過bitmap的形式來儲存圖像,也就是像素矩陣。
從結構上講,計算機中儲存的圖像一把可以分為兩大類,即矢量圖和位圖。矢量圖通過數學公式計算獲得,優點在于不會失真,但其最大的缺點是難以表現色彩層次豐富的逼真圖像效果。而位圖的基本思想,則是把一幅圖像按照行列進行分割,所獲得的點成為像素。相機所拍攝獲得的照片便是以位圖的形式儲存的。每一幅圖像均是由無數像素組成,而每一個像素對應顯存中1、8、16或24位二進制數來表示顏色信息。位數決定了圖像所含的最大顏色數,位數越多,圖像的色彩就越豐富。
1.2 計算機如何區分出物體與其所在背景
大致的過程可以由圖1所知,用相對容易理解的話來解釋,計算機對于區分物體與其所在背景,首先是通過對要是別的物體提取表面特征,然后再對真實的照片提取表面特征,最終在進行匹配,配合相應的算法,這樣,計算機便可以區分出物體與其所在背景。
由此所延伸的科目是計算機視覺。
正如定義所提到:計算機視覺是一門關于如何運用照相機和計算機來獲取我們所需的,被拍攝對象的數據與信息的學問。
通過這門科目,我們能夠做到使用計算機來處理圖像,并區分出目的對象。形象地說,在這門科目的輔助之下,計算機能夠成為人類的第二雙眼睛,對目標進行識別、跟蹤和測量。
“One picture is worth ten thousand words.”圖像的處理,將為人類提供巨大的便捷。
大致羅列出其處理所進行的步驟,分別是:圖像獲取、特征提取、檢測分割、高級處理。
1.3 計算機如何定位人臉并從而實現識別功能
關于人臉的定位與識別,在很大一定程度上與區別物體與背景的技術存在著相似之處。但是人臉的定位與識別,又是更高于目標對象的識別的。這正是算法的不停更新與發展所帶來的科技發展的結果。
目前比較流行的Cascade Classifier(Opencv中做人臉檢測的時候的一個級聯分類器)效果還是比較好的,正臉檢測到的成功率能達到90%以上。
此外,在人臉局部區域特征提取時,一種叫做CNN(Convolutional Neural Network)卷積神經網絡技術的運用――使用提取特征的filter對像素點進行幾層處理,也為識別帶來一定的便利。CNN運用到了深度學習,因此這里將拓展以下有關deep learning的概念:
deep learning的概念源于人工神經網絡的研究。其三大框架為:CNN(Convolutional Neural Network,卷積神經網絡),DBN(Deep Belief Network,深度置信網絡),AE(AutoEncoder,自動編碼機)。而目前在CV(Computer Vision的縮寫,指計算機視覺)領域應用最廣的是CNN。到近來也有很多人嘗試用deep learning的方法來實現人臉識別,其與先前所提到的計算機區分物體和背景的原理也是相似的。
2 結論
回到最初的問題:照相機的人臉跟蹤是如何實現的?綜上所述,可以獲得的結論是:照相機的人臉跟蹤是通過計算機視覺的一些算法實現的。但這些算法在技術方面人仍然面臨著一些難點,例如,在特征識別時,外界客觀因素,有如,光線、著裝遮擋、目標對象的姿態、臉型、樣本缺乏等等尚未解決的問題。這些都使人臉識別技術尚有巨大的可發展空間。就像前段時間由推出的How Old do I Look線上臉部偵測服務,曾一度掀起熱潮,可見,人們對于人臉識別技術的期望也是很高的。
那么,未來的人臉識別技術到底能夠發展到何種程度呢?香港中文大學教授湯曉鷗、王曉剛及其研究團隊曾在2014年6月宣布,他們研發的DeepID人臉識別技術的準確率超過99%,比肉眼識別更加精準。相信未來,計算機人臉識別技術將與我們共同成長,逐漸成熟與完善。畢業于UC Berkeley的博士賈揚清,創造了Caffe――全稱Convolutional Architecture for Fast Feature Embedding,一個清晰而高效的深度學習框架,具有上手快、速度快、模塊化、開放性、社區好等優點。如此不斷迅捷發展的計算機技術,在這個數字化的時代,正是對未來發展很好的導向。
參考文獻
[1]韋鳳年.怎樣寫科技論文[J].河南水利,2006(09).
[2]董琳,趙懷勛.人臉識別技術的研究現狀與展望[J].China Academic Journal Electronic Publishing House,2011,10.
作者簡介
孫文倩(1998-),上海市人。現在上海市洋涇中學高中在讀。
卷積神經網絡的難點范文2
[關鍵詞] CCD測量; 煤位測量; 聚類分析方法; Gauss-Laplachian算子
中圖法分類號TP391
1 引言
井下煤倉煤位測量是井下自動作業控制的重要檢測參數,能實時提供煤倉的儲料情況,是煤礦井下作業自動化以及安全生產設計的重要環節。由于工作環境惡劣,井下煤倉煤位測量一直是國內外煤炭工業測量裝置研究的難點,常用的測量方法有電容式煤位探測、重錘式煤位探測、核輻射式煤位探測和超聲波式煤位探測系統等。運用圖像處理技術實現井下煤倉煤位測量技術源自于光學三維輪廓技術。目前CCD物料料位測量的主要工作原理有:通過輔助點光源成像后的位移變化計算物料高度和通過輔助光源成像后的光斑面積變化計算物料高度兩種,但這兩種原理最核心的計算處理均為輔助光源成像后的光斑輪廓處理以及圖像數據的標定,尤其前者所采用的基本算法是一致的。輔助光源在井下煤倉內產生光斑惡劣的情形大多為光斑灰度值較小情形,也就是煤塵的干擾較大情形,文獻圖像處理結果表明惡劣情形下獲取比較準確的光斑直徑比較困難,其光斑面積明顯要比實際光斑面積小。從文獻的圖像預處理數據來看,在光斑灰度值較大的情況下,檢測光斑的中心坐標還是相對容易,并且相對準確。本文采用的CCD測量方法也是一種基于輔助光源成像光斑中心點辨識的測量方法,能正確處理光斑灰度值較小的惡劣干擾情形,并且具冗余及校正能力,適用于井下煤倉煤位測量。
2 測量原理
根據攝像機的成像原理,兩個共面交叉安裝的點光源在被測物面上形成特征光點,當物料高度變化時,特征光點的兩種變化值均與物料高度變化值相關:① 特征光點的像素位移值;② 特征光點間的成像點間距。式(1)表明了物料高度與特征光點的間距的線性映射關系,即物料高度與特征光點的間距成正比,比例系數僅與點光源的投射角度α、θ相關。
由于煤倉粉塵干擾比較大,并且煤塊的堆積狀況是隨機的,惡劣情形下可能導致點光源不能形成成像光斑或者成像光斑失真,因此用雙測量原理校正方式不失為一個好的選擇,特征光點像素的位移值計算具有獨立測量原理但又與上述測量方式共享測量器件,必然成為本文的首選校正測量方式。兩點效驗原理是一致的,取其中一點做分析。
假定點光源和CCD中線共面且交于一點,且CCD垂直于物面安裝。假定物面1為設定的參考零點,物面2為待測高度物面,則物面高度h與其它參數的關系為:
式(5)與文獻[1]中模型的區別在于h所關聯的參數是相對于參考面成像點的相對位移,而非相對于CCD中心線相對位移。
3 光斑成像特點分析及提取算法
影響測量精度的主要因素在于光斑質心坐標確定,圖3是典型的粉塵干擾下的成像光斑圖,也是光斑質心坐標確定誤差最大的干擾情形。目前已知的圖像處理算法很難適用于所有的圖像處理場合中,針對特定的圖像特征設計針對性的圖像處理算法不失為一種可行的工程設計選擇。圖3所示的粉塵干擾以及煤炭表明漫反射干擾的光斑圖顯示,煤炭表面由于漫反射形成若干隨機噪聲,這些隨機噪聲具有距離光斑中心距離相對較遠以及面積較小等特征。光斑中心由于粉塵干擾光斑的灰度梯度從邊緣到光斑中心均具有較大值,并且其梯度變化與粉塵的局部濃度相關,具有一定的隨機性。
圖像平滑的高斯函數表達式為:
(8)
高斯函數的二階方向導數為:
(9)
原始圖像f(x,y)變換后的輸出圖像F(x,y)的卷積分表達式為:
(10)
將pi記為灰度為i的像素點概率,ni為灰度為i的像素點個數,則在整個灰度級為N的圖像中,pi 的計算式為:
4 測量模型標定以及模型參數的在線辨識
測量的準確性一方面與光斑的檢測與提取相關,另一方面與模型的標定相關。式(4)與式(7)需要點光源與CCD鏡頭共面的假設條件,而實際安裝過程中很難滿足這一假設條件。因此式(4)中的參數a、b、H以及式(7)中的參數a、b需要修正以及標定。分別將式(4)與式(7)改寫成最小二乘參數辨識模型,分別有式(17)、式(18)。
重心法計算質心能有效利用光斑的高斯能量分布特點,能比較有效處理粉塵干擾后的灰度值噪聲,示值比較穩定。
5 測量數據及結論
系統采用的CCD像素為576*768,鏡頭焦距為5m,測量高度0~6000mm,圖像灰度化采用逆濾波算法進行預處理,再采用聚類分析進行Gauss-Laplachian算子閾值分割,光斑中心采用質心坐標計算,模擬現場環境采取隨機粉塵干擾,其測量結果如表1所示。
實驗數據結果表明,粉塵干擾對測量數據有較大影響,但誤差數據在可接受范圍內。測量數據的準確度一方面需要模型的精確性,這一點通過測量模型的參數辨識已基本解決,另一方面需要光斑質心的確定,這需要非常準確地提取光斑的質心坐標。雙輔助光源的設計、冗余測量原理的校正有助于提高測量數據的可靠性和穩定性。
[參考文獻]
[1] Luca Biancardi,Giovanna Sansoni,and Franco Docchio.Adaptive Wh ole-Field Optical Profilometry: A Study of the Systematic Errors,IEEE Trans.On Instrumentation and Measurement[J],1995,44(1):36-41.
[2] 宋華,孟曉風, 一種基于CCD的物位測量方法, 儀器儀表學報[J], 2002,23(2):115-118.
[3] 潘國林,高幼年, 基于機器視覺煤倉料位測量方法的研究, 上海電力學院學報[J],2007,32(2):176-178.