一般來說基于圖像處理的自動對焦的方法有兩種,第一種是通過計算對焦深度得到的,第二種是通過計算離焦深度得到的。
這兩種方法的原理說明起來比較麻煩,簡單來說,離焦深度方法是從離焦圖像中獲得模糊程度和深度信息,根據二者加上對應的拍攝參數來計算清晰度評價值,并結合這些所有值,得到需要調整的具體量,因為需要的圖像較少,所以速度較快。
對焦深度方法要麻煩一些,首先需要一系列模糊程度不同的圖像,計算這一系列圖像的清晰度評價值,之后對這一系列值以擬合的方式得到評價曲線,根據評價曲線的峰值確定最佳對焦位置,這種方法精度高,但速度慢。
需要說一點題外話就是,雖然這個些過程一樣,但不同的廠商的計算方法其實有些不同,所以一樣的對比度對焦,有的廠家就快,有的廠家就慢。
這兩種方法都不離開一個東西,就是清晰度評價值,清晰度評價值類似一個統計量,是根據一些參數經過某種處理之后得到的,當然清晰度評價值還有其他的要求,比如有效性/魯棒性等。
平常計算清晰度評價值的方法一般有這么幾種(不全面,還有其他的很多):
第一種是頻譜函數的方法,清晰的圖像對比相應的不清晰圖像在相應頻譜分量上含有更多的信息,一種反映出來就是頻譜函數的幅值,可以利用這種方法評價。
第二種是信息熵,清晰的圖像的信息熵大于相應的不清晰圖像,這個原始證明很繁瑣,所以這里用數據處理定理反證:1.清晰的圖像處理后可以得到不清晰的圖像。 2.但不清晰的圖像無論如何處理都不能單獨得到清晰的圖像。 3.所以清晰圖像的信息熵大于相應的不清晰圖像,如果有方法計算出信息熵,則可以用熵來評價。
第三種是梯度函數,在圖像中梯度函數是一個可以衡量某變量變換率快慢的函數,正確對焦的圖像有較為清晰的邊緣,而在邊緣的地方更為銳利,往往有變化率的最大值,或者說變化最不連續,如此一來也可以評價清晰度。
現在常用的是第三種,也就是梯度,梯度在數學上是變換率的表征,在實際計算的時候我們可以用方差、能量梯度或者拉普拉斯算子(等價于二階微分)或者其他一些方法來實現,這些計算方法本身各自的復雜度不同,但最影響計算量的是選取圖像中像素點的多寡,比如一個對比度對焦選款,是取中央一點,還是邊緣四點,還是對角線五點?這都是各個相機廠家考慮的問題。