從影像辨識進展到影像理解_PART2.使用卷積運算的特徵提取
從使用微分的邊緣特徵量(edge-based feature)提取開始。 邊緣特徵量是表示影像中亮度變化較大部分的特徵量,常用於物體的輪廓提取。 座標(x, y)的亮度變化量可以透過對(x, y)的像素值進行微分來表示。 由於影像座標系統是2維的會有兩個x,y變數,這邊底下會改用偏微分的符號 $\partial$ 就代表 partial,來取代單變數微分的萊布尼茲符號 $\frac{d}{dx}$。 若對 x 軸方向進行微分,可得到水平方向的邊緣特徵量 若對 y 軸方向進行微分,則可得到垂直方向的邊緣特徵量。 座標 $(x, y)$ 的垂直方向邊緣特徵量 $E_x(x, y)$ 與水平方向邊緣特徵量 $E_y(x, y)$ 分別取微分的絕對值。 其公式如 [1.1] 與 [1.2] 所示: $$E_x(x, y) = \left| \frac{\partial}{\partial x} I(x, y) \right| \simeq | I(x+1, y) - I(x, y) | \quad [1.1]$$ $$E_y(x, y) = \left| \frac{\partial}{\partial y} I(x, y) \right| \simeq | I(x, y+1) - I(x, y) | \quad [1.2]$$ 其中 $I(\cdot, \cdot)$ 代表指定座標處的像素值。 由於像素值在相鄰像素之間是離散變化的,因此無法精確計算微分,因為連續函數才能做微分,因此只能用差分來做取代,我們使用離散近似。透過這個方法我們可以為每個像素產生一階導數。邊緣位於一階導數取極值的位置。 連續世界的導數公式定義如下 $$ \frac{\partial I}{\partial x}(x, y) = \lim_{h \to 0} \frac{I(x+h, y) - I(x, y)}{h} $$ https://medium.com/@sarcas0705/computer-vision-derivative-over-image-e1020354ddb5 但像素一格一個走,沒有 h → 0。 所以用最常見的 前向差分(在函數的某點,使用該點及下一點的函數值來計算變化率)。 以x為變數對整個I影像函數來做偏維,視y為常數。 $$ \frac{\p...