Issn 2091-5446 ilmiy axborotnoma научный вестник scientific journal


Scale Invariant Features Transform (SIFT)


Download 1.19 Mb.
Pdf ko'rish
bet5/12
Sana28.12.2022
Hajmi1.19 Mb.
#1009554
1   2   3   4   5   6   7   8   9   ...   12
Bog'liq
ilovepdf merged

Scale Invariant Features Transform (SIFT) 
The SIFT algorithm takes an image and transforms it into a collection of local feature vectors. Each 
of these feature vectors is supposed to be distinctive and invariant to any scaling, rotation or translation of 
the image. SIFT algorithm consists of the following steps: 
Creating the Difference of Gaussian Pyramid (Scale-Space PeakSelection): The first stage is to 
construct a Gaussian, "scale space", function from the input image. This is formed by convolution (filtering) 
of the original image with Gaussian functions of varying scales. The difference of Gaussian (DoG), 
𝐷(𝑥, 𝑦, 𝜎) = 𝐿(𝑥, 𝑦, 𝑘𝜎) − 𝐿(𝑥, 𝑦, 𝜎), where 𝐿(𝑥, 𝑦, 𝜎) and 𝐿(𝑥, 𝑦, 𝑘𝜎), are two images that produced 
from the convolution of Gaussian functions with an input image I
(𝑥, 𝑦) with 𝜎 and 𝑘𝜎 respectively, and
𝐺(𝑥, 𝑦, 𝜎) =
1
2𝜋𝜎
2
𝑒𝑥𝑝 [−
𝑥
2
+𝑦
2
𝜎
2
]represents Gaussian function [14].
Extrema Detection: In this step, keypoints are detected. To do so, the local maximum and minimum 
of D(x,y,σ) is computed by compared the pixel with the pixels of all its 26 neighbors. 
Unreliable Keypoints Elimination: This stage attempts to eliminate some points from the candidate 
list of keypoints by finding those that have low contrast (sensitive to noise) or are poorly localised on an 
edge. 
Orientation Assignment: This step aims to assign one or more orientation to the keypoints based 
on 
local 
image 
properties. 
The 
histogram 
is 
formed 
from 
𝑚(𝑥, 𝑦) =
√(𝐿(𝑥 + 1, 𝑦) − 𝐿(𝑥 − 1, 𝑦))
2
+ (𝐿(𝑥, 𝑦 + 1) − 𝐿(𝑥, 𝑦 − 1))
2
and 
𝜃(𝑥, 𝑦) = arctan(𝐿(𝑥, 𝑦 + 1) − 𝐿(𝑥, 𝑦 − 1)) /(𝐿(𝑥 +
1, 𝑦) − 𝐿(𝑥 − 1, 𝑦)) 
which represent gradient and orientation of sample points within a region around the 
keypoint [14–16]. 
Each sample is weighted by its gradient magnitude and by a Gaussian weighted circular window with 
σ that is 1.5 times that of the scale of the keypoint. 
We locate the highest peak in the histogram and use this peak and any other local peak to create a 
keypoint with that orientation. Some points will be assigned multiple orientations if there are multiple peaks 
of similar magnitude. The assigned orientation, location and scale for each keypoint enables SIFT features 
to be robust to rotation, scale and translation. 

Download 1.19 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling