DOI QR코드

DOI QR Code

Two-dimensional Automatic Transformation Template Matching for Image Recognition

영상 인식을 위한 2차원 자동 변형 템플릿 매칭

  • Han, Young-Mo (Department of Computer Engineering, Hanyang Cyber University)
  • 한영모 (한양사이버대학교 컴퓨터공학과)
  • Received : 2019.04.02
  • Accepted : 2019.09.06
  • Published : 2019.09.30

Abstract

One method for image recognition is template matching. In conventional template matching, the block matching algorithm (BMA) is performed while changing the two-dimensional translational displacement of the template within a given matching image. The template size and shape do not change during the BMA. Since only two-dimensional translational displacement is considered, the success rate decreases if the size and direction of the object do not match in the template and the matching image. In this paper, a variable is added to adjust the two-dimensional direction and size of the template, and the optimal value of the variable is automatically calculated in the block corresponding to each two-dimensional translational displacement. Using the calculated optimal value, the template is automatically transformed into an optimal template for each block. The matching error value of each block is then calculated based on the automatically deformed template. Therefore, a more stable result can be obtained for the difference in direction and size. For ease of use, this study focuses on designing the algorithm in a closed form that does not require additional information beyond the template image, such as distance information.

영상 인식을 위한 한 방법으로 템플릿 매칭이 있다. 기존의 템플릿 매칭에서는 주어진 매칭 영상 내에서 템플릿의 2차원 이동 변위를 바꿔가면서 블록 매칭 알고리즘(BMA)을 수행한다. 이 블록 매칭 알고리즘 수행 중에 템플릿의 크기와 모양은 바뀌지 않는다. 그리고 각각의 2차원 이동변위에 해당하는 블록에서 유사성 척도(similarity measure)로 계산된 매칭 에러 값을 비교하여 대상 체의 위치를 결정한다. 2차원 이동변위만 고려하기 때문에 템플릿과 매칭 영상에서 대상 체의 크기와 방향이 일치하지 않으면 성공률이 떨어진다. 반면 본 논문의 경우는 템플릿의 2차원 방향과 크기를 조정하는 변수를 새로이 추가하고 각각의 2차원 이동 변위에 해당하는 블록에서 이 변수의 최적 값이 자동으로 계산된다. 이렇게 계산된 최적 값을 사용하여, 각 블록에 최적인 템플릿으로 자동 변형된다. 그리고 자동 변형된 템플릿을 기준으로 각 블록의 매칭 에러 값이 계산된다. 이렇게 방향과 크기 차이가 보정된 각 블록의 매칭 에러 값들을 비교하여 대상 체의 위치를 결정한다. 따라서 방향과 크기 차이에 대해 좀 더 안정적인 결과 값을 얻을 수 있다. 사용의 편의를 위해서, 알고리즘을 템플릿 영상 외에 추가의 정보, 예를 들면, 거리정보를 필요로 하지 않는 닫힌 형태로 설계하는 데 주력한다.

Keywords

References

  1. F. Deng, L. Linbo, C. Li, F. Gao, Y. Yan, "A fast image matching algorithm and the application on steel-label recognition", 2018 5th International Conference on Information Science and Control Engineering (ICISCE), IEEE, Zhengzhou, China, pp. 21-24, July 2018. DOI: https://doi.org/10.1109/ICISCE.2018.00014
  2. M. V. Thomas, C. Kanagasabapthi, S. S. Yellampalli, "VHDL implementation of pattern based template matching in satellite images", 2017 International Conference on Smart Technologies for Smart Nation (SmartTechCon) , IEEE, Bangalore, India, pp. 820-824, August 2017. DOI: https://doi.org/10.1109/SmartTechCon.2017.8358487
  3. T. Adiono, R. F. Armansyah, F. D. Ikram, S. S. Nolika, R. V. W. Putra, A. H. Salman, "Parallel morphological template matching design for efficient human detection application", IEEE International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS) , IEEE, Phuket, Thiland, pp. 1-4, October 2016. DOI: https://doi.org/10.1109/ISPACS.2016.7824675
  4. B. Satish, P. Jayakrishnan, "Hardware implementation of template matching algorithm and its performance evaluation", International Conference on Microelectronics Devices, Circuits and Systems (ICMDCS) , IEEE, Vellore, India, pp. 1-7, August 2017. DOI: https://doi.org/10.1109/ICMDCS.2017.8211720
  5. M. B. Hisham, S. N. Yaakob, R. A. A. Raof, A. B. A. Nazren, N. M. W. Embedded, "Template maching using sum of squared difference and normalized cross correlation", 2015 IEEE Student Conference on Research and Development (SCOReD) , IEEE, Kuala Lumpur, Malaysia, pp. 100-104, December 2015. . DOI: https://doi.org/10.1109/SCORED.2015.7449303
  6. M. Bloesch, H. Sommer, T. Laidlow, M. Burri, G. Nuetzi, P. Fankhauser, D. Bellicoso, C. Gehring, S. Leutenegger, M. Hutter, R. Siegwart, A Primer on the differential calculus of 3D orientations, Technical Report, arXiv, Cornell University, pp. 1-6, Available From: https://arxiv.org/abs/1606.05285 (accessed Oct. 31, 2016)