brunch

You can make anything
by writing

C.S.Lewis

by 에이아이스쿨 Oct 16. 2021

딥러닝 기술을 활용한 차량 번호판 인식

Text Detection과 OCR 기술의 결합


딥러닝 기술과 컴퓨터 비전 기술을 응용할 경우, 다양한 산업분야에서 부가가치를 만들어낼 수 있습니다.

그 중에서도 차량 번호판 인식(License Plate Recognition)은 딥러닝 기술과 컴퓨터 비전 기술이 실용적으로 응용될 수 있는 대표적인 응용 분야 중에 하나입니다.

차량 번호판 인식에 필요한 딥러닝과 컴퓨터 비전 기술

차량 번호판 인식 예시

차량 번호판 인식을 수행하기 위해서는 크게 글자 검출(Text Detection)과 OCR(Optical Character Recognition) 기술이 필요합니다. 각각의 기술에 대해서 간략히 살펴보면 다음과 같습니다.


글자 검출(Text Detection)

글자 검출(Text Detection)은 이미지 내에 존재하는 글자의 위치를 검출하는 컴퓨터 비전 기술입니다. 이때 이미지 내에 글자가 있는 위치영역만을 바운딩 박스(Bounding Box)로 검출하며, 바운딩 박스 안의 글자가 무엇인지는 인식하지 않습니다.

글자 검출(Text Detection) 예시

차량 번호판 인식에 응용하는 경우를 생각해보면 전체 차량 이미지 내에서 차량 번호판이 있는 위치영역을 찾는데 글자 검출(Text Detection) 기술이 응용 될 수 있습니다.




OCR(Optical Character Recognition)

OCR(Optical Character Recognition)은 글자 검출(Text Detection)으로 찾은 바운딩 박스내에 실제로 어떤 글자가 있는지를 인식하는 컴퓨터 비전 문제영역입니다. 

전통적으로 텍스트 문서내에 글자를 인식해주는 OCR 기술들이 연구되었지만 최근에는 정형화된 텍스트(e.g. 인쇄된 문서) 외에 다양한 백그라운드 환경하에서 있는 글자(e.g. 상점 간판에 적혀 있는 글자, 차량 번호판에 적혀 있는 글자)에 대한 OCR을 수행하는 기술들도 활발히 연구되고 있습니다. 이런 좀더 다양화된 백그라운드에 대한 OCR 수행을 OCR in the wild라고 부릅니다.

OCR의 예시

차량 번호판 인식에 응용하는 경우를 생각해보면 글자 검출(Text Detection)로 찾은 차량 번호판 위치내에 적힌 실제 번호판 숫자를 인식하는데 OCR 기술이 응용될 수 있습니다.




글자 검출과 OCR를 수행하는데 사용되는 딥러닝 모델들

최근 다양한 기관과 연구자들이 글자 검출과 OCR를 수행하기 위한 다양한 딥러닝 모델들을 제안하고 있습니다.

그중에서 유명한 모델들을 몇가지를 살펴보면 글자 검출(Text Detection)의 경우, 네이버의 AI 연구 자회사인 CLOVA에서 제안한 CRAFT (Character Region Awareness for Text Detection)라는 모델이 유명합니다.

CRAFT 모델을 이용한 글자 검출(Text Detection) 예시 (출처 : https://arxiv.org/pdf/1904.01941.pdf)

OCR의 경우, 구글에서 제안된 Attention OCR이라는 딥러닝 모델이 유명합니다.

Attention OCR을 활용한 OCR 예시(출처 : https://arxiv.org/pdf/1704.03549.pdf)


이런 딥러닝 모델들을 조합한다면 차량 번호판 인식을 위한 딥러닝 모델들을 만들어 볼 수 있습니다.


References

[1] https://arxiv.org/pdf/1904.01941.pdf

[2] https://arxiv.org/pdf/1704.03549.pdf

[3] https://github.com/clovaai/CRAFT-pytorch

[4] https://github.com/tensorflow/models/tree/master/research/attention_ocr


작가의 이전글 베이즈 정리(Bayes’ Theorem)의 정의와 의미
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari