1.실습 샘플 다운로드 후 압축 해제
lhttps://kr.object.ncloudstorage.com/ocr-lab/sample.zip
lhttps://kr.object.ncloudstorage.com/ocr-lab/ocr_py.zip
2. CLOVA OCR 사용 신청
l서비스 이용 신청 및 약관 동의
lCLOVA OCR -> Subscription -> 이용 신청
. TEXT OCR 실습
lGeneral 도메인 생성
l도메인 생성 -> 일반/템플릿 생성 클릭
•도메인 이름 : ai-ncai-ocr 입력 후 중복 확인
•도메인 코드 : ai-ncai-ocr 입력 후 중복 확인
•지원 언어 : 한국어 선택
•서비스 타입 : 일반 선택
•> 일반 : 텍스트 추출만 가능 (Region 당 1개만 생성 가능)
•> 템플릿 : 템플릿 빌더 제공
l하단의 생성 버튼 클릭
lGeneral 도메인 생성 확인
lGeneral 도메인 Table 버튼 활성화 – 표 영역을 구조화하여 보여주는 기능
l활성화 후 우측의 ‘데모’버튼 클릭
l제공된 sample 폴더 내 image 중 sample_general_ocr_demo.png 파일 업로드
lOCR TEXT 판독 결과 확인
lOCR Table 판독 결과 확인
Template OCR 실습
lTemplate 도메인 생성
•도메인 생성 -> 일반 / 템플릿 도메인 생성
•도메인 이름 : ncai-ocr-template 입력 후 중복 확인
•도메인 코드 : ncai-ocr-template 입력 후 중복 확인
•지원 언어 : 한국어 선택
•서비스 타입: 템플릿 선택
•인식 모델 : premium 선택
•서비스 플랜 : Advanced 선택 후 하단의 ‘생성’ 버튼 클릭
lTemplate 도메인 생성 확인
l템플릿 빌더 실행 : 생성한 도메인 오른쪽 끝에 템플릿 빌더 버튼 클릭
l
l템플릿 빌더 화면에서 템플릿 목록 선택 후 템플릿 생성 버튼 클릭
l템플릿 명 : Insurance 입력 후 확인 클릭
•제공된 sample image 중 sample_insurance_claim.png 파일 업로드
대표 샘플 설정
•대표 샘플명 : 보험청구서 입력
•템플릿 명이나 템플릿 분류가 가능한 필수 항목이 포함된 영역
•유사어 관리 : 템플릿 분류 성능 향상에 도움을 주기 위해
대표샘플명과 유사한 단어나 문장 입력 (필수 아님) → 보험 청구서를 선택
•+ 필드 추가 클릭
•필드 01 : + 필드 추가 → 필드 이름 : 성명
•필드 02 : + 멀티박스 → 필드 이름 : 생년월일
•필드 03 : + 체크박스 → 필드 이름 : 상해 입력. 후 상해 우측 설정 버튼 클릭
•True : 예, False : 아니오 입력
•필드 04 : + 체크박스 → 필드 이름 : 질병 입력 후, 질병 우측 설정 버튼 클릭
•True : 예, False : 아니오 입력
•필드 05 : + 체크박스 → 필드 이름 : 교통사고 입력 후, 교통 사고 우측 설정 버튼 클릭
•True : 예, False : 아니오 입력
•필드 06 : + 필드 추가 → 필드 이름 : 사고내원경위
•필드 07 : + 멀티 박스 → 필드 이름 : 휴대전화1
•필드 08 : + 멀티 박스 → 필드 이름 : 휴대전화2
•필드 09 : + 멀티 박스 → 필드 이름 : 휴대전화3
•상단의 ‘판독 결과 결합’ 클릭
•판독 결과 결합 : 개별 정의한 필드의 값을 추출하여 결합
•필드 07 – 필드 08 – 필드 09
•
l하단의 ‘확인’버튼 클릭
. 템플릿 배포
l배포 관리 화면으로 이동 후 베타 배포
l베타 배포는 모델에 반영되는 최종 저장 기능으로 템플릿에 적용한 샘플, 판독 영역 및 용어사전 등을 학습할 수 있음
l
l베타 배포 후 화면
베타 템플릿 배포
l테스트 화면으로 이동 후 파일 업로드 기능을 통해 테스트 할 테스트 데이터 등록
l템플릿 생성 시 사용했던 sample_insurance_claim.png 파일 업로드 후 판독 결과 확인
l
l베타 적용 확인 후, 좌측 배포관리 > 서비스 배포 클릭
다음
https://brunch.co.kr/@topasvga/5000