[더리포트] 한국국학진흥원이 고서 속의 한자를 자동 인식할 수 있는 시스템 개발을 진행해 1차년도 사업을 완료했다.
 
기존 문자인식 프로그램으로는 고서의 한자 인식에 한계가 많았다. 이에 한국국학진흥원은 유교책판의 활자를 인공지능 데이터로 구축해 고서의 한자를 자동으로 인식하는 작업을 해왔다.
 
1차 사업은 현재 약 80%의 정확도로 문자를 인식하는 수준에 도달했다. 이 결과는 최종 품질 검증을 거쳐 AI-Hub를 통해 공개될 예정이다.
 
고서 내용을 디지털 문자로 치환하는 이번 사업은 한국국학진흥원과 광학문자인식 인공지능 모델 개발 전문업체인 ㈜누리IDT 및 ㈜NHN다이퀘스트 등의 협업으로 이뤄졌다.
 
한자, 자동인식 및 변환 시스템 모습. (사진=한국국학진흥원)
한자, 자동인식 및 변환 시스템 모습. (사진=한국국학진흥원)

이번 ‘한자 인식 OCR 인공지능 모델 개발’은 인공지능(AI)이 가진 딥-러닝 기술 영역이다. 1차에선 글자수 기준 1000만자의 이미지를 입력하고 이를 인공지능이 지속적으로 학습할 수 있도록 한 것이다.

흥미로운 점은 이 사업이 본 궤도에 오를 경우 일반 사용자들이 유적지 등을 방문했을 때 한자로 기록된 현판이나 문서들을 이미지로 촬영해 한자의 뜻과 의미를 확인할 수 있게 된다는 점이다.

한국국학진흥원 정종섭 원장은 “산적해 있는 고서들을 활용하기 위한 첫 단계가 디지털화 작업인데 이번 1년차 사업만으로도 디지털화 속도가 몇 배 이상 빨라졌다”며 “향후 이미지 인식률을 높일 수 있는 사업을 계속 추진해나갈 것이며 이 결과물이 일반인들이 실생활에서 활용할 수 있는 서비스까지 이어질 수 있도록 노력하겠다”고 밝혔다.

저작권자 © 더리포트 무단전재 및 재배포 금지