사람처럼 문서 이해하는 AI 기술 나왔다

입력 2021.09.07 17:41

기자명 이진수 기자

한국전자통신연구원, 한글 행정문서 질의응답(QA), 패러프레이즈 API 공개

[더리포트=이진수기자] 국내 연구진이 사람처럼 문서를 이해하고 원하는 정보를 찾을 수 있는 인공지능 기술을 개발했다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 7일 밝혔다.

이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식한다.

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

한국전자통신연구원(ETRI) 연구원들이 문서 이해하는 AI 기술을 시연하고 있다. (사진=ETRI)

이 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다.

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다.

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다.

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다.

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 이 기술을 개발했다.

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다.

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다.

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다.

이 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.

기자명 이진수 기자 report@thereport.co.kr

기자의 [다른기사 보기]

개의 댓글

BEST댓글

BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.

댓글삭제

삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?

댓글수정

댓글 수정은 작성 후 1분내에만 가능합니다.

내 댓글 모음

우리금융, 자선경매 수익금으로 발달장애인 지원 경제

[포토] 거실 인테리어 완성 ‘더유닛’ 소파 더포토

신한금융그룹, 사회공헌 브랜드 ‘아름다운 동행’ 론칭 경제

마스턴투자운용, 장애인 인식개선 교육···“포용 문화 정착” 경제

신한은행, 장애예술인들과 아름다운 동행···‘상림’ MV 경제

하나은행, 1분기 시중은행 퇴직연금 수익률 1위···3.2%↑ 경제

은행·카드 상담 한 번에···KB금융, 계열사간 고객센터 연계 상담 시작 경제

SK하이닉스, TSMC와 손잡고 차세대 HBM 개발 IT·과학

지그재그, 헤어케어 상품 거래액 10배↑ 라이프

1 김동연 경기도지사 "경제위기 돌파구, 사회적기업에 있다" 2024.04.18 18:38

2 경기신용보증재단, 출연실적 우수 6개 시군에 감사패 수여 2024.04.18 18:49

3 IMF “韓, 환율 변동성보다 인플레이션 먼저 잡아야” 2024.04.19 09:05

4 해태아이스 마루 브랜드, 네이버웹툰 ‘마루는 강쥐’와 협업 2024.04.19 09:15

5 한 달 내내 ‘면세일’···롯데免, 역대 최대 온라인 페스타 2024.04.19 09:30

6 하이트진로, ‘청정라거 테라·히조 작가’ 아트 협업 에디션 2024.04.19 09:15

상단영역

검색

본문영역

전체메뉴

검색