피앤피뉴스 - 인공지능으로 국가기록원 기록물 접근성 향상 됐다

  • 구름조금원주18.5℃
  • 흐림울진15.7℃
  • 흐림부여17.4℃
  • 흐림해남20.5℃
  • 구름많음북강릉14.6℃
  • 흐림남해18.9℃
  • 흐림밀양19.8℃
  • 구름많음충주17.0℃
  • 흐림진주19.2℃
  • 흐림목포18.2℃
  • 흐림안동16.5℃
  • 흐림추풍령16.0℃
  • 구름많음의성17.7℃
  • 흐림장수15.6℃
  • 흐림금산16.7℃
  • 흐림고창16.5℃
  • 구름많음제천15.8℃
  • 흐림봉화15.4℃
  • 구름많음군산17.9℃
  • 흐림상주17.9℃
  • 구름많음보령17.4℃
  • 흐림북춘천16.2℃
  • 흐림성산23.4℃
  • 흐림광양시19.8℃
  • 구름조금양평17.7℃
  • 구름많음속초17.0℃
  • 흐림거창17.6℃
  • 흐림의령군18.3℃
  • 구름많음북창원20.0℃
  • 구름많음영월15.7℃
  • 흐림부산20.1℃
  • 구름많음철원14.9℃
  • 흐림양산시20.6℃
  • 흐림경주시17.8℃
  • 흐림울릉도13.0℃
  • 흐림영덕15.0℃
  • 구름조금서산17.3℃
  • 흐림흑산도18.1℃
  • 흐림남원16.5℃
  • 구름조금이천17.3℃
  • 구름많음인제15.1℃
  • 흐림서청주16.9℃
  • 흐림함양군18.6℃
  • 구름많음구미17.8℃
  • 흐림대구18.6℃
  • 구름많음인천16.5℃
  • 흐림여수19.1℃
  • 구름많음보은17.3℃
  • 구름많음백령도12.7℃
  • 흐림고흥19.5℃
  • 구름많음대전19.0℃
  • 맑음홍천14.9℃
  • 흐림북부산20.0℃
  • 흐림문경16.9℃
  • 구름많음세종17.5℃
  • 구름많음전주17.2℃
  • 흐림임실16.8℃
  • 구름많음정선군15.9℃
  • 흐림광주18.4℃
  • 흐림고산21.9℃
  • 구름많음청송군17.0℃
  • 구름많음청주18.1℃
  • 비울산16.7℃
  • 흐림순창군17.1℃
  • 구름많음춘천16.3℃
  • 흐림대관령11.8℃
  • 흐림서귀포23.2℃
  • 흐림통영19.7℃
  • 흐림포항18.4℃
  • 흐림김해시20.0℃
  • 박무홍성17.1℃
  • 흐림산청18.4℃
  • 흐림영천17.4℃
  • 흐림장흥20.5℃
  • 구름많음부안16.9℃
  • 구름조금서울17.9℃
  • 흐림거제19.7℃
  • 구름조금수원18.3℃
  • 흐림고창군16.7℃
  • 구름많음창원20.5℃
  • 흐림태백12.9℃
  • 구름많음영주15.7℃
  • 흐림보성군20.4℃
  • 흐림순천18.3℃
  • 흐림완도20.2℃
  • 구름많음천안17.0℃
  • 구름많음동해14.7℃
  • 흐림정읍16.5℃
  • 비제주22.8℃
  • 흐림강릉15.1℃
  • 흐림강진군20.3℃
  • 구름조금동두천
  • 구름많음파주15.4℃
  • 흐림합천18.7℃
  • 흐림진도군18.7℃
  • 흐림영광군16.2℃
  • 흐림강화15.4℃

인공지능으로 국가기록원 기록물 접근성 향상 됐다

이선용 / 기사승인 : 2020-12-23 15:00:00
  • -
  • +
  • 인쇄

국가기록 인공지능.jpg


국가인재원, 국내 최초 인공지능 (AI)기반 한글 타자기록 문자인식 기술 개발  

 

[공무원수험신문, 고시위크=이선용 기자] 1960년대부터 1990년대까지 정부에서 주로 사용되었던 타자기록을 쉽고 간편하게 검색하고 활용할 수 있게 된다.

 

국가기록원은 딥러닝 기반으로 약 22만 개의 한글 타자체 단어를 학습시켜 국내 최초로 비전자 타자기록의 인공지능(AI) 문자인식(OCR) 기술 개발에 성공했다고 22일 밝혔다.

 

이러한 기술은 국가기록원이 ‘20년 연구개발 사업의 일환으로 인공지능 스타트업 기업과 협업하여 수행한 「소장기록물 특성을 고려한 OCR 인식 성능 개선방안 연구」 과제를 통해 개발됐다.

 

국가기록원은 “그동안 문서를 이미지로 스캔한 파일을 제공해왔으나, 문서내용 검색에는 한계가 있어 이용자들의 불편이 있었다”라며 “특히 기존의 문자인식 기술은 활자체에 최적화되어 있어, 사람이 손으로 쓰거나 타자를 이용하여 작성된 문서의 경우에는 효과가 크지 않았다”라고 설명했다.

 

이어 “이번 개발에 사용된 학습데이터는 1960~1990년대까지 재무부, 외무부, 건설교통부 등에서 생산한 도시계획, 경제계획 문서와 국무회의, 경제장관회의 등의 회의록 및 각종 법령 등을 대상으로 하고 있다”라며 “올해는 1단계로 공공기관에서 컴퓨터가 보급되기 이전에 주로 사용해 왔던 타자기록에 대해 문자인식 연구를 추진했다”라고 전했다.

 

또한 “기존의 문자인식 기술과는 달리 문자탐지와 문자인식의 2단계로 구성된 딥러닝 기반의 인공지능 문자인식 모델을 개발하여 학습 속도를 개선하고 인식성능을 90% 이상 획기적으로 높였다”라며 “앞으로 국가기록원은 문자인식 기술을 적용·발전시켜 국민들이 보다 쉽고 편리하게 기록물을 활용할 수 있도록 비전자 기록물의 원문 검색 및 색인 등의 정보 활용 서비스에 확대 적용할 계획”이라고 덧붙였다.

 

한편, 이번에 구축된 학습데이터는 국가기록원 누리집을 통해 공개될 예정이다. 

[저작권자ⓒ 피앤피뉴스. 무단전재-재배포 금지]

WEEKLY HOTISSUE

뉴스댓글 >

많이 본 뉴스

초·중·고

대학

공무원

로스쿨

자격증

취업

오피니언

종합