나라지식정보가 2026년 공공AX 프로젝트 2차년도 착수보고회에서 ‘한국 근대 다문자 자료 활용 지원 AI 솔루션 개발 및 실증’ 사업을 발표했다.
이번 보고회는 정보통신산업진흥원이 주관하는 공공AX 프로젝트 계속과제 착수보고회로, 충북 진천에 위치한 정보통신산업진흥원 컨퍼런스홀에서 진행됐다. 행사에는 총 20개 컨소시엄이 참여했으며, 나라지식정보 컨소시엄의 발표는 세 번째 순서로 진행됐다. 발표는 PM을 맡은 정규상 이사가 담당해 2차년도 사업 추진 방향을 중심으로 설명했다.
나라지식정보 컨소시엄은 1차년도 사업을 통해 국사편찬위원회의 근대 자료 약 4만 건을 확보하고, 이미지 정제와 구조화 작업을 수행했으며 다문자 병렬 데이터 구축을 완료했다. 또한 AI OCR 기반 문자인식 모델을 비롯해 번역, 요약, 검색 기능을 갖춘 프로토타입을 개발했고, 워크벤치 기반 파일럿 시스템과 사용자 피드백 체계도 마련했다.
2차년도에는 20만 건 이상의 추가 자료 확보와 함께 한문, 일본어, 국한문 혼용문자뿐 아니라 세로쓰기와 필기체까지 인식 가능한 AI OCR 고도화에 집중할 계획이다. 특히 전처리 자동화 기술과 LLM 기반 보정 기술을 결합해 문자인식 정확도를 크게 향상시키는 것이 핵심 목표다.
이와 더불어 번역 및 요약 모델을 한층 고도화하고, RAG 기반 의미검색 시스템을 구축해 활용성을 높일 예정이다. 또한 국사편찬위원회의 역사정보시스템과 연계해 실증 적용을 추진하며, 국민이 직접 활용하고 의견을 반영할 수 있는 사용자 참여형 플랫폼도 함께 구축한다는 방침이다.
손영호 나라지식정보 대표는 “2차년도는 OCR 중심의 AI 기술을 실제 공공서비스로 확장하는 중요한 단계”라며 “향후에는 OCR 기반 시각장애인 보조기기와 범용 공공AX 통합 솔루션으로 발전시켜 누구나 지식정보에 쉽게 접근할 수 있는 환경을 만들겠다”고 밝혔다.
한편 나라지식정보는 2008년 설립 이후 한국어와 역사·문화 데이터를 기반으로 공공 데이터 및 AI 사업을 수행해 온 기업으로, 국립국어원과 국가기록원, NIA 등 180여 기관과 약 600건의 프로젝트를 진행해왔다. 자체 개발한 AI OCR 엔진 ‘NARA OCR’을 비롯해 RAG 기반 LLM ‘NA-LLM’, AI 에이전트 ‘주춧돌LM’ 등의 기술을 통해 아날로그 기록물의 디지털 전환을 지원하고 있으며, 이를 바탕으로 다양한 산업 분야에서 AI 데이터 구축과 활용 사업을 확대해 나가고 있다.
웹사이트: http://www.narainformation.com










