나라지식정보, 2026년 공공AX 2차년도 착수보고회서 ‘한국 근대 다문자 자료 AI 솔루션 개발 및 실증’ 사업 발표

민관 협력 기반 OCR 중심 AI 플랫폼 개발·실증 및 확산 추진

공공에 AI 선도 적용… 근대 다문자 자료 활용 혁신 본격화

20만 건 이상 근대자료 추가 확보… 한문·일어·국한문 혼용, 세로쓰기, 필기체까지 대응 AI OCR 고도화

기사보기 상단_1

과학기술정보통신부 산하 정보통신산업진흥원(NIPA)의 공공AX 프로젝트 사업 계속과제 착수보고회가 충북 진천 정보통신산업진흥원 컨퍼런스홀에서 열렸다. 이번 보고회는 통합 보고회로서 공공AX 과제 20개 컨소시엄이 모두 참여했으며, 나라지식정보 컨소시엄(주관기관 나라지식정보, 참여기관 리스트)이 수행하는 ‘한국 근대 다문자 자료 활용 지원 AI 솔루션 개발 및 실증’ 사업의 발표는 세 번째로 진행됐다. 발표는 PM 정규상 이사가 맡아 2차년도 사업 추진 방향을 설명했다. 앞서 1차년도에는 국사편찬위원회 근대자료 약 4만 건을 확보하고, 이미지 정제·구조화 및 다문자 병렬 데이터 구축을 완료했다. 

<이미지출처: 나라지식정보>

또한 AI OCR 기반 문자인식 모델과 번역·요약·검색 프로토타입을 개발하고, 워크벤치 기반 파일럿 시스템과 사용자 피드백 구조를 구축했다. 올해 2차년도에는 20만 건 이상의 근대자료를 추가 확보하고, 한문·일어·국한문 혼용문자와 세로쓰기, 필기체까지 대응 가능한 AI OCR 고도화에 집중한다. 특히 전처리 자동화와 LLM 기반 보정 기술을 결합해 문자인식 정확도를 획기적으로 향상시킬 계획이다. 

 

이와 함께 번역·요약 모델 고도화, RAG 기반 의미검색 시스템 구축, 국사편찬위원회 역사정보시스템 연계를 통한 실증 적용을 추진한다. 사용자 참여형 플랫폼을 통해 국민이 직접 활용하고 피드백할 수 있는 구조도 구현할 예정이다. 나라지식정보 손영호 대표는 “이번 2차년도는 OCR 중심 AI 기술을 공공서비스로 전환하는 핵심 단계”라며 “향후 OCR 기반 시각장애인 보조기기와 범용 공공AX 통합 솔루션으로 확장해 국민 누구나 지식정보에 접근할 수 있는 환경을 구축하겠다”고 밝혔다.

IT개발자협동조합 기자단 기자 kodec@devtimes.co.kr
작성 2026.04.10 10:42 수정 2026.04.10 11:27

RSS피드 기사제공처 : 청년개발자신문 / 등록기자: IT개발자협동조합 기자단 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.