공공AX 본격화… 근대 다문자 자료 AI 전환 속도 높인다

과학기술정보통신부 산하 정보통신산업진흥원의 공공AX 프로젝트 계속과제 착수보고회가 충북 진천 컨퍼런스홀에서 열렸다.


이번 보고회는 공공AX 과제 20개 컨소시엄이 참여한 통합 보고회로 진행됐다. 나라지식정보 컨소시엄이 수행하는 ‘한국 근대 다문자 자료 활용 지원 AI 솔루션 개발 및 실증’ 사업은 세 번째로 발표됐다. 발표는 PM 정규상 이사가 맡아 2차년도 추진 방향을 설명했다.


1차년도에는 국사편찬위원회 근대자료 약 4만 건을 확보하고 이미지 정제와 구조화, 다문자 병렬 데이터 구축을 완료했다. 이어 AI OCR 기반 문자인식 모델과 번역, 요약, 검색 프로토타입을 개발했으며 워크벤치 기반 파일럿 시스템과 사용자 피드백 구조도 구축했다.


2차년도에는 20만 건 이상의 근대자료를 추가 확보하고 한문과 일어, 국한문 혼용문자, 세로쓰기, 필기체까지 인식 가능한 AI OCR 고도화에 집중한다. 전처리 자동화와 LLM 기반 보정 기술을 결합해 문자인식 정확도를 높이는 것이 핵심이다.


번역과 요약 모델을 고도화하고 RAG 기반 의미검색 시스템을 구축한다. 국사편찬위원회 역사정보시스템과 연계한 실증 적용도 추진한다. 사용자 참여형 플랫폼을 통해 국민이 직접 활용하고 피드백하는 구조를 구현할 계획이다.

작성 2026.04.06 09:47 수정 2026.04.06 09:47

RSS피드 기사제공처 : 출판교육문화 뉴스 / 등록기자: ipecnews 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.