나라지식정보 인문인공지능연구소가 개발한 ‘근대 시기 문서 다국어 OCR 기술’이 중국 베이징대학교와 수도도서관으로부터 ‘우수 연구’로 선정되며, 글로벌 디지털 인문학 분야에서의 기술력을 인정받았다.
이번 선정은 지난 7월 20일부터 22일까지 열린 ‘2025 동아시아 고전을 위한 디지털 인문학 연례 국제학술대회(DHEAC 2025)’에서 이루어졌다. 이 학술대회는 ‘인공지능 시대의 문화유산’을 주제로, 베이징대학교 디지털 인문학연구센터와 중국 수도도서관이 공동 주최했다.
세부 주제로는 ‘코퍼스 및 의미 자원 개발’, ‘모델과 알고리즘’, ‘지식 그래프 문화 분석 및 계산’, ‘플랫폼 및 리소스 개발’, ‘고전학의 전문 분야’, ‘문화유산의 디지털화와 활성화’, ‘무형문화유산 디지털화’, ‘스마트 라이브러리 및 통합 출판’, ‘커리큘럼 및 학문 개발’ 등이 다뤄졌다.
나라지식정보의 안준모, 장태홍, 김소정 연구원이 공동 수행한 본 연구는 희소성과 해석 난이도로 인해 그간 연구가 어려웠던 옛한글 및 다국어 근대 문서에 대한 OCR 기술을 개발한 것으로, 동아시아 고전 해석에 중요한 기여를 할 수 있다는 점에서 높은 평가를 받았다.
DHEAC는 서울과 항저우 등지에서 세 차례 열린 바 있으며, 올해는 한국의 동아시아지식문화교육원이 협력기관으로 참여해 국제 학문 교류의 장을 넓혔다. 학술대회는 도서관, 연구기관, 디자인·크리에이티브 산업, 관련 업계 등이 협력해 AI 기반 고전 자료 개발과 활용 방안을 모색하는 플랫폼으로 기능하고 있다.
김소정 연구소장은 “중국의 딥시크, 큐웬 등 AI 분야 성과 뒤에는 문화유산 해석에 대한 국가적 관심과 투자가 뒷받침되고 있다”며, “나라지식정보도 한국의 역사와 문화 AI 연구 발전에 기여하겠다”고 밝혔다. 이어 향후 RAG와 MLM(Multi Large Language Model)을 활용한 고도화된 AI 연구 계획도 함께 발표했다.
한편 나라지식정보는 최근 자체 보유한 KOLAS 인증 AI OCR 기술과 최신 VLM을 결합한 PoC 테스트에서 기존 성능을 능가하는 결과를 확보했으며, 연내에는 데이터 전처리 자동화 기능이 포함된 통합 솔루션을 공개할 예정이다.
2008년 설립된 나라지식정보는 국립국어원, 국가유산청, 한국은행 등 180여 개 기관과 600여 건 이상의 프로젝트를 수행해왔으며, 2020년 이후 NIA AI 학습용 데이터 구축 사업, 2023년 관광추천 시스템(TRS) 및 RAG LLM 기술 개발을 포함한 다양한 AI 콘텐츠 사업도 추진 중이다.
2024년에는 이노비즈 AA등급을 포함해 혁신성장형 벤처기업, 강소기업, 가족친화기업 인증과 함께 장애인 표준사업장 자회사 ‘한소울지식정보’를 설립하며 사회적 역할도 강화했다. 2025년에는 자체 기술과 최신 AI 기술을 결합한 새로운 솔루션으로 도약을 예고하고 있다.








