[Pocus 기획] "AI 쓰면 성적 올라도 끄면 추락한다"… AI 디지털 교과서의 역설

성과 127% 향상, AI 디지털 교과서 도입 뒤 숨겨진 메타인지 퇴화, 기억률 12%

OECD 보고서가 제안한 AI 수행평가와 증강 모델의 필요성

답 대신 힌트 주는 소크라틱 AI로 교사와 함께 사고력 강화


학습-성과 역설, 성적은 오르지만 사고력은 멈춘다
인공지능을 활용하면 과제 점수는 급상승하지만 실제 학습 능력은 오히려 하락한다. 경제협력개발기구가 최근 경고한 학습-성과 역설 현상의 핵심이다. 

 

한 실험 결과에 따르면 튜터형 인공지능을 사용한 학생들의 학업 성과는 127퍼센트 향상되었으나, 기기 접근을 차단하자 성과가 17퍼센트 추락했다. 제출하는 결과물은 훌륭하지만 해당 지식이 학생의 머릿속에 내재화되지 않는다는 의미다. 

 

한국 교육 현장도 예외는 아니다. 정부 주도로 인공지능 디지털 교과서 도입이 빠르게 추진되고 있으나, 실태 조사 결과 교사의 78퍼센트가 수업 시간에 이를 전혀 활용하지 않으며 실제 기기 접속률은 10퍼센트에 불과한 것으로 나타났다. 

 

기기를 도입하는 인프라 구축 속도는 빠르지만, 이를 현장에서 어떻게 가르칠 것인지에 대한 교수학습법 숙련도 사이에 큰 격차가 존재한다.
 

<Cognitive Illusion> Prompted by The Imaginary Pocus, Generated by Gemini


왜 인공지능을 쓰면 정답은 맞히는데 기억하지 못할까?
주요 원인으로 학생이 스스로 생각하는 과정을 외부 도구에 전적으로 위탁하는 인지적 외주화 현상이 지목된다. 기계의 빠르고 정교한 답변은 학생에게 자신이 내용을 완벽히 이해했다는 착각을 불러일으킨다. 

 

이를 학습의 착시라고 부른다. 실제 측정 결과, 기기에 의존해 문제를 해결할 때 학생의 지식 기억률은 12퍼센트에 불과했다. 반면 스스로 고민하며 문제를 풀었을 때는 89퍼센트의 기억률을 보였다. 

 

자신이 아는 것과 모르는 것을 정확히 파악하고 조절하는 메타인지 능력이 크게 저하된 것이다. 기계가 기억과 계산, 의사결정을 대신하면서 인간 고유의 비판적 사고력은 퇴화할 위험에 처했다.


인프라 확충에 매몰된 한국, 공교육이 직면한 세 가지 시나리오
당장 2026학년도부터 교육부의 새로운 인공지능 수행평가 가이드라인이 현장에 적용된다. 과제를 수행할 때 도구 활용 기록을 반드시 남겨야 하며, 무단으로 생성된 결과물을 그대로 제출하면 부정행위로 간주되어 0점 처리된다. 

 

현시점에서 한국 공교육이 선택할 수 있는 대응 시나리오는 세 가지로 분석된다. 

첫째는 현재 한국이 취하고 있는 인프라 우선 정책으로, 기기 보급은 빠르나 교사의 교수학습법이 미성숙하다는 한계를 지닌다. 

 

둘째는 경제협력개발기구가 권고하는 교사 역량 중심 정책이다. 성과를 내기에는 확실하지만 제도를 정착시키는 데 상당한 시간과 비용이 소요된다. 

 

셋째는 가장 이상적인 대안으로 평가받는 인간과 기술의 균형 시나리오다. 도구는 탐색을 돕고 인간 교사가 관계성과 사고력을 이끌어내는 방식이다. 

 

영국, 미국, 유럽연합 등 주요 선진국들은 단순한 기기 도입을 넘어 기계를 사고 보조 도구로 제한하고 교육 과정에서 인간의 개입을 강조하는 동향을 보이고 있다.


교체와 보완을 넘어, 교사 인공지능 팀포징의 최적 해법은 무엇인가?
이러한 모순을 통제하고 교육 패러다임을 정상화하기 위해 전문가들은 교사 인공지능 팀포징 모델을 대안으로 제시한다. 기술과 교사가 협력하는 방식은 크게 세 가지로 나뉜다. 

 

첫 번째인 교체 모델은 기계가 교사의 역할을 대신하는 구조로 가장 부정적인 교육 성과를 기록한다. 

 

두 번째인 보완 모델은 교사와 기계가 작업을 물리적으로 분리해 수행하며 중간 수준의 성과에 그친다. 

 

현장에서 가장 권장되는 세 번째 해법은 바로 증강 모델이다. 

 

교사가 수업 전체를 설계하고 기술을 통제된 보조 도구로만 활용하는 이 방식을 적용하면, 교사의 업무 시간은 31퍼센트 절약되면서도 학생의 학업 성과는 최고 수준을 기록하는 것으로 나타났다.


소크라틱 스피럴과 휴먼 인 더 루프, 상상하는 인간을 위한 방향
증강 모델이 교실에서 성공적으로 작동하기 위한 핵심 원칙은 기계가 정답을 주지 않는 것이다. 도구가 단계별 힌트만 제공하여 학생 스스로 사고의 범위를 넓히고 상상하도록 유도하는 소크라틱 인공지능 스피럴 방식이 필수적으로 도입되어야 한다. 

 

기술의 완벽함보다 중요한 것은 인간 스스로 고민하고 묻고 창조하는 과정 그 자체다. 따라서 최종적인 교육적 판단과 평가는 기계의 출력물보다 인간 교사의 전문성이 항상 우선되는 휴먼 인 더 루프 원칙이 지켜져야 한다. 

 

학생이 기계의 정답에 종속되지 않고 능동적으로 상상하는 주체로 성장할 때 비로소 진정한 의미의 학습이 성립된다.


[FAQ]
Q: 학습-성과 역설이란 정확히 어떤 현상인가요? 
A: 인공지능을 활용해 과제를 수행하면 단기적인 결과물 수준은 크게 오르지만, 기기 사용을 막았을 때 학생이 문제를 해결하는 능력은 오히려 떨어지는 현상입니다. 겉보기 성과만 좋아지고 실제 배움은 일어나지 않는 구조적 모순을 의미합니다.

 

Q: 인공지능으로 공부하면 왜 사고력이 떨어지나요? 
A: 학생이 스스로 인지하고 고민해야 할 과정을 기계에 완전히 위탁하는 인지적 외주화 때문입니다. 완성된 고품질의 답변을 보며 본인이 이해했다고 착각하게 되며, 이로 인해 지식을 기억하는 비율이 12퍼센트 수준까지 급감합니다.

 

Q: 2026년부터 도입되는 교육부 수행평가 가이드라인의 핵심은 무엇인가요? 
A: 과제를 수행할 때 인공지능을 활용한 내역을 반드시 기록으로 남겨 제출해야 합니다. 출처를 밝히지 않고 도구가 생성한 글이나 이미지를 그대로 제출하면 부정행위로 간주되어 0점 처리됩니다.

 

Q: 학교 현장에 인공지능 디지털 교과서가 도입되면 바로 효과가 나타날까요
A: 인프라 도입 속도에 비해 교사들의 교수학습법 숙련도가 미성숙하여 단기간에 효과를 보기는 어렵습니다. 실제 조사에서도 교사의 78퍼센트가 수업에 이를 활용하지 않으며 접속률도 10퍼센트에 그치는 등 현장의 혼란이 존재합니다.

 

Q: 교체, 보완, 증강 모델 중 교육 현장에 가장 적합한 방식은 무엇인가요? 
A: 교사가 수업을 철저히 통제하고 기계를 보조 수단으로만 쓰는 증강 모델이 가장 이상적입니다. 교사의 행정 시간을 31퍼센트 단축하면서도 학생의 학업 성과는 극대화할 수 있기 때문입니다.

[전문 용어 사전]
▪️학습-성과 역설: 외부 도구를 활용해 단기적인 과제 성과는 크게 높아지지만, 정작 학생 본인의 실제 인지적 학습 능력은 향상되지 않거나 오히려 하락하는 현상

 

▪️인지적 외주화: 인간이 스스로 수행해야 할 기억, 계산, 문제 해결 등의 두뇌 인지 과정을 외부 도구에 전적으로 맡겨버리는 현상.

▪️소크라틱 인공지능 스피럴: 기계가 즉각적인 정답을 제공하는 대신 단계적인 힌트와 질문을 던져 학생 스스로 생각하고 답을 찾도록 유도하는 설계 방식

 

▪️교사 인공지능 팀포징 (증강 모델): 교사와 인공지능이 협력하는 모델 중 하나로, 교사가 주도권을 가지고 수업을 설계하며 기계를 철저히 보조 도구로만 활용해 성과를 극대화하는 방식.


▪️휴먼 인 더 루프: 자동화된 시스템이 도출한 결과물을 그대로 수용하지 않고, 최종 단계에서 반드시 인간 전문가의 개입과 전문적 판단을 거치는 통제 원칙



 

작성 2026.06.13 00:38 수정 2026.06.13 00:46

RSS피드 기사제공처 : The Imaginary Pocus / 등록기자: 이민혁 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.