목차
▪️숙제는 18% 오르고 시험은 20% 하락한 실증 데이터
▪️상위권 학생일수록 '보이지 않는 학습 손실'이 큰 이유
▪️가짜 성취감이 부른 사고 과정의 위임 현상
▪️저렴한 AI 튜터가 교육 격차를 구조적으로 키울 우려
▪️무엇을 묻는가보다 어떻게 쓰는가가 더 중요하다
▪️FAQ
▪️[전문 용어 사전]

숙제는 18% 오르고 시험은 20% 하락한 실증 데이터
생성형 AI가 학생들의 단기 과제 수행 능력을 향상시키지만, 실전 문제 해결 능력은 저하시킨다는 대규모 실증 연구 결과가 발표되었다.
유럽경제정책연구센터(CEPR)가 중국 중고등학생 2만 6,811명을 30개월간 추적 관찰한 패널 데이터에 따르면, AI를 학습 보조 도구로 사용한 학생들은 숙제 점수가 18% 오르고 과제 완료 시간은 30% 단축되었다. 하지만 6개월 뒤 AI 접근이 차단된 비공개 시험에서는 성적이 오히려 20% 하락했다.
경제협력개발기구(OECD)의 ‘디지털 교육 전망 2026’ 보고서가 인용한 튀르키예 고등학생 대상 실험에서도 튜터형 GPT-4를 활용한 집단은 연습 점수가 향상되었으나, 통제된 실제 시험에서는 AI를 쓰지 않은 학생들보다 17% 낮은 점수를 기록했다.
이는 AI가 단기적인 과제 효율성은 높일지언정 실제 지식 습득과 사고의 전이로 이어지지는 않음을 실증적 데이터로 보여준다.
상위권 학생일수록 '보이지 않는 학습 손실'이 큰 이유
복잡한 문제를 스스로 해결해 내는 지적 훈련 과정이 생략되기 때문이다. CEPR 연구에 따르면, 스스로 문제를 풀어내는 습관이 잡혀 있던 상위권 학생일수록 AI에 의존했을 때 성적 하락 폭이 더 컸다.
특히 이러한 학업 성취도 저하는 즉각적으로 드러나기보다는 길게는 최대 2년이 걸린다는 점에서 '보이지 않는 학습 손실'이라 불린다. AI가 풀이 과정을 제공하면 학생들은 스스로 논리를 구성하며 고민하는 시간을 건너뛰게 된다.
과제를 완벽하게 제출하는 데 익숙해진 나머지, 정작 통제된 시험 환경에 놓이면 기초적인 문제 전이 능력조차 발휘하지 못하는 것이다. 이는 한국의 사교육 중심 선행학습이나 내신 수행평가 과정에서도 유사한 양상으로 나타날 위험이 높다.
학업 성취도가 높은 학생일수록 고도화된 AI 도구를 활용해 결과물을 포장할 확률이 높고, 결과적으로 본질적인 사고력 훈련 기회를 잃어버리게 된다.
가짜 성취감이 부른 사고 과정의 위임 현상
이러한 학업 성취도 하락의 근본 원인은 뇌가 스스로 사고하는 과정을 기계에 넘기는 인지적 의존 현상과 관련이 깊다. OECD는 이를 두고 학생들이 학습의 착시에 빠져 있다고 분석했다.
완성도 높은 답변을 내놓는 AI와 상호작용하는 동안, 학생들은 기계가 산출한 결과물을 자신의 실제 실력이라고 착각하는 가짜 성취감을 경험한다.
뇌를 관찰한 일부 연구에서도 AI를 처음부터 습관적으로 사용한 학생들은 스스로 논리를 전개한 학생들에 비해 뇌 활성도가 떨어지고 기억력이 약화된 것으로 나타났다.
과제를 제출했다는 표면적인 행위가 곧 지식의 내면화를 의미하지 않음에도, 기술이 주는 편의성이 사고 과정의 위임을 유도하여 뇌의 핵심 인지 기능을 쓰지 않게 만드는 셈이다.

저렴한 AI 튜터가 교육 격차를 구조적으로 키울 우려
무분별한 AI 의존은 구조적인 교육 불평등을 심화시키는 새로운 요인으로 작용할 수 있다. 고급 AI 기술과 훌륭한 인간 교사의 지도를 병행할 수 있는 부유한 계층은 기계를 사고 확장의 도구로 활용할 수 있다.
반면, 교사의 세밀한 피드백을 받기 어려운 저소득층 학생들은 단순 정답만을 제공하는 저가형 AI 튜터에 의존도가 높아질 우려가 있다. 당장 눈앞의 숙제나 단기 시험 점수 격차는 줄어드는 것처럼 보일지 모른다.
그러나 복잡한 상황을 분석하고 스스로 문제를 해결하는 본질적인 역량의 차이는 구조적으로 확대될 위험이 있다. 이는 장기적으로 노동시장에서 요구하는 비판적 사고력과 창의성의 격차로 이어져 새로운 교육 격차를 고착화할 수 있다.
무엇을 묻는가보다 어떻게 쓰는가가 더 중요하다
결국 교실 현장에 디지털 기술을 투입하는 것 자체가 학업 성취를 담보하지는 않는다. 핵심은 기계의 전원을 끄고 나서도 독립적으로 문제를 해결할 수 있는 휴먼 인텔리전스를 지켜내는 일이다.
OECD는 AI를 훌륭한 보조 바퀴로 비유하며, 평생 보조 바퀴에 의존해 달릴 수는 없다고 경고한다. 도입을 앞둔 AI 디지털교과서와 교육 시스템 역시 효율성을 높이는 방향을 넘어, 질문을 던져 학생 스스로 답을 찾아가도록 유도하는 형태로 설계되어야 한다.
따라서 교육 현장에서는 무엇을 묻는 AI인지보다 어떻게 쓰는 AI인지가 더 중요하다. 교사 또한 알고리즘이 제시하는 커리큘럼의 단순 집행자를 넘어, AI의 결과물을 비판적으로 검증하고 학생 개개인의 맥락을 살피는 최종 결정권자로서 주도권을 확보해야 한다.
FAQ
Q : 이 연구 결과를 한국 교육(내신·수능) 환경에 그대로 적용할 수 있나?
A : 과제용으로 AI를 남용하면 단기 성과는 오르지만, 통제된 시험에서는 문제 전이 능력을 잃어 성적이 크게 하락할 위험이 있다.
Q : 단순 숙제용 AI와 교실 수업 내 AI(튜터링)를 사용할 때의 결과는 서로 다른가?
A : 확연히 다르다. 정답만 바로 내놓는 일반 AI는 장기적인 학습 손실을 부르지만, 힌트를 주며 사고를 유도하는 튜터형 AI는 학습 효과를 크게 높인다.
Q : 부작용이 크다면 학교에서 AI 사용을 원천 금지하는 정책이 해법인가?
A : 무조건적인 금지보다는 올바른 활용 가이드라인 마련이 해법이다. 학생이 스스로 고민하고 문제를 해결하는 인지적 훈련 과정을 AI가 대체하지 않도록 안전장치를 두어야 한다.
Q : 교육 당국이나 일선 학교는 당장 어떤 대응 지침을 마련해야 하나?
A : 기초 개념은 기계의 개입 없이 학생 스스로 먼저 습득하게 해야 한다. 또한 교사가 AI 산출물을 비판적으로 검증하고 통제하는 평가 시스템을 도입해야 한다.
Q : 이 중국 중고생 대상 30개월 추적 연구가 가지는 한계점은 무엇인가?
A : 중국 특유의 교육 및 입시 환경을 바탕으로 진행되었다는 점이다. 따라서 한국 등 각국의 고유한 교육 체계에 맞춘 후속 교차 검증 연구가 필요하다.
[전문 용어 사전]
▪️보이지 않는 학습 손실: AI 등 보조 도구에 의존하여 겉보기에 과제 수행력은 높아 보이지만, 실제 문제 해결 능력 저하가 최대 2년에 걸쳐 서서히 나타나는 현상.
▪️가짜 성취감: 기계가 산출해 낸 완성도 높은 결과물을 학습자 본인의 실력으로 오인하여 스스로 학습을 완료했다고 느끼는 착각.
▪️튜터형 AI: 학생에게 단순히 답을 알려주는 것이 아니라, 힌트를 주거나 질문을 유도하여 학습자 스스로 사고하고 원리를 깨우칠 수 있도록 설계된 교육 특화 인공지능.
▪️사고 과정의 위임: 학습자가 스스로 고민하고 문제를 해결해야 할 인지적 과정을 인공지능 기계에 전적으로 의존하여 넘겨버리는 현상.
▪️휴먼 인텔리전스: 기계의 데이터 처리 능력과 대비되는 인간 고유의 지적 능력으로, 맥락을 파악하고 비판적으로 사고하며 복잡한 문제를 주도적으로 해결해 내는 역량.










