AI, 편견의 벽을 허물다: ‘소리 차별’ 받던 흑인 영어, 마침내 인식 성공

음성 비서의 ‘언어 장벽’… 아프리카계 미국인 발음 인식 오류율, 표준 영어 대비 35% 높아

하워드 대학과 구글의 협력, 1,000시간 분량의 데이터로 AI의 ‘귀’를 새로 훈련시키다

기술적 진보를 넘어 사회적 포용으로… 포용적 AI가 창출할 150억 달러의 경제 가치

인공지능(AI) 음성 비서가 특정 억양과 방언을 제대로 인식하지 못하는 ‘기술적 차별’ 문제가 심화되는 가운데, 미국 하워드 대학교와 구글 연구소가 아프리카계 미국인 영어(AAE)의 인식률을 획기적으로 개선하는 데 성공해 주목받고 있다. 이번 협력 프로젝트는 AI 기술의 편향성을 바로잡고 디지털 포용성을 높이는 중요한 이정표가 될 것으로 평가된다.

AI 음성 인식 기술의 뿌리 깊은 편향성

일상에서 사용하는 스마트폰의 음성 비서가 자신의 말을 제대로 알아듣지 못해 불편을 겪는 경험은 더 이상 낯설지 않다. 특히 아프리카계 미국인 영어(AAE) 사용자 수백만 명에게 이는 매일 마주하는 현실이다. 2025년 LA타임스 보고서에 따르면, 주요 음성 비서 서비스는 흑인 특유의 언어적 리듬과 어휘를 잘못 해석하거나 인식하지 못하는 경우가 빈번하며, 이로 인해 사용자들은 기계에 맞춰 자신의 발음을 ‘표준어’로 바꿔야만 했다.

이러한 문제의 근원은 AI 음성 인식 기술의 개발 역사에 있다. 1950년대부터 발전해 온 이 기술은 대부분 일반 미국식 영어(General American English) 데이터셋을 기반으로 구축되었다. 이 과정에서 사회·경제적으로 소외된 공동체의 고유한 방언들은 훈련 데이터에서 배제되었다. 연구에 따르면 흑인 사용자는 시리(Siri)나 알렉사(Alexa) 같은 음성 비서를 사용할 때 최대 35% 더 높은 단어 인식 오류율을 경험하는 것으로 나타났다. 이는 단순한 불편을 넘어 정보 접근성의 격차를 심화시키는 디지털 소외 현상으로 이어졌다.
 


해결의 실마리, ‘흑인 목소리 가치 향상 프로젝트’

이러한 기술적 장벽을 해소하기 위해 2024년 초, 하워드 대학교와 구글 연구소는 ‘흑인 목소리 가치 향상 프로젝트(Project Elevate Black Voices)’를 공동으로 출범시켰다. 이 프로젝트의 핵심은 역사상 가장 방대한 규모의 AAE 음성 데이터셋을 구축하는 것이다. 하워드 대학의 언어학자들은 다양한 연령, 지역, 문화적 배경을 가진 흑인 커뮤니티 구성원들로부터 1,000시간이 넘는 실제 대화를 수집했다. 구글 연구진은 이 데이터를 활용해 자사의 주력 음성 인식 모델을 재학습시켰다.

프로젝트를 이끈 하워드 대학의 모니크 존슨 수석 언어학자는 “AAE는 속어나 불완전한 영어가 아니라, 고유한 문법과 음성학적 체계, 그리고 역사를 지닌 언어”라며, “이를 무시하는 것은 수백만 명의 목소리를 외면하는 것과 같다”고 강조했다. 사회 운동가들 역시 이 프로젝트를 단순한 기술 개선이 아닌, 동등한 권리를 보장하기 위한 노력의 일환으로 평가하고 있다. 실제 초기 테스트 결과, 새로운 모델을 적용했을 때 AAE 사용자의 단어 오류율은 기존 28%에서 12%까지 극적으로 감소한 것으로 확인되었다(2025년 7월, 구글 리서치 블로그).

포용적 AI의 사회·경제적 파급 효과

이러한 기술적 변화가 중요한 이유는 통계가 뒷받침한다. 2025년 퓨 리서치 센터(PEW Research) 조사에 따르면, 아프리카계 미국인 가정의 스마트 스피커 보급률은 미국 전체 평균보다 30% 빠르게 증가하고 있다. 또한 전체 음성 검색의 60%가 모바일 기기에서 발생하는 현실에서, AI가 특정 사용자의 말을 이해하지 못하면 서비스 접근, 긴급 구조 요청, 의료 정보 획득 등 필수적인 기회로부터 배제될 수 있다.

세계은행(World Bank)은 2024년 보고서에서 포용적 AI 기술이 소외되었던 사용자들의 불편을 줄여주는 것만으로도 2030년까지 약 150억 달러의 새로운 경제적 가치를 창출할 수 있을 것으로 전망했다.
 


인식 기술을 넘어, 진정한 소통을 향하여

이번 프로젝트는 시작에 불과하다. 전문가들은 남부 흑인 영어, 카리브해 크리올, 치카노 영어 등 다른 소수 방언에 대해서도 유사한 데이터 구축 프로젝트가 시급하다고 목소리를 높이고 있다. AI가 개인 비서, 교사, 의료 보조원의 역할을 하게 될 미래 사회에서, 모든 사람의 목소리를 ‘들을’ 수 있는 능력은 누가 미래 경제에 참여할 수 있는지를 결정하는 핵심 요소가 될 것이다.

만약 우리의 기기가 마침내 인류의 다채로운 언어적 스펙트럼을 모두 포용하게 된다면, 우리는 앞으로 어떤 편견을 더 발견하고 수정해 나갈 수 있을지 귀추가 주목된다. 이번 프로젝트는 기술이 모든 구성원의 목소리를 동등하게 반영해야 한다는 사회적 과제를 제시하며, 진정한 포용적 AI 시대로 나아가는 중요한 이정표로 기록될 것이다.

 

 

작성 2025.08.18 08:24 수정 2025.08.18 08:25

RSS피드 기사제공처 : 리뉴타임스 / 등록기자: 윤두희 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.