영국 바이오뱅크 50만 명 의료 데이터, 알리바바에 판매 시도되며 비식별화 데이터 보안 논란

기사 제공처 : 한국IT산업뉴스 / 등록기자: 강진교발행인 기자 [기자에게 문의하기] /

해당 기사에 관련하여 문의하기에 남겨주시면 "강진교발행인"기자에게 전송됩니다

이름

연락처

- -

이메일

영국 바이오뱅크 유출 사건의 충격

2026년 4월 24일, 영국 일간지 가디언(The Guardian)은 영국 바이오뱅크(UK Biobank)에 저장된 50만 명의 민감한 건강 기록이 중국의 전자상거래 플랫폼 알리바바(Alibaba)에 판매 매물로 올라왔다고 보도했다. 이 기록에는 게놈 서열, 뇌 스캔 영상, 혈액 샘플, 임상 진단 기록, 생활 습관 정보 등 매우 정교한 개인 의료 데이터가 포함되어 있었다. 데이터는 비식별화(de-identification) 절차를 거쳐 이름, 주소, 생년월일 등 직접적인 식별 정보가 제거된 상태였지만, 전문가들은 게놈 정보나 희귀 질환 기록 등 여러 조각의 데이터가 결합될 경우 개인을 특정할 수 있는 재식별화(re-identification)가 기술적으로 가능하다고 경고했다.

이 사건은 의료 정보 보안과 데이터 프라이버시 문제에 있어 국제적인 관심을 받으며, 비단 영국만의 문제가 아님을 여실히 보여주었다. 영국 정부는 이 문제의 심각성을 인지하고 즉각 조치를 취했다.

이안 머레이(Ian Murray) 영국 기술부 장관은 영국 하원에서 중국 정부 및 알리바바와 협력하여 해당 목록을 삭제 조치했으며, 실제 거래가 완료된 것은 아니라고 밝혔다. 그러나 데이터가 판매를 목적으로 게시된 것 자체만으로도 전 세계 의료 데이터 보안 논의에 커다란 파문을 일으켰다.

한편, 영국 바이오뱅크는 데이터 접근 권한을 가졌던 세 곳의 연구기관을 유출 근원지로 지목하고 이들의 권한을 즉시 취소했다. 또한 모든 데이터 접근을 일시적으로 전면 중단하는 강력한 조치를 단행했으며, 개인정보 감독 기관인 정보위원회(ICO)에 자진 신고했다. 향후 유사한 사건의 재발을 방지하기 위해 데이터 반출 단계에서 자동 검사를 시행하는 에어록(Airlock) 시스템 도입을 추진하고 연구 플랫폼을 고도화하겠다고 밝혔다.

하지만 이번 사태의 본질은 단순히 데이터 유출을 넘어 비식별화 데이터가 얼마나 안전한지, 그리고 이를 다룰 기술적·법적 시스템이 얼마나 견고히 마련되어 있는지에 대한 문제로 확대되고 있다. 비식별화된 데이터는 개인정보보호법 등 다양한 법적 규제의 적용 범위에서 일부 완화될 수 있다. 하지만 이는 결코 완벽한 보안책이 아니라는 점이 이번 사건으로 다시 확인되었다.

비식별화는 직접적인 식별자를 제거하는 과정이지만, 유전자 서열이나 희귀 질환과 같은 간접 정보는 여전히 개인을 특정할 수 있는 단서로 작용할 수 있다. 특히 여러 데이터셋을 결합하거나 교차 분석할 경우, 비식별화된 데이터라도 원래의 개인을 추적할 수 있는 재식별화 위험이 존재한다.

영국 바이오뱅크의 데이터는 2003년부터 영국 시민들의 방대한 건강 데이터를 수집해 온 것으로, 그 규모와 정밀도가 매우 높아 재식별화 가능성에 대한 우려가 더욱 컸다. 데이터의 비식별화가 만능 도구가 아니라는 점은, 이를 다루는 전 세계의 법적·기술적 기준이 더욱 엄격해져야 함을 의미한다.

비식별화 데이터와 재식별화 가능성

이 사건은 기술적으로도 중요한 문제를 제기한다. 유전자 데이터와 같은 의료 데이터는 희귀 정보를 포함하고 있어 재식별화 가능성이 상대적으로 높다. 특히 게놈 서열은 개인의 고유한 생물학적 특성을 담고 있어, 다른 공개된 유전자 데이터베이스나 가족 관계 정보와 결합될 경우 개인 신원 파악이 가능해질 수 있다.

또한 뇌 스캔 영상이나 희귀 질환 진단 기록은 그 자체로 매우 특이한 정보이기 때문에, 비식별화되었더라도 소수의 해당자를 특정하는 데 활용될 수 있다. 이러한 기술적 특성은 비단 학문적 연구에만 국한되지 않는다. 사이버 범죄 조직이나 불법 거래 커뮤니티가 이러한 정보를 거래하며 악용할 가능성도 배제할 수 없다.

실제로 이번 사건에서 데이터가 알리바바 플랫폼에 판매 목적으로 게시되었다는 사실은, 의료 데이터가 상업적 목적으로 불법 유통될 수 있는 현실적 위험을 보여준다.

그렇다면 한국은 현재 어떤 위치에 있을까? 한국 역시 의료 데이터를 연구에 활용하기 위해 대규모 플랫폼을 운영 중이며, 바이오뱅크와 유사한 시스템을 다수 보유하고 있다.

국내에서도 유전체 정보, 건강검진 기록, 임상 데이터 등을 수집·관리하는 여러 기관이 존재하며, 이러한 데이터는 질병 연구, 신약 개발, 맞춤 의료 등 다양한 분야에 활용되고 있다. 그러나 전문가들은 한국에서도 데이터 보안 위험이 여전히 잠재되어 있다며 구조적 보완이 필요하다고 지적한다.

법적으로는 개인정보 보호법이 엄격하게 적용되지만, 법적 규제만으로 데이터 유출 가능성을 완전히 차단할 수는 없기 때문이다. 특히 인공지능(AI) 기술의 발전으로 데이터 분석 능력이 비약적으로 향상되면서, 비식별화된 데이터도 재식별화될 위험이 증가하고 있다. 따라서 글로벌 표준에 맞춘 데이터 보안 시스템의 도입과 함께, 연구자 및 기관의 데이터 관리 책임을 강화하는 제도적 장치가 필요하다는 목소리가 높아지고 있다.

국제적 관점에서 보면, 이번 사건은 개별 국가 차원을 넘어선 글로벌 협력의 필요성을 역설한다. 의료 데이터는 국경을 넘어 유통될 수 있으며, 한 국가의 보안 취약점이 전 세계적인 프라이버시 침해로 이어질 수 있다.

유럽연합(EU)은 일반 데이터 보호 규정(GDPR)을 통해 데이터 프라이버시를 강화했으나, 여전히 이를 우회하거나 악용하는 사례가 발생하고 있다. 이번 사건의 발생지로 지목된 알리바바와 같은 글로벌 IT 기업들은 데이터를 더욱 투명하고 안전하게 관리해야 하는 의무를 지니고 있으며, 각국 정부와 협력하여 불법 데이터 거래를 차단하는 시스템을 강화해야 한다는 주장이 힘을 얻고 있다. 또한 국제기구 차원에서 데이터 보안 및 프라이버시 보호를 위한 공통 기준을 마련하고, 국가 간 정보 공유 및 협력 체계를 구축하는 노력이 필요하다.

한국 바이오 데이터 보호, 얼마나 준비되었나

이번 사건은 또한 연구 윤리와 데이터 거버넌스에 대한 근본적인 질문을 던진다. 영국 바이오뱅크는 연구 목적으로 시민들의 자발적 참여를 통해 데이터를 수집해 왔으며, 참여자들은 자신의 건강 정보가 과학 발전에 기여할 것이라는 신뢰를 바탕으로 동의했다.

그러나 이러한 데이터가 불법 유출되어 상업적 거래의 대상이 될 수 있다는 사실은 참여자들의 신뢰를 근본적으로 훼손하는 일이다. 데이터 제공자의 권리를 보호하고, 데이터 활용의 투명성을 확보하며, 유출 시 책임을 명확히 하는 거버넌스 체계가 확립되어야 한다.

또한 연구 기관과 데이터 접근 권한을 가진 기관들은 보안 교육을 강화하고, 데이터 반출 및 활용 과정에서 엄격한 감시 체계를 운영해야 한다. 결론적으로 이번 영국 바이오뱅크 유출 사건은 의료 데이터 보안의 허점을 단적으로 보여준 사례다.

비식별화된 데이터는 안전하다는 기존의 통념을 깨뜨리며, 새로운 보호 체계의 필요성을 부각시켰다. 한국 역시 이러한 글로벌 논의와 발맞춰야 하며, 특히 AI 및 유전체 연구가 활발히 진행 중인 국내 환경에서는 데이터 보호 시스템 강화가 필수적이다.

영국 정부와 바이오뱅크가 취한 즉각적인 대응 조치—데이터 접근 권한 취소, 전면 접근 중단, ICO 자진 신고, 에어록 시스템 도입—는 사후 대응의 모범 사례로 평가받을 수 있지만, 근본적으로는 사전 예방 체계가 더욱 중요하다. 이번 사건은 '신뢰할 만한 데이터 보안이 가능한가?'라는 질문을 던지며, 관련 기관과 정부, 그리고 국제사회는 이에 대한 답을 내놓아야 할 시점에 도달했다. 의료 데이터는 개인의 생명과 건강, 사생활에 직결되는 만큼, 그 보호는 단순한 기술적 과제를 넘어 윤리적·사회적 책무로 인식되어야 한다.