[칼럼 - 이규철] AI교과서(51) - 기계학습(Machine Learning)

▲이규철/한국공공정책신문 칼럼니스트 ⓒ한국공공정책신문

 [한국공공정책신문=최진실 기자]  


기계학습이란?

기계학습(Machine Lear

ning)은 컴퓨터가 데이터를 사용하여 스스로 학습하고 패턴을 발견하거나 미래를 예측하는 기술이다. 즉 기계학습은 컴퓨터가 데이터에서 배우고 경험을 쌓아 스스로 진화하는 기술이다. 메일이 스팸인지 아닌지를 판단하는 필터처럼 많은 사례에서 이건 스팸이다라고 배움으로써 새로운 메일에 대해서도 정확하게 판단할 수 있게 된다. 인간이 하나하나의 규칙을 프로그램하는 것이 아니라 알고리즘에 데이터를 부여함으로써 기계가 스스로 적응하고 똑똑해져 간다.

 

기계학습의 기본적인 구조


기계학습의 기본적인 과정은 다음과 같은 단계로 진행한다. 데이터 수집이다. 학습하기 위해서는 대량의 데이터가 필요하다. 데이터는 텍스트, 이미지, 음성 등 다양한 형식이 있으며 모델 훈련에 사용된다. 데이터 전처리다. 원시 데이터(raw data)는 그대로는 기계가 이해하기 어렵기 때문에 클렌징(cleansing, 결손치나 잡음의 처리), 정규화 등의 사전 처리를 실시하여 모델에 최적의 형태로 정돈한다. 손대지 않은 상태의 데이터가 원시 데이터이다. 가공되기 전에 처음에 기록된 상태 그대로의 데이터를 말한다


모델 선택이다. 기계학습에는 많은 알고리즘이 있다. 데이터의 성질이나 목적에 맞추어 최적의 알고리즘을 선택한다. 대표적인 알고리즘으로는 회귀분석, 결정목(), 지원 벡터 머신(SVM), 신경망(neural network) 등이 있다. 모델 트레이닝이다. 전처리한 데이터를 사용하여 모델을 트레이닝(training) 한다. 모델이 패턴을 학습하고 미래 예측 및 분류를 할 수 있도록 한다


모델 평가. 훈련된 모델이 얼마나 정확한지 테스트 데이터를 사용하여 평가한다. 정밀도, 재현율, F 등의 지표를 이용하여 모델의 성능을 측정한다. 모델 개선이다. 평가결과를 바탕으로 모델을 개선한다. 파라미터(parameter)를 조정하거나 알고리즘을 변경하여 더 나은 예측을 할 수 있도록 한다.

 

기계학습의 종류


기계학습에는 주로 세 가지 종류가 있다. 교사가 있는 학습이다. 라벨 부착 데이터를 사용하여 학습한다. 예컨대, 손으로 쓴 숫자를 식별하는 모델을 만들 경우, 숫자가 적힌 이미지와 그 정답(라벨)을 이용해 학습한다. 교사가 없는 학습이다. 라벨이 없는 데이터를 사용하여 패턴을 찾는 학습이다. 예컨대, 고객을 그룹으로 나누는 클러스터 분석 등에 사용한다. 강화학습이다. 에이전트가 환경과 상호 작용하면서 시행착오를 반복하고 보상을 최대화하도록 학습한다. 자율주행차나 게임의 AI에 사용되는 경우가 많다.

 

기계학습의 응용사례


기계학습은 우리의 일상생활의 많은 부분에 응용되고 있다. 그 일부로 이미지 인식이다. 사진 앱에서 얼굴을 인식하거나 의료 이미지에서 병으로 인하여 일어나는 육체(생리)적인 변화를 발견할 수 있다. 음성인식이다. 스마트 스피커에 말을 걸면 그 목소리를 이해하고, 음악을 재생하거나 질문에 대답하거나 한다. 추천 시스템이다. 온라인 쇼핑이나 동영상 전송 서비스로 사용자에게 맞는 상품이나 콘텐츠를 추천하는 시스템이다.

 

이규철 / 법학박사(상법)

AI·GPT, SDGs&ESG 코치 및 강사

100세대학 크리에이터 및 칼럼니스트

생성AI와 챗GPT, SDGs·ESG경영전략,

글로벌 MBAtoCEO, 리더의 필승전략,

100세대학 행복디자인 매뉴얼 등 27

일본(와세다대),중국(복단대·화동정법대)

 

 


작성 2025.12.21 22:31 수정 2025.12.21 22:32

RSS피드 기사제공처 : 한국공공정책신문 / 등록기자: 최진실 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.