[한국공공정책신문=김유리 기자]
◇ 기계학습의 개념
기계학습(machine learning)이란 데이터를 분석하기 위해 사용하는 방법 중 하나이다. 방대한 데이터 속에서 프로그램이 알고리즘이라는 일정한 법칙을 찾을 수 있도록 학습시키는 것이다. 기계학습은 주로 AI를 만들 때 프로그래밍에서 사용되는 경우가 많다. AI는 스스로 판단하는 프로그램이지만 판단을 하려면 기준이 있어야 한다. 그 기준으로 기계학습으로 만들어낸 알고리즘을 사용한다.
◇ 기계학습의 방법
기계학습을 하기 위해서는 프로그램에 데이터를 주고 알고리즘을 학습시켜야 한다. 그 방법에는 다음의 3가지 나뉜다. ① 교사가 있는 학습, ② 교사가 없는 학습, ③ 강화학습이다. 위 3가지는 각각 주는 데이터의 내용이 다르고 목적도 다르다. 그렇기 때문에 어떤 프로그램을 만드느냐에 따라서 구분해서 사용하는 것이 중요하다.
◇ 교사가 있는 학습
교사가 있는 학습에서는 입력 데이터와 그 답이 되는 출력 데이터를 미리 준비해 둔다. 그리고 입력 데이터에 따른 답을 내놓을 수 있는 프로그램을 만드는 것이 목적이다. 프로그램은 입력 데이터와 출력 데이터를 교사로서 가르칠 수 있는 형태로 학습하기 때문에 교사이자 학습이라고 불린다. 그 교사가 있는 학습은 기상 데이터를 바탕으로 날씨를 예상하거나 메일을 나누거나 하는 등, 사전에 분류하는 그룹이 정해져 있는 경우에 활용할 수 있는 수법이다.
◇ 교사가 없는 학습
교사가 없는 학습에서는 출력 데이터는 준비하지 않는다. 입력 데이터만으로 프로그램이 독자적인 법칙을 찾아 분류해 간다. 프로그램을 유도하는 교사가 되는 데이터가 없기 때문에 교사가 없는 학습이라고 불린다. 기본적으로 사람으로는 법칙을 알 수 없는 대량의 데이터를 분류하는 프로그램을 만들기 위해 사용한다. 그리고 프로그램이 스스로 법칙을 찾아야 하기 때문에 교사가 있는 학습보다 시간이 오래 걸리기 쉽다.
◇ 강화학습
강화학습은 교사가 있고 학습하거나, 교사가 없는 학습과 달리 사전에 주는 데이터가 없다. 프로그램이 스스로 데이터를 집어넣어 법칙을 만들어 내고 그 법칙에 따라 답을 내놓을 수 있도록 성장시키는 것이다. 숫자가 계속 증가하거나 내용이 변화하는 데이터 중에서 알고리즘을 만들기 위해서는 강화학습이 필요하다.
◇ 기계학습=심층학습
기계학습으로 작성한 알고리즘은 정확도가 낮으면 도움이 되지 않는다. 따라서 특히 고성능 AI를 만들기 위해서는 틀린 답을 거의 내놓지 않는 고정밀 알고리즘이 필요하다. 그 고정밀 알고리즘을 만들기 위해서 빼놓을 수 없는 것이 바로 심층학습(딥러닝)이다. 심층학습에서는 프로그램이 내부에서 여러 계층으로 나누어져 있다. 그리고 각각의 계층마다 프로그램이 스스로 데이터의 특징을 파악해 간다. 그렇게 습득한 방대한 특징은 프로그램이 판단할 때의 재료로 만들 수 있다. 그렇게 함으로써, 데이터의 세세한 부분의 차이나 공통점도 파악할 수 있게 되어, 보다 정밀도 높은 결과를 낼 수 있다. 심층학습은 교사가 있는 학습ㆍ교사가 없는 학습ㆍ강화학습 모두에 사용하는 것이 가능하다. 그리고 현대 사용하는 AI는 대부분 높은 정확도를 필요로 한다. 그렇기 때문에 기계학습을 할 때는 심층학습이 필수가 되는 경우가 대부분이다. 따라서 AI 분야에서는 ‘기계학습=심층학습’으로 취급되는 경우도 많다.
이규철 / 법학박사(상법)
∙ AI·GPT, SDGs&ESG 코치 및 강사
∙ 100세대학 크리에이터 및 칼럼니스트
∙ 생성AI와 챗GPT, SDGs·ESG경영전략,
글로벌 MBAtoCEO, 리더의 필승전략,
100세대학 행복디자인 매뉴얼 등 27권
∙ 일본(와세다대),중국(복단대·화동정법대)








