[칼럼 - 이규철] AI교과서(65) - 서포트 벡터 머신(SVM)

▲이규철/한국공공정책신문 칼럼니스트 ⓒ한국공공정책신문

 [한국공공정책신문=김유리 기자]  


서포트 벡터 머신(SVM)의 개념


서포트 벡터 머신(SVM, support-vector machine)은 기계학습 알고리즘의 하나로 주로 분류 문제에 사용한다. SVM은 데이터를 다른 클래스로 나누기 위한 최적의 경계선을 찾는 것을 목적으로 하고 있다. 이 경계선은 초평면(超平面, hyperplane)’이라고 불리며, 클래스 간 마진(margin, 여백)이 최대가 되도록 설계한다. 그러면 데이터를 두 그룹으로 나누는 분류기로 유효하다. 다음과 같이 예가 있다. 메일이 스팸 메일인지 통상 메일인지 분류, 과일이 사과인지 귤인지 분류이다. SVM은 이러한 예처럼 데이터가 어느 그룹에 속하는지 판단한다.

 

서포트 벡터 머신(SVM)의 기본 구조


SVM의 목적은 최대 마진을 가진 선(초평면)’을 찾아 데이터를 두 그룹으로 나눈다. 이 선(또는 면)은 데이터 포인트를 두 개의 클래스로 분리한다. SVM은 다음 단계에서 데이터를 분류한다. 데이터 특징 추출이다. 먼저 데이터에서 중요한 특징을 추출한다. 최적의 경계선 계산이다. SVM은 데이터를 분리하는 가장 넓은 마진을 가진 경계선을 찾는다. 이 경계선에 가장 가까운 데이터 포인트가 서포트 벡터이며, 이들이 분류 결과에 크게 영향을 미친다. 비선형 문제 대응이다. 데이터가 단순한 직선으로 분리될 수 없는 경우 SVM은 커널 방법을 사용하여 데이터를 고차원으로 매핑(mapping)하고 분리하기 쉽게 만든다.

 

서포트 벡터 머신(SVM)의 응용사례


텍스트 분류다. 스팸 메일 검출 및 감정 분석에 이용한다. 텍스트를 긍정적ㆍ부정적으로 분류하는 등 언어 처리 분야에서 힘을 발휘한다. 화상 분류다. 수기 숫자의 인식이나 얼굴 인식 등, 화상 데이터의 분류에 사용한다. 예컨대, 손으로 쓴 숫자를 인식해서 그것이 ‘5’인지 ‘8’인지 판별하는 것이 가능하다. 의료 진단이다. 질병의 진단이나 암 검출 등 의료 데이터의 분류에 SVM이 사용되기도 한다. 바이오인포매틱스. 유전자 데이터 분류 및 질환 예측에도 도움이 된다. 비선형 분리 성능이란 데이터에 대해 직선이 아닌 분류 경계를 그을 수 있는 성능을 말한다.

 

커널 트릭(kernel trick)이란?


SVM은 직선으로 데이터를 나누는 것이 기본이지만 현실 세계의 데이터는 반드시 직선으로 나눌 수 있는 것은 아니다. 거기서 도움이 되는 것이 커널 트릭(kernel trick)’이라고 하는 테크닉이다. 커널 트릭은 데이터를 고차원 공간으로 변환하여 복잡한 형태로 데이터를 나눌 수 있도록 한다. 이를 통해 비선형 데이터로도 효과적으로 분류할 수 있다.

*) 서포트 벡터 머신에서 데이터를 굳이 고차원으로 사상함으로써 그 사상 후의 공간에서 선형 분류할 수 있도록 하는 접근법을 취할 수 있는데, 그때 계산이 복잡해지지 않도록 식변형하는 테크닉을 커널 트릭(kernel-trick)이라고 한다.

 

서포트 벡터 머신(SVM)의 장점과 단점


먼저 장점으로는 높은 분류 정확도를 가지며, 특히 적은 데이터 세트에서도 효과적이다. 고차원 데이터(많은 특징량을 가지는 데이터)에 대해서도 뛰어난 성능을 발휘한다. 단점은 데이터가 너무 많을 경우, 계산 비용이 높아지고, 처리시간이 길어질 수 있다. 모델의 파라미터(parameter) 조정이 어렵고 최적의 모델을 찾는 데 시간이 걸릴 수 있다.

 

 

이규철 / 법학박사(상법)

AI·GPT, SDGs&ESG 코치 및 강사

100세대학 크리에이터 및 칼럼니스트

생성AI와 챗GPT, SDGs·ESG경영전략,

글로벌 MBAtoCEO, 리더의 필승전략,

100세대학 행복디자인 매뉴얼 등 27

일본(와세다대),중국(복단대·화동정법대)





작성 2026.04.07 16:43 수정 2026.04.07 16:43

RSS피드 기사제공처 : 한국공공정책신문 / 등록기자: 김유리 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.