[한국공공정책신문=김유리 기자]
◇ 레코멘드의 개념
레코멘도(Recommend)란 전자상거래 사이트에서 최근 널리 인지하게 된 ‘이 상품을 본 사람은 이런 상품도 사고 있다’와 같은 유사 상품 추천 시스템은 규칙기반 전문가 시스템의 일종으로 레코멘드 엔진(Recommendation Engine)이라고 불린다.
*주) 레코멘드 엔진이란 일정한 규칙이나 행동 데이터를 바탕으로 사용자에게 적합한 추천 상품이나 콘텐츠를 표시해 고객의 구매 행동을 촉진하는 시스템 툴이다. 레코멘드 엔진을 도입해 활용함으로써 고객 체험(CX)과 매출 향상을 기대할 수 있다.
◇ 레코멘드 엔진의 형태
레코멘드 엔진은 크게 나누어 2개의 형태로 나뉜다. 하나는 내용에 근거해 추천을 실시하는 것이고, 또 하나는 방문자의 열람 이력, 구매 이력 등으로부터 추천을 하는 것이다. 내용에 따라 추천을 하는 사람은 방문자에 대한 정보를 사용하지 않는다. 그 대신 수중에 있는 정보에서 관련성이 있는 내용을 계산으로 구할 수 있다.
◇ 레코멘드의 기본정보 추출
예컨대, 상품의 기본정보(상품명, 장르) 외에도 다양한 구성 요소로 이루어진 정보가 있으며, 각각의 관계에서 계산되는 정보를 특징량 및 이를 계산하는 것을 특징량 추출이라고 한다. 또 복수의 정보(데이터)에 공통으로 존재하는 복수의 요소가 있는 상태를, 동시 출현(collocation) 패턴이나 동시 출현 표현이라고 하며, 이러한 정보를 포함한 복수의 근거(기사문 등)로부터 관련성을 계산할 수 있게 된다. 예컨대, 4개의 기사문에 포함되는 키워드의 수 중에 공통으로 사용되고 있는 키워드의 비율 등을 비교하기로 결정한 경우는 각각의 제비뽑기로 계산할 수 있다.
*주) 동시출현(Co-occurrence)이란 한 문장, 문단 또는 텍스트 단위에서 같이 출현한 단어를 가리킨다. 언어학적 의미에서 의미적 근접성을 가리키며, 단어의 연결(collocation)을 찾는 데 활용된다.
◇ 레코멘드의 상품 추천
그리고 또 하나의 타입이지만, 이쪽은 열람 이력이나, 구매 이력 등의 방문자 고유의 정보를 이용하여, 보다 방문자에게 적합한 추천을 하기 위해서 ‘협조 필터링’이라고 하는 알고리즘을 이용하는 것이다. 이쪽은 방문자와 그 이외 사람의 정보에 대한 동시 출현을 이용해 관련 분석을 하여 개별화된 추천을 한다. 즉 비슷한 행동, 평가를 하는 사람과 마찬가지로 방문자도 이렇게 할 것이라는 추론을 바탕으로 추천을 한다. 예컨대, A씨에게 구매 이력이 있는 상품 X에 대해 다른 구매자에 대한 구매 이력에 공통되는 상관 계수를 계산한다. 이 계산 값이 양의 상관관계에서 1에 가까운 것일수록 강한 관계이기 때문에 그 상위를 선택하고, 더 나아가 이 중에서 A씨가 구매하지 않은 다른 상품에 관한 추천 정도를 계산함으로써 최종적인 추천 상품이 선택된다.
◇ 추천에 사용하는 데이터
첫째, Web의 축척 데이터가 있다. 즉 ① 페이지 열람 데이터, ② 상품 열람 데이터, ③ 구매 데이터, ④ 프로파일 데이터, ⑤ 웹으로의 유입경로 및 키워드, ⑦ 내용 데이터, ⑧ 사용자의 행동(평가 및 투표) 등이 있다. 둘째, 데이터의 수집 기술이다. 즉 ① 데이터 모델 설계 기술(데이터 구조), ② 대량의 (네트워크) 왕래를 처리하는 기술, ③ 집계 속도를 고속화하는 기술, ④ 분류(grouping)도를 고속화하는 기술 등이다.
레코멘드(recommend)는 이와같이 ‘알고리즘’도 중요하지만 ‘정밀도 높은 데이터 구조’와 조합되어야만 최적의 시스템이 된다. 레코멘드를 도입한다고 하는 이상, 그것에 필요한 데이터의 수집에 대해서도 주의를 기울여 구축해 나가는 것이 중요하다.
이규철 / 법학박사(상법)
∙ AI·GPT, SDGs&ESG 코치 및 강사
∙ 100세대학 크리에이터 및 칼럼니스트
∙ 생성AI와 챗GPT, SDGs·ESG경영전략,
글로벌 MBAtoCEO, 리더의 필승전략,
100세대학 행복디자인 매뉴얼 등 27책
∙ 일본(와세다대),중국(복단대·화동정법대)








