고객 로그데이터를 이용한 고객 세분화 – 클러스터링
프로세스 마이닝과 클러스터링을 이용하면
고객 동선뿐만 아니라 그룹별 고객 동선 또한 확인할 수 있습니다.
또한, 데이터에 여러가지 속성을 결합하면 그룹별 특징을 확인할 수 있으며,
이에 따라 많은 전략적 시사점을 도출할 수 있습니다.
이는 회사 전략을 세우는데 타당한 근거로 사용될 수 있습니다.
로그 데이터는 실제 현실에서 발생하는 사건을 데이터로 기록한 것으로, 로그 데이터를 분석하면 실제 현황에 대해서 자세히 확인할 수 있습니다. 프로세스 마이닝을 이용해 로그 데이터를 분석할 수 있으며, 이번 편에서는 클러스터링과 프로세스 마이닝을 이용한 웹 로그 데이터 분석을 소개하겠습니다.
애견 쇼핑몰 가공 데이터를 프로세스 마이닝에 적용하여 프로세스 맵을 그렸으며 이는 [그림 1]에 나타나 있습니다. 프로세스 맵은 실제 고객이 웹페이지에서 움직인 동선을 그려주며, 프로세스 맵을 통하여 어디로부터 고객이 많이 방문했는지, 어떤 곳을 많이 방문했는지 등을 확인할 수 있습니다. 빨간색이 진할수록 많이 방문한 웹페이지로, 해당 애견 사이트는 메인홈페이지, 검색, 기본상품, 장바구니, 이벤트 웹페이지를 많이 방문한 것을 알 수 있습니다.
위의 프로세스 맵으로 웹사이트를 방문한 전체적인 고객 동선을 확인할 수 있지만, 모든 고객들이 위의 동선처럼 웹사이트를 이용하지 않습니다. 고객을 특징별로 분류한 후 분류된 고객의 동선이 어떻게 달라지는 확인해 보겠습니다. 분류에는 클러스터링 방법론 중 가장 대표적인 K-means를 이용하였으며, K-means는 데이터를 K개의 군집으로 묶어주는 알고리즘입니다. 방법론에 대한 자세한 내용은 K-Means(위키)를 참조해주시면 됩니다.
방문한 웹페이지를 이용하여 애견 웹사이트 고객을 5개의 그룹으로 나누었으며, 그룹별 특징은 [그림2]에서 확인할 수 있습니다. 왼쪽 위부터 1번, 2번, 3번 그룹, 아래는 4번, 5번 그룹의 특징을 Radar 그림으로 나타냈습니다. 중앙에서 많이 떨어질수록 해당 웹페이지를 많이 이용한 것을 나타내며, radar 그림으로 각 그룹의 특징을 확인해 보겠습니다. 2번 그룹에 속한 고객은 다른 그룹보다 세일상품을 많이 본 고객 비율이 높은 것으로 확인됩니다. 3번 그룹은 다른 그룹보다 프리미엄상품을 많이 본 고객 비율이 높으며, 5번 그룹은 전체적으로 다른 그룹보다 웹페이지 이용 비율이 높으며, 특히 검색, 기본상품, 장바구니를 많이 본 고객 비율이 높습니다.
위의 그룹이 프로세스 맵에 어떤 영향을 주는지 확인해 보겠습니다. 2번 그룹에 속한 고객 동선을 프로세스 맵으로 그려보았으며, 해당 그림은 [그림 3]을 통해 확인이 가능합니다. 위의 결과와 동일하게 2번 그룹 고객들은 세일상품을 많이 이용하였으며, [메인 홈페이지 > 세일상품 > 기본상품] 순으로 웹페이지를 많이 이용 하였습니다. 또한, 기본상품과 세일상품을 서로 번갈아보며 이용한 것으로 확인됩니다.
4번 그룹에 속한 고객 동선의 프로세스 맵은 [그림 4]에 나타나 있으며, 위의 결과와 동일하게 프리미엄상품을 많이 이용하였습니다. 페이지를 순차적으로 이용하는 3번 그룹과는 다르게 메인홈페이지를 중심으로 여러 페이지를 이용한 것으로 확인되며, 특히 프리미엄상품 다음으로 이벤트를 많이 이용하였습니다.
마지막으로 5번 그룹에 속한 고객 동선을 프로세스 맵으로 그려보았으며, 해당 그림은 [그림 5]를 통해 확인이 가능합니다. 위의 결과와 동일하게 5번 그룹 고객들은 검색, 이벤트, 장바구니를 많이 이용하였으며, 검색과 기본상품을 서로 연계하여 이용한 것으로 확인됩니다.
이처럼 프로세스 마이닝과 클러스터링을 이용하면 전체적인 고객 동선뿐만 아니라 그룹별 고객 동선 또한 확인할 수 있습니다. 또한 지금은 단순히 웹페이지 데이터만 이용하였지만, 데이터에 여러가지 속성을 결합하면 여러 그룹별 특징을 확인할 수 있으며, 이에 따라 많은 전략적 시사점을 도출할 수 있습니다. 이는 회사 전략을 세우는데 타당한 근거로 사용될 수 있습니다.