Process Mining 분석 시스템 구성 요소


프로세스 마이닝을 시스템 개발 및 구축 관점에서 바라봤을 때 가능한 한 많은 데이터를 빠른 시간 내에 수집하고, 가공 처리하여 사용자에게 쉽게 시각화하여 보여주는 구축 요소들에 대한 고려가 필요합니다.
뿐만 아니라, 최근 IoT 센서 및 머신 등 점차 늘어나고 있는 다양한 시스템 활동 들에 대한 대용량 데이터를 생각한다면, 이를 고려한 검증된 아키텍처 상에서 데이터 가공 처리 및 분석 알고리즘이 구현되어야 합니다.
일반적으로 프로세스 마이닝 분석 시스템도 빅데이터 분석과 마찬가지로 다음과 같이 로그를 수집, 가공, 처리, 리포팅에 이르는 단계 및 구성 요소들을 가지고 있으며, 우선 기술적인 구현에 앞서 각 항목별로 고려해야 할 사항들은 다음과 같습니다.

기업 내 업무/시스템 로그

우선 프로세스 마이닝을 위해서는 분석할 대상 시스템이 있어야 합니다. 그리고, 중요한 것은 시스템 내에서 일어나는 활동을 기록하는 로그가 있어야 하는데, 이러한 로그들은 파일일 수도 있고, 트랜잭션의 기록된 형태의 DB의 레코드가 될 수도 있습니다. 기본적으로 작업에 일련의 흐름이 존재하면서, 매 단계마다 이력이 남는다면 훌륭한 프로세스 마이닝 대상이 될 수 있습니다.  ERP의 구매 프로세스, MES의 제조 수행 이력, 문서관리나 그룹웨어 등 협업 시스템의 결재/승인 흐름 등은 지금까지 프로세스 마이닝의 좋은 대상으로 여겨져 왔습니다. 이러한 로그 수집 대상 시스템은 한 곳에서만 수집될 필요는 없으며, 기업 내 업무 프로세스는 다양한 시스템을 통해 이뤄지는 만큼 하둡 파일 시스템이나 레거시 데이터웨어하우스에 쌓여진 데이터 역시 고객/접수/물품 번호, Lot 번호 등 하나의 키값으로 변경 이력을 추적할 수 있다면, 프로세스 마이닝 대상이 됩니다.  

로그 자동 수집 및 관리

시스템 구성 요소 중 로그를 수집하는 곳에서는 기존 시스템이나 DB에서 원하는 속성들(Case, Activity, Timestamp, Resource 등)에 대해 CSV 파일 형태로 변환하여 프로세스 마이닝 분석 엔진에 전달합니다. 이것은 일반적으로 ETL (Extract, Transform, Load)라고 불리는 데이터 처리 단계에서 추출(Extract)에 해당하는데, CSV로 바로 변환하지 못하는 경우에는 별도의 데이터 수집 어댑터 모듈을 분석 대상 시스템 혹은 장비에 맞춰 작성해야 합니다. 이외 데이터가 정형화되어 있지 않은 경우는 비정형 데이터로부터 의미 있는 항목들을 뽑아 내기 위한 데이터 변환 모듈이 필요합니다.
이외에도 일회성 분석이 아닌 정기적인 분석 및 모니터링이 이뤄져야 하는 경우에는 시스템 간 인터페이스와 배치 처리를 통한 자동화를 고려해야 하며, 특히 상시 모니터링을 위해서는 연속적 입력 이벤트 데이터에 대한 스트리밍 처리를 지원할 수 있어야 합니다.
또한 이렇게 수집된 데이터는 언제든지 여러 명의 분석가 혹은 부서들에게 참조되어 원하는 분석을 진행할 수 있도록 공유되어야 합니다. 이를 위해 업로드된 데이터에 대한 사용자별 권한 권리, 폴더별 분류 체계, 폐기 등을 지원할 수 있는 통합 이벤트 리포지토리 형태로 구축되는 것이 바람직합니다.  

프로세스 분석 가시화

앞서 수집되어 저장된 데이터는 업무 관점에서 가공되어 처리되어 최종적인 프로세스 모델로 표현되어 저장됩니다. 이때 저장된 프로세스 모델은 다양한 관점에서 필터링 되어 사용자가 원하는 결과를 보여줍니다. 결과를 보여주는 방식에 있어서는 브라우저를 통해 언제 어디서나 서버에 접속하여 시각화된 데이터의 최신 결과를 보여줄 수 있는 웹 기반의 분석 서비스 형태가 사용자의 편의성을 높일 수 있습니다.
초기에 스몰 데이터를 통한 분석 결과 검증시에는 단일 머신에서 프로세스 마이닝 시스템을 구축하여, 데스크톱 상의 단일 사용자가 데이터를 분석하는 방식도 생각해 볼 수 있습니다. 하지만, 향후 데이터 용량이 많아지고 여러 명의 사용자가 분석하고 보고하는 협업 활동이 일어나는 기업 환경의 경우 데이터 보안 및 성능상의 이슈로 여러 대의 서버에서 분산 서비스할 수 있는 확장 가능한 구조인지 처음부터 고려해야 합니다.

업무/공정 프로세스 성과 분석

프로세스 마이닝의 주요 활용처는 프로세스 모델 도출을 통한 업무 성과 분석입니다. 단순히 데이터의 시각화를 표현하는 데 벗어나, 프로세스 상의 병목 구간 등 문제점 및 숨겨진 의미를 찾을 수 있도록 도와줄 수 있어야 합니다.
프로세스 성과에 영향을 줄 수 있는 데이터 인자 등을 도출하기 위하여 상관관계 분석, 시뮬레이션 등이 최근 머신 러닝 등의 인공 지능 기법들과 결합하여 활발히 연구되고 있는 분야이며, 이것은 프로세스 마이닝의 분석 결과를 조직 KPI 관점에서 바라볼 수 있는 방법을 제공하고 있습니다. 
이러한 성과 분석 요소를 기반으로 프로세스 도메인에 대한 이해와 데이터 기반의 업무 혁신 컨설팅이 같이 이뤄지게 됩니다.
지금까지 설명드린 데이터 수집-가공/처리-시각화-분석-모니터링에 이르는 프로세스 마이닝 분석 시스템 개발 및 구축은 한 번에 끝나지 않을 수도 있습니다. 데이터 분석 라이프 사이클 전반에 걸쳐 스몰 데이터 분석에서 시작하여, 용량이 크고 다양한 데이터에 이르기까지 사용자가 원하는 가치를 달성할 때까지 반복적으로 빠르게 수행할 수 있도록 지원하는 것이 분석 시스템으로서 프로세스 마이닝의 역할입니다.