프로세스의 적합도 검정 (Conformance Checking)


현실의 이벤트 로그로부터 프로세스를 도출하는 프로세스 마이닝 기술은 3가지 핵심 이슈로 나눠볼 수 있습니다. 그것은 바로 프로세스를 발견하고, 감독하고, 향상하는 것입니다. 현재 대부분의 프로세스 마이닝 연구는 검정의 중요성보다는 발견 기술에 초점이 맞춰져 있습니다. 그러나 검정 기술은 프로세스 생명 주기의 중요한 부분입니다. 프로세스 적합도 검정은 로그 데이터와 프로세스 모델 사이의 적합성을 측정함으로써 주어진 모델이 현실에 타당한 것인지 수량화하는 것입니다.

검정에 있어 가장 중요한 부분은 ‘프로세스 모델’입니다. 프로세스 모델은 프로세스 분석 기술에서 중요한 역할을 합니다. 이벤트 로그와 프로세스 모델 사이의 적합도를 측정하는 것은 주어진 모델이 현실을 얼마나 잘 설명하는지와 관련이 있기 때문입니다. 따라서 모델과 로그의 일치성에 집중해야 합니다. 설계된 프로세스 모델은 로그의 모든 활동을 포함해야 합니다. 현재를 잘 반영하지 못하는 모델은 잘못된 결론을 도출할 수 있기 때문입니다. 따라서, 적합도 검정을 통해 이러한 문제를 해결해 나가야 합니다.

주어진 모델이 얼마나 좋은지 판단하는 방법에는 4가지가 있습니다. 첫 번째는 적합성입니다. 이는 모델이 로그로부터 추출 가능한 모든 행동과 서로 일치하는지 고려하는 것입니다. 두 번째는 정확성입니다. 이벤트 로그로부터 관찰되지 않은 동작이 있는지 확인해야 합니다. 세 번째는 일반화입니다. 좋은 모델은 관측된 로그의 행동을 포함하면서, 예측 가능한 동작을 일반화하고 재현할 수 있어야 합니다. 네 번째는 단순성입니다. 너무 불필요하게 복잡한 모델을 생성하지 않도록 주의해야 합니다.

적합성 검사를 할 때에는 여러 어려움에 직면할 수 있습니다. 그 예로는 빅데이터 및 실시간, 소음과 불완전, 적합성 진단, 모델링 표기법에 관한 것들이 있습니다.  정보 시스템에 의해 기록된 정보의 양은 기하급수적으로 증가하고 있습니다. 이에 따라, 이벤트 로그는 더욱 자세해지고 이를 기반으로 하는 프로세스 모델도 함께 부피가 커지고 있습니다. 따라서 이에 대한 적절한 대응이 필요합니다. 또한, 이벤트 로그 노이즈는 로그를 잘못 기록하게 할 가능성이 있으며, 이로 인해 프로세스 모델이 로그의 행동을 정확하게 반영하지 못하게 되는 예외적인 상황도 고려해야 합니다. 전반적으로 이벤트 로그와 모델이 일치하는 문제는 지속해서 발전시켜 나가야 합니다. 마지막으로, 적합도 검정에서 중시하는 프로세스 모델링 관점뿐만 아니라, 모델링 표기법에 대해서도 주의해야 합니다.

[번역_원문]
Jorge Munoz-Gama, Conformance Checking and Diagnosis in Process Mining : Comparing Observed and Modeled Processes. Springer(2016)