본 연구에서는 데이터마이닝 기법 중에서 의사결정규칙을 나무구조로 도표화하여 관심이
되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석방법인 의사결정나무모형
에 관한 연구이다. 의사결정나무모형을 구축하기 위해서는 분리규칙과 사전 가지치기인 정
지규칙을 사용하는데 분리규칙으로서는 지니지수, 엔트로피, 투윙지수, 카이제곱 검정을 이
용한 분리규칙이 사용된다. 또한 정지규칙으로서 의사결정나무의 깊이, 부모노드가 가질
수 있는 최소 사건 수와 분리에 대한 최소적합도 등을 제한함으로써 의사결정나무의 성장
을 정지시킨다. 본 연구에서는 분리규칙과 정지규칙에 대한 알고리듬을 실제 구현하여 사례
에 적용해 보고자 하였다. 또한 분류오류를 크게 할 위험이 있거나 잘못된 추론규칙을 만들
어 낼 가능성이 있는 의사결정나무의 가지를 효과적으로 제거하는 방법으로서 사후 가지치
기인 최소 비용-복잡도 가지치기에 대하여 사례를 통해 그 알고리듬을 적용해 보았다. 분석
의 마지막 단계로서는 최종 모형에서 나온 규칙의 타당성, 규칙의 중복성, 과잉맞춤등을 제
거해서 일반화된 모형을 만들어보고자 하였다.

