Analysis And Classification of Customer Churn Using Machine Learning Models

Dublin Core

Title

Subject

data mining; machine learning models; imbalance data; SMOTE; confusion matrix

Description

Analysis studies of customer loss (customer churn) have been used for years to increase profitability and build customer
relationships with companies. Customer analysis using exploratory data analysis (EDA) for visualizing data and the use of
machine learning for the classification of customer churn are often used by past analysts. This study uses several machine
learning models that can be used for customer churn classification, namely Logistic Regression, Random Forest, Support
Vector Machine (SVM), Gradient Boosting, AdaBoost, and Extreme Gradient Boosting (XGBoost). However, there is a class
imbalance factor in the dataset, which is the biggest challenge that is usually faced by analysts to get good results in the
classification of machine learning models. The Synthetic Minority Over-sampling Technique (SMOTE) method is a popular
method applied to deal with class imbalances in datasets. The results of the analysis show that the classification of churn
customers using the XGBoost algorithm has the best level of accuracy compared to other algorithms, with an accuracy value
of 0.829424, and the oversampling method with SMOTE tends to reduce the accuracy value of each classification algorithm.
The Permutation Feature Importance (PFI) technique from the XGBoost model gets the result that tenure, monthly contracts, and TV streaming are the features that affect customer churn the most.

Creator

Muhammad Maulana Sidiq, Dyah Anggraini

Source

http://jurnal.iaii.or.id

Publisher

Professional Organization Ikatan Ahli Informatika Indonesia (IAII)/Indonesian Informatics Experts Association

Date

December 2023

Contributor

Sri Wahyuni

Rights

ISSN Media Electronic: 2580-0760

Format

PDF

Language

English

Type

Text

Files

4933-Article Text-18428-2-10-20231125.pdf

Collection

VOL 7 NO 6 (2023)

Tags

Confusion Matrix,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , data mining,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , imbalance data,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , machine learning models,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , SMOTE

Citation

Muhammad Maulana Sidiq, Dyah Anggraini, “Analysis And Classification of Customer Churn Using Machine Learning Models,” Repository Horizon University Indonesia, accessed April 25, 2026, https://repository.horizon.ac.id/items/show/10161.