概述: 利用一个包含10127个观察值和23个变量的数据集,包括人口统计和交易信息,本研究提出了一种结合监督学习和无监督学习算法的综合方法。
技术描述:数据预处理:通过标准化、编码和处理缺失值,保证了数据质量,为后续分析奠定了基础。 降维技术应用:采用PCA等降维技术,减少了数据的复杂性,优化了计算效率。 聚类分析:使用K-means、GMM、和DBSCAN等算法进行客户分群,探索了客户流失的潜在模式。 统计建模与分析:运用多种统计方法进行数据分析,识别影响客户流失的因素。 性能评估:利用Rand Index和F1 Score等指标评估模型性能,确保结果的准确性和可靠性。