本文主要介绍了信用评分模型开发过程中的数据预处理、探索性分析和变量选择。
数据预处理主要针对缺失值用直接剔除法进行处理,对于异常值主要根据实际情况和箱形图的数据分布,对异常值进行剔除;探索性分析主要对各变量的分布情况进行初始的探究;变量选择主要考虑了变量的分箱方法,根据分箱结果计算WOE值,然后检查变量之间的相关性,根据各变量的IV值来选择对数据处理有好效果的变量。
详情请查阅个人知乎专栏文章(这里发不出文章link,可搜索用户“细嗅蔷薇”-专栏“数据决策之路”)。
手机快捷登录
该人才本日咨询量超出上限
建议发布需求或咨询顾问
服务商暂不支持电话联系
商家还未开通QQ咨询功能
给TA留言,服务商会尽快联系你
已收到你的初步意向
稍后你的企业专属顾问将致电你, 确认你的具体需求
根据监管要求,我们对《猪八戒平台隐私保护政策》进行了更新,现向您进行以下说明:
1.为更好地向您提供服务,我们会收集、使用您必要的个人信息;
2.我们会采用业界先进的加密算法,保护您的个人信息;
3.除非法律规定,在没有获得您的授权下,我们不会向第三方共享、转让和公开披露您的个人信息;
4.您可以查询、更正、删除您的个人信息,也可以注销您的个人账户。