标准化
-
聚类分析数据预处理技巧:标准化与降维的必要性
我浪费了三个月,才明白聚类效果差的根源不在算法 去年这个时候,我带的一个数据科学项目正陷入僵局。老板要我从几十万用户里切出五到八个有价值的细分人群,用来做精准营销。我信心满满地写了K-Means代码,数据一扔进去,跑了几十次,每一次出来的结果都不一样。更让人崩溃的是,轮廓系数永远在0.2附近徘徊,业务方看了我的分组结果,给的评价是:“这几个群不是看起来差不多吗?” 我当时的第一反应是算法有问题。是…
我浪费了三个月,才明白聚类效果差的根源不在算法 去年这个时候,我带的一个数据科学项目正陷入僵局。老板要我从几十万用户里切出五到八个有价值的细分人群,用来做精准营销。我信心满满地写了K-Means代码,数据一扔进去,跑了几十次,每一次出来的结果都不一样。更让人崩溃的是,轮廓系数永远在0.2附近徘徊,业务方看了我的分组结果,给的评价是:“这几个群不是看起来差不多吗?” 我当时的第一反应是算法有问题。是…