曼哈顿距离
-
聚类分析中的距离度量选择:欧氏距离、曼哈顿距离与余弦相似度
很多人问我:“为什么我用K-Means做用户分群,特征工程搞了两周,聚类结果还是一团糟?”我一般只回一句:你检查过距离度量了吗?十次里有八次,问题不在特征、不在聚类数K,而在那个最容易被鼠标划过去的参数,metric。 这不是理论推演,是我过去四年在电商、内容推荐和异常检测项目里反复验证出来的结论。这篇文章不会罗列几十种距离度量凑字数,我只讲三个真正高频使用、且选择逻辑彼此对立的核心度量:欧氏距离…