摘要: 1. 分类数据和顺序数据 建模中,很多时候无法直接处理非数值型变量。 例如KMeans算法中基于距离相似度的计算,字符串无法计算距离;再比如Numpy以及基于Numpy的sklearn,虽然这些库允许直接使用和存储字符串型变量,但无法发挥矩阵计算优势。 这些类型的数据可以分为两类: 1. 分类数据: 阅读全文
posted @ 2021-07-04 14:50 做梦当财神 阅读(418) 评论(0) 推荐(0) 编辑