随笔分类 -  机器学习

机器学习 数据分析 数据处理
摘要:@[toc] 数据规约产生更小但保持数据完整性的新数据集。在规约后的数据集上进行数据分析和挖掘将更有效率。 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x y,其中x是原始数据点的表达,目前最多使用向量表达形式。 阅读全文
posted @ 2019-03-03 20:58 Michael翔 阅读(8387) 评论(0) 推荐(0) 编辑
摘要:只想说,数据挖掘工作,80%时间都花在处理数据上了,这句话真不假! 最近和小伙伴组了个队参加数据分析比赛,记录下我处理 csv 文件的一些步骤吧: 修改csv文件 可以用csv模块[^1],官方文档[^2] "^1]: [官方 CSV File Reading and Writing" "^2]: 阅读全文
posted @ 2019-03-03 20:47 Michael翔 阅读(1781) 评论(0) 推荐(0) 编辑
摘要:,`iloc ix`三者间的区别和联系 is primarily label based, but may also be used with a boolean array. 就是说,loc方法主要是用 来选择数据的。[^1] "^1]:[官方文档 Indexing and Selecting D 阅读全文
posted @ 2019-03-03 18:42 Michael翔 阅读(2294) 评论(0) 推荐(0) 编辑
摘要:转载自:http://m.blog.csdn.net/blog/sanqima/42746419 1.支持度(Support) 支持度表示项集{X,Y}在总项集里出现的概率。公式为: Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(XUY) / 阅读全文
posted @ 2015-06-24 17:05 Michael翔 阅读(16049) 评论(1) 推荐(1) 编辑
摘要:1) 数据输入和输出WOW():查看Weka函数的参数。Weka_control():设置Weka函数的参数。read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。write.arff:将数据写入Weka Attribute-Rel 阅读全文
posted @ 2015-06-05 19:28 Michael翔 阅读(1553) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示