12 2016 档案
因素空间,引领大数据潮流和智能革命的数学理论
摘要:因素空间,引领大数据潮流和智能革命的数学理论 汪培庄 李洪兴 冯嘉礼 郭嗣琮 2016.12.16 文章下载:http://huadw2012.gotoip2.com/papers.php?page=3 大数据浪潮是信息革命的一个新阶段,其核心是网络和智能的结合(I & I)。网络是信息的翅膀,智能
阅读全文
Amazon评论数据的预处理代码(Positive & Negative)
摘要:Amazon评论数据的预处理代码,用于情感分析,代码改自 https://github.com/PaddlePaddle/Paddle/tree/develop/demo/quick_start/data Amazon商品评论数据网址: http://jmcauley.ucsd.edu/data/a
阅读全文
Ubuntu: ImportError: No module named xgboost
摘要:ImportError: No module named xgboost 解决办法: 如果已经完成了一下步骤: 请尝试在当前目录下继续执行: 更多细节见: http://stackoverflow.com/questions/40747738/importerror-no-module-named-
阅读全文
Sample a balance dataset from imbalance dataset and save it(从不平衡数据中抽取平衡数据,并保存)
摘要:有时我们在实际分类数据挖掘中经常会遇到,类别样本很不均衡,直接使用这种不均衡数据会影响一些模型的分类效果,如logistic regression,SVM等,一种解决办法就是对数据进行均衡采样,这里就提供了一个建议代码实现,要求输入和输出数据格式为Label+Tab+Features, 如Libsv
阅读全文
Python 对不均衡数据进行Over sample(重抽样)
摘要:需要重采样的数据文件(Libsvm format),如heart_scale 重采样后的数据保存文件(Libsvm format),这里heart_scale_balance.txt Python code:
阅读全文