摘要: sklearn模块提供了决策树的解决方案,不用自己去造轮子了(不会造,感觉略复杂): 下面是笔记: Sklearn.tree参数介绍及使用建议 参数介绍及使用建议官网: http://scikit-learn.org/stable/modules/generated/sklearn.tree.Dec 阅读全文
posted @ 2017-03-30 17:18 yushangcc 阅读(7262) 评论(4) 推荐(0) 编辑
摘要: 看了些决策树算法的blog,粗略了解了决策树算法是个怎么一回事:决策树的核心点在于找到分裂的属性点,按照熵增益(ID3)最大,或者熵增益率(C4.5)最大来选分裂的属性点。后续包括一些剪枝等等小操作。 里面最基本的是要计算熵,那么就写一个计算熵值得脚本吧。直接上代码: 下面是输出结果,很简单的一个程 阅读全文
posted @ 2017-03-30 14:21 yushangcc 阅读(261) 评论(0) 推荐(0) 编辑
摘要: KNN算法,故名思议,K个最邻近值的分类算法。监督学习中的一种,典型的懒人算法,通过计算所有的预测样本到学习样本的距离,选取其中K个最小值加入样本组中,样本组中的样本隶属于那个分类的个数最多,那么我们就预测我们的预测样本是属于这个类型的。 学习来源某个pdf(别人的学习笔记): 容我水一发根据球星的 阅读全文
posted @ 2017-03-29 17:14 yushangcc 阅读(1077) 评论(0) 推荐(0) 编辑
摘要: 上篇文章很详实,可以实现一个低级的微信自动回复机器人,听说还有用图灵的,那就变成高级机器人了。 初级目标: 自动回复好友的信息。 阅读全文
posted @ 2017-03-09 18:58 yushangcc 阅读(1550) 评论(0) 推荐(0) 编辑
摘要: 逛知乎逛到了一篇itchat写微信机器人的文章,挺不错的,先照抄过来(侵删):然后定制化自己的。 Python微信库:itchat时间 2016-09-19 23:10:18 滥情's Blog原文 http://www.nulll.me/index.php/archives/72.html主题 P 阅读全文
posted @ 2017-03-09 18:39 yushangcc 阅读(792) 评论(0) 推荐(1) 编辑
摘要: 抓紧上车啦 来看看依照原图来的模板 我们的模板 是不是很炫酷。 因为python2.7的蛋疼的中文编码问题。如果是中文文档的话,可以用jieba分词对文件进行次频处理在生成词云。 挖个坑,以后填。。 阅读全文
posted @ 2017-03-08 17:50 yushangcc 阅读(1089) 评论(0) 推荐(0) 编辑
摘要: 直接上代码: 结果是这样的:文件来自mpls 协议的RFC文档的一部分 当然,wordcloud还是有很强的定制性,等啥时候心情再写。 阅读全文
posted @ 2017-03-08 17:09 yushangcc 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 逛知乎时偶然发现有词云这么高大上的东西,便用了起来。 首先,安装。soeasy... pip install wordcloud 如果词云中要用定制的图案的话,需要用到numpy或者scipy去解析图片(我也不知道为啥?估计是把图片的像素变成数组或者矩阵) 但是window python2.7装sc 阅读全文
posted @ 2017-03-08 16:50 yushangcc 阅读(2296) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2017-01-01 19:58 yushangcc 阅读(101) 评论(0) 推荐(0) 编辑
摘要: #-*- coding:utf-8 -*- import shutil import os from Tkinter import * import time import re def get_all_file(adr): all_adr=[] all_dir.append(adr) adr+='\\' if os.path.exists(adr):... 阅读全文
posted @ 2016-11-09 15:44 yushangcc 阅读(123) 评论(0) 推荐(0) 编辑