2016年9月16日

摘要: 研读一本书,《数据之魅:基于开源工具的数据分析》(Data Analysis with Open Source Tools),写的很好。这里,复述一下书中用Gnuplot分析时间序列数据的部分。 Gnuplot安装很简单,直接到官网下载exe文件,安装运行即可(我是win7 32bit)。数据集来自 阅读全文

posted @ 2016-09-16 14:11 不秩稚童 阅读(1064) 评论(0) 推荐(0) 编辑

2016年9月14日

摘要: 今天开始看《MATLAB数据分析与挖掘实战》,学习了下用MATLAB连接MySQL数据库,环境win7,32bit,MySQL5.7.12,MATLAB2013B 首先,从这里下载驱动的压缩文件(我选的第一个),解压,将mysql-connector-java-5.1.39-bin.jar放到MAT 阅读全文

posted @ 2016-09-14 11:25 不秩稚童 阅读(2905) 评论(0) 推荐(0) 编辑

摘要: 之前,写了这篇文章,用python提取全部群成员的发言时间,并简单做了下分析。先补充一下,针对特定单个群成员(这里以 小小白 为例)消息记录的获取。 代码比较简单,主要是正则表达式的书写。(附:聊天文件记录的导出请参考上面提到的文章) 代码如下: ###########2016/10/18补更### 阅读全文

posted @ 2016-09-14 00:45 不秩稚童 阅读(3479) 评论(1) 推荐(1) 编辑

2016年9月6日

摘要: 昨天,呃,不,是今天凌晨,我问一位大牛有没有什么既简单又强势的算法,他说了蒙特卡洛。今天查了些资料,见识到它的强大与及简洁。参考了这篇文章,和维基百科。 现在用MATLAB实现蒙特卡洛方法的几个应用。 1.计算圆周率 输出如下: 可以看到,随着随机点数的增加,算得的pi精度越来越高。(注意这里,我将 阅读全文

posted @ 2016-09-06 14:11 不秩稚童 阅读(455) 评论(0) 推荐(0) 编辑

2016年9月5日

摘要: 今天用将近一天的时间学习了层次分析模型(AHP),主要参考了一份pdf,这个网站,和暨南大学章老师的课件,现写出一些自己总结的要点。 一、层次分析法的基本步骤: 角度一: 实际问题——分解——>多个因素——建立——>层次结构— —确定——>诸因素的相对重要性——计算——>权向量— —判断——>综合决 阅读全文

posted @ 2016-09-05 23:45 不秩稚童 阅读(35855) 评论(0) 推荐(4) 编辑

摘要: 牛顿插值法的原理,在维基百科上不太全面,具体可以参考这篇文章。同样贴出,楼主作为初学者认为好理解的代码。 运行: 输出: CPP实现代码如下: 注意此处求差商运用的是另外一种方法 运行结果: 阅读全文

posted @ 2016-09-05 10:13 不秩稚童 阅读(1304) 评论(0) 推荐(0) 编辑

摘要: 开始学习MATLAB(R和Python先放一放。。。),老师推荐一本书,看完基础就是各种算法。。。首先是各种插值。先说拉格朗日插值法,这原理楼主完全不懂的,查的维基百科,好久才看懂。那里讲的很详细,这里就不在赘述了。一般看这个范例,在回头看公式就比较容易理解。 关于MATLAB的实现,查了很多资料, 阅读全文

posted @ 2016-09-05 10:10 不秩稚童 阅读(4128) 评论(1) 推荐(2) 编辑

2016年8月27日

摘要: 一个关于豆瓣影评的爬虫,涉及:模拟登陆,翻页抓取。直接上代码: 这里有两个问题: 1.首先,登陆的时候,可能会不需要验证码(当然也不会抓到验证码的图片。。),加上try就可以了。 2.数据抓取不全。。。总是剩下1/5左右的数据抓不到,,目前还未解决,请看到的大神指点! 阅读全文

posted @ 2016-08-27 16:41 不秩稚童 阅读(1279) 评论(0) 推荐(2) 编辑

摘要: 专业统计的我,自然免不了学R的,今天仔细看了这篇教程(感谢学姐的推荐@喜欢算法的女青年),就学着用R仿照着做一个,作为R语言学习的起点吧。 影评数据是用python爬的,之后会在python爬虫系列补充上爬虫程序。 这里选取的影片是《完美陌生人》,豆瓣评分挺高的,并未看过。。。。爬好的数据为了方便同 阅读全文

posted @ 2016-08-27 16:23 不秩稚童 阅读(1139) 评论(0) 推荐(0) 编辑

2016年8月17日

摘要: 关于豆瓣,还是算是爬虫友好型的网站,之前模拟登陆也很容易就成功了,不过最近要在豆瓣抓点东西,发现代码已经不能用了。打印源码发现,需要验证码了。 所以,这里写个续集。。。较上一篇改动主要在验证码和一个随机字符串的获取,再之后加入pyload就行了。具体参照代码。 大概就这样,今天先写到这了,天快明了。 阅读全文

posted @ 2016-08-17 01:50 不秩稚童 阅读(834) 评论(0) 推荐(0) 编辑