摘要: 以下分别是numpy、Scipy、pandas的简介。虽然这些包提供的一些结构比python自身的“更高级、更高效”,更高级是因为它们能完成更高级的任务,但是,学习的时候尽量不要和python割裂开认识,最好是辩证的看问题,既要看到区别,又要看到联系,这样才能理解深刻、真正的运用自如。比如pytho 阅读全文
posted @ 2016-11-26 11:53 coskaka 阅读(2357) 评论(0) 推荐(0) 编辑
摘要: 一、mongodb的原理介绍: 特点: 为了理解以上特点,我们从一个真实的场景出发,介绍mongodb的原理:参考视频:https://www.youtube.com/watch?v=4SxHNmk5JHI 我们需要从华为的app商店里抓取一些app的详细信息的数据;如下图,这是我们爬到的一条数据, 阅读全文
posted @ 2016-11-25 16:26 coskaka 阅读(271) 评论(0) 推荐(0) 编辑
摘要: pandas数据清洗:http://www.it165.net/pro/html/201405/14269.html 贴吧爬取得数据,vehicle字段需要处理一下,即把vehicle字段的某些值做下替换: 阅读全文
posted @ 2016-11-25 13:41 coskaka 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 对过去一年(即发帖时间为2015.11.23—2616.11.23的数据)燕大贴吧的帖子数据,进行了简单的可视化分析,只是记录思路和图表的草稿,后续内容会不断的更新 分析如下:分别从用户、贴吧整体监测、发帖设备、性别角度做了简单的可视化。后期会更新文本分析的内容,包括文本聚类、情感分析。 阅读全文
posted @ 2016-11-24 15:22 coskaka 阅读(740) 评论(1) 推荐(0) 编辑
摘要: 因为最近的多元统计讲到了聚类分析,课上同学也分别同R、SPSS、python展示了简单的聚类。但是问题是,理论不够联系实际,具体说,就是我们没有结合具体的业务背景,甚至连数据清洗的环节也直接略过了,这样不够好。一是理论被证明是否可行还需要实践去检验,基于特定业务背景上的模型的选择、数据的抽取、探索、 阅读全文
posted @ 2016-11-18 11:59 coskaka 阅读(1371) 评论(2) 推荐(0) 编辑
摘要: 第一件事,我们的“学习小组”最近先后邀请了信息学院和经管学院的同学来参加,来汇报或是作为观众来谈谈对问题的看法,如果你是个善于聆听、思考的人,你会发现理解、阐述同一件事,不同背景人从不同角度出发思路的确有所不同,这是一件好玩的事。 第二件事,最近选修了信息学院的《机器学习》课程,教课的老师是纯计算机 阅读全文
posted @ 2016-11-18 11:23 coskaka 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 何为客户细分?是技术,更是艺术 客户细分是20世纪50年代中期由美国学者温德尔史密斯提出的,其理论依据在于顾客需求的异质性和企业需要在有限资源的基础上进行有效地市场竞争.是指企业在明确的战略业务模式和特定的市场中,根据客户的属性,行为,需求,偏好以及价值等因素对客户进行分类,并提供有针对性的产品,服 阅读全文
posted @ 2016-11-17 20:32 coskaka 阅读(1380) 评论(0) 推荐(0) 编辑
摘要: __author__ = 'Oscar_Yang' #-*- coding= utf-8 -*- from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB from sklearn.externals import joblib import pickle... 阅读全文
posted @ 2016-11-15 18:36 coskaka 阅读(774) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2016-11-13 12:15 coskaka 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 天赋是积累出来的(2013年9月) 原文地址:http://blog.sina.com.cn/s/blog_49f9228d0101dxiy.html 只要你在一些方面做得好,可能就会有人说你在这方面有天赋。当你听到这样的话时,千万不要当真,因为这很可能是他们在逃避,不愿意正视自己不努力的现实。做好 阅读全文
posted @ 2016-11-08 11:24 coskaka 阅读(139) 评论(0) 推荐(0) 编辑