2017年5月24日

摘要: 股票里面MACD和RSI都要应用到moving average 参见https://pythonprogramming.net/advanced-matplotlib-graphing-charting-tutorial/ 在panda里面封装了rolling module可以rolling以后求m 阅读全文

posted @ 2017-05-24 11:28 不要半途而废 阅读(1308) 评论(0) 推荐(0) 编辑

2017年4月19日

摘要: 今天用python的lxml组件解析网页代码,需要找到特定区域的文本,lxml的etree有HTML方法可以将得到的html代码转换成树结构,然后用xpath寻找特定区域 当我找到这个区域,我需要得到该区域内的文本(在c#里面htmlnodeelement有个innertext的属性可以直接得到)而 阅读全文

posted @ 2017-04-19 08:57 不要半途而废 阅读(157) 评论(0) 推荐(0) 编辑

2017年4月11日

摘要: 网上的例子: https://github.com/donnemartin/data-science-ipython-notebooks/blob/master/kaggle/titanic.ipynb 作为一个data mining的雏,这两天试了试kaggle上面的beginner compet 阅读全文

posted @ 2017-04-11 09:23 不要半途而废 阅读(118) 评论(0) 推荐(0) 编辑

2017年3月30日

摘要: 1.4 Support Vector Machines 建成SVM是一系列supervised learning方法的集合用于分类回归和边界探测,优势在于高维度空间效率高;在维度大于样本数量是仍然有效;在决策函数里training points的子集,使得内存利用更有效率;能在决策函数中使用不同的甚 阅读全文

posted @ 2017-03-30 08:04 不要半途而废 阅读(88) 评论(0) 推荐(0) 编辑

2017年3月9日

摘要: 发现个很诡异的问题 False in pd.Series([True,True]) returns True.......... 但是 False in [True,True] returns False 使用pandas的dataframe做一些基础的数据分布研究 df=pd.DataFrame. 阅读全文

posted @ 2017-03-09 07:35 不要半途而废 阅读(244) 评论(1) 推荐(0) 编辑

2017年2月24日

摘要: chi-square test(goodness of fit) 举个例子khanacademic上的例子,某人A给出某餐馆每日客流量的分布(周日休息)为M(10),T(10),W(15),T(20),F(30),S(15),总共100,而我自己观察一周的结果是M(30),T(14),W(34),T 阅读全文

posted @ 2017-02-24 10:55 不要半途而废 阅读(547) 评论(0) 推荐(0) 编辑

2017年2月23日

摘要: 1.1.3 Lasso(Least absolute shrinkage and selection operator) Lasso算法,又译为最小绝对值收敛和选择算子、套索算法,针对X是稀疏矩阵的情况,进行变量选择和规范化,以增加预测的准确性,最初是为最小二乘法而设计,然而lasso的正规化可以很 阅读全文

posted @ 2017-02-23 11:30 不要半途而废 阅读(151) 评论(0) 推荐(0) 编辑

2017年2月17日

摘要: 1.1.2 Ridge Regression(Tikhonov Regularization) 我也没找到中文翻译叫什么,这个东西用来使线性非良设定问题(linear ill posed problem)正规化(regularization) ill-posed problem对应well-pose 阅读全文

posted @ 2017-02-17 10:29 不要半途而废 阅读(118) 评论(0) 推荐(0) 编辑

2017年2月15日

摘要: 又查查了回归分析的基本概念,这里记录一下,年纪大了容易忘lol 线性回归模型Linear Regression Models: 例如数据有n个观察结果(yi,xi)i从1到n,yi是这个观察的响应标量值(a scalar response),xi是一组含p个预言子(predictor)的向量 在线性 阅读全文

posted @ 2017-02-15 10:35 不要半途而废 阅读(175) 评论(0) 推荐(0) 编辑

2017年2月13日

摘要: 从使用的工具说起,win7+vs2015 community+python vs tool+anaconda,免费、易安装且使用方便 本人cs专业,老婆是统计专业,所以合计我也看看统计相关的,因为目前工作主要就是处理数据分析数据,所以想看看machine learning/data mining是不 阅读全文

posted @ 2017-02-13 10:37 不要半途而废 阅读(131) 评论(0) 推荐(0) 编辑