09 2017 档案

摘要:http://www.cnblogs.com/90zeng/p/Lagrange_duality.html 阅读全文
posted @ 2017-09-24 22:55 imageSet 阅读(159) 评论(0) 推荐(0) 编辑
摘要:转自http://www.cnblogs.com/ldphoebe/p/5000769.html 函数间隔的取值并不影响最优化问题的解,因为成比例的改变w和b目标函数和约束条件都不受到影响,所以我们可以让函数间隔为1. 目标函数就变为1/||w||,由于让1/||w||最大化,等价于让分母||w|| 阅读全文
posted @ 2017-09-24 22:30 imageSet 阅读(1378) 评论(0) 推荐(0) 编辑
摘要:作者:Jason Gu链接:https://www.zhihu.com/question/20466147/answer/28469993来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 SVM是通过超平面将样本分为两类。在超平面确定的情况下,可以相对地表示点距离超平面 阅读全文
posted @ 2017-09-24 21:05 imageSet 阅读(800) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/leoo2sk/archive/2010/09/18/bayes-network.html 阅读全文
posted @ 2017-09-24 17:46 imageSet 阅读(186) 评论(0) 推荐(0) 编辑
摘要:贝叶斯定理 P(B|A)P(A)=P(AB) P(A|B)P(B)=P(AB) 可以互推P(B|A)和P(A|B) P(B|A)=P(A|B)P(B)/P(A) 发现一篇好文。 http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayes 阅读全文
posted @ 2017-09-23 19:47 imageSet 阅读(172) 评论(0) 推荐(0) 编辑
摘要:分类和逻辑回归(Classification and logistic regression) http://www.cnblogs.com/czdbest/p/5768467.html 广义线性模型(Generalized Linear Models) http://www.cnblogs.com 阅读全文
posted @ 2017-09-23 15:20 imageSet 阅读(177) 评论(0) 推荐(0) 编辑
摘要:1 Α α alpha a:lf 阿尔法 2 Β β beta bet 贝塔 3 Γ γ gamma ga:m 伽马 4 Δ δ delta delt 德尔塔 5 Ε ε epsilon ep`silon 伊普西龙 6 Ζ ζ zeta zat 截塔 7 Η η eta eit 艾塔 8 Θ θ t 阅读全文
posted @ 2017-09-23 15:05 imageSet 阅读(321) 评论(0) 推荐(0) 编辑
摘要:见http://www.cnblogs.com/chengxin1982/p/7076064.html 阅读全文
posted @ 2017-09-23 10:48 imageSet 阅读(663) 评论(0) 推荐(0) 编辑
摘要:这里有现成的,引用一下。http://www.cnblogs.com/czdbest/p/5767138.html 阅读全文
posted @ 2017-09-22 21:47 imageSet 阅读(150) 评论(0) 推荐(0) 编辑
摘要:对于一个线性回归问题有 为了使得预测值h更加接近实际值y,定义 J越小,预测更加可信,可以通过对梯度的迭代来逼近极值 批梯度下降(batch gradient descent)(the entire training set before taking a single step) 随机梯度下降(s 阅读全文
posted @ 2017-09-22 21:08 imageSet 阅读(332) 评论(0) 推荐(0) 编辑
摘要:主成分分析 ( Principal Component Analysis , PCA )或者主元分析。用于数据降维。 强大的矩阵奇异值分解(SVD)及其应用 http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applicati 阅读全文
posted @ 2017-09-21 23:15 imageSet 阅读(128) 评论(0) 推荐(0) 编辑
摘要:列表解析式是列表生成式的一种,即在列表生成式中加入条件 字典解析式和列表解析式的用法是差不多的 集合解析式跟列表解析式差不多,都是对一个列表的元素全部执行相同的操作,但集合是一种无重复无序的序列。 区别:跟列表解析式的区别在于:1.不使用中括号,使用大括号;2.结果中无重复;3.结果是一个set() 阅读全文
posted @ 2017-09-17 17:02 imageSet 阅读(221) 评论(0) 推荐(0) 编辑
摘要:匿名函数lambda x: x * x实际上就是: 关键字lambda表示匿名函数,冒号前面的x表示函数参数。 匿名函数有个限制,就是只能有一个表达式,不用写return,返回值就是该表达式的结果。 用匿名函数有个好处,因为函数没有名字,不必担心函数名冲突。此外,匿名函数也是一个函数对象,也可以把匿 阅读全文
posted @ 2017-09-17 16:30 imageSet 阅读(167) 评论(0) 推荐(0) 编辑
摘要:Python内建的filter()函数用于过滤序列。 和map()类似,filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。 例如,在一个list中,删掉偶数,只保留奇数,可以这 阅读全文
posted @ 2017-09-17 16:04 imageSet 阅读(163) 评论(0) 推荐(0) 编辑
摘要:map()函数接收两个参数,一个是函数,一个是可迭代对象Iterable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的迭代器Iterator返回。 举例说明,比如我们有一个函数f(x)=x2,要把这个函数作用在一个list [1, 2, 3, 4, 5, 6, 7, 8, 9]上,就 阅读全文
posted @ 2017-09-17 15:21 imageSet 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2017-09-16 15:34 imageSet 阅读(141) 评论(0) 推荐(0) 编辑
摘要:通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。 所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不 阅读全文
posted @ 2017-09-15 20:50 imageSet 阅读(242) 评论(0) 推荐(0) 编辑
摘要:列表生成式 如果要生成[1x1, 2x2, 3x3, ..., 10x10]怎么做? for循环后面还可以加上if判断,这样我们就可以筛选出仅偶数的平方: 还可以使用两层循环,可以生成全排列: 因此,列表生成式也可以使用两个变量来生成list: 阅读全文
posted @ 2017-09-14 22:50 imageSet 阅读(198) 评论(0) 推荐(0) 编辑
摘要:之前学习的一些python的高级特性 切片 迭代 如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration)。 对于字典dict的迭代 因为dict的存储不是按照list的方式顺序排列,所以,迭代出的结果顺序很可能不一样。 默认 阅读全文
posted @ 2017-09-14 21:56 imageSet 阅读(193) 评论(0) 推荐(0) 编辑
摘要:研究生课题需要所以写了一个: 网上用matlab做的比较多,原理也很清楚,就不多说了。没有处理噪声,细节也损失的比较多。 阅读全文
posted @ 2017-09-08 23:08 imageSet 阅读(1456) 评论(0) 推荐(1) 编辑
摘要:在对文件进行批处理时,如果文件名是字符串+数字格式,同样可以应用以上方法 阅读全文
posted @ 2017-09-08 22:11 imageSet 阅读(6341) 评论(0) 推荐(0) 编辑
摘要:loc——通过行标签索引行数据 iloc——通过行号获取行数据 ix——结合前两种的混合索引 具体见http://blog.csdn.net/xw_classmate/article/details/51333646 另外DataFrame[columnsA == columnsB]或者DataFr 阅读全文
posted @ 2017-09-07 22:17 imageSet 阅读(656) 评论(0) 推荐(0) 编辑
摘要:对于DataFrame表格来说,dataframe.columns返回的是横向的表头,dataframe.index返回的是纵向的表头 dataframe.loc['A', 'B']表示第A行B列的元素 用DataFrame.set_index(keys, drop=True, append=Fal 阅读全文
posted @ 2017-09-07 17:46 imageSet 阅读(1240) 评论(0) 推荐(0) 编辑
摘要:查看所有单元格是否为NaN DataFrame.isnull() 这个函数会返回一个和原来表格大小相同的表格,原表格值为NaN,此表中为True,否则为False pandas.notnull() 结果恰好是上一个表格的取反 用DataFrame.dropna(axis=0, how='any',  阅读全文
posted @ 2017-09-07 13:46 imageSet 阅读(250) 评论(0) 推荐(0) 编辑
摘要:Series(列)方法describe(),对于不同类型的变量的列,有不同返回值(http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.describe.html) 列方法Series.value_counts( 阅读全文
posted @ 2017-09-06 22:32 imageSet 阅读(367) 评论(0) 推荐(0) 编辑
摘要:当DataFrame中的元素可以根据某一列来分组时,比如各个国家的经济数据根据各个国家所在的大陆分成几组 第一行得到的是各个大陆GDP的均值,第二行得到的是整个表格中数字列的(各大陆的)均值。 mean()也可以换成别的函数,agg()可以一次进行多个统计值的计算 阅读全文
posted @ 2017-09-06 20:37 imageSet 阅读(304) 评论(0) 推荐(0) 编辑
摘要:一般语法格式Series.str.method()。具体方法见http://pandas.pydata.org/pandas-docs/stable/api.html#string-handling 例如 作用:Convert strings in the Series/Index to be ca 阅读全文
posted @ 2017-09-06 15:00 imageSet 阅读(801) 评论(0) 推荐(0) 编辑
摘要:axis=1表示列(1是竖着的),axis=0表示行 在mean()方法中有所不同,mean(axis=0)返回的是各列的平均值 运行结果是 可以理解为对各列的所有行做平均。 阅读全文
posted @ 2017-09-06 14:35 imageSet 阅读(524) 评论(0) 推荐(0) 编辑
摘要:通过tushare引入DataFrame 阅读全文
posted @ 2017-09-05 21:33 imageSet 阅读(542) 评论(0) 推荐(0) 编辑
摘要:数据来源见前边的几篇随笔 对其中的一列排序 可以看到返回的是一个Series 我们也可以对整个DataFrame进行排序 优先按high排序,high有相同的,按lower排序 阅读全文
posted @ 2017-09-05 20:42 imageSet 阅读(400) 评论(0) 推荐(0) 编辑
摘要:同样,引入一个DataFrame 然后使用drop()函数,删除了换手率‘turnover’列,如下: 如需删除多列,可以将data.drop('turnover', axis=1, inplace=True)中的‘turnover’,改成一个需要删除列(列名的)字符串list。 删除行 list内 阅读全文
posted @ 2017-09-05 20:07 imageSet 阅读(1122) 评论(0) 推荐(0) 编辑
摘要:同样从tushare平台搞到一个DataFrame表格,用data.columns查看列名 显示如下: 使用DataFrame自带的rename方法改变列名,语法格式和结果如下: 可以看到open被open_price代替了,如果想改变多个列名,可以直接将一个包涵各个列名的list复制给data.c 阅读全文
posted @ 2017-09-05 19:41 imageSet 阅读(575) 评论(0) 推荐(0) 编辑
摘要:从tushare平台获取一个股票的DataFrame格式的数据 这里的d和data都是DataFrame格式,具体如下: 如果要选择其中一列(Series)如open这一列,有两种写法data.open或者data['open'],通过print()打印结果如下: 用type(data.open)或 阅读全文
posted @ 2017-09-05 18:29 imageSet 阅读(441) 评论(0) 推荐(0) 编辑
摘要:利用python自带的zip函数可同时对两个列表进行遍历,代码如下: 原理说明 Python3中的zip函数可以把两个或者两个以上的迭代器封装成生成器,这种zip生成器会从每个迭代器中获取该迭代器的下一个值,然后把这些值组装成元组(tuple)。这样,zip函数就实现了平行地遍历多个迭代器。 注意 阅读全文
posted @ 2017-09-04 14:00 imageSet 阅读(63278) 评论(0) 推荐(4) 编辑