随笔档案「2017年9月」 - imageSet

摘要：http://www.cnblogs.com/90zeng/p/Lagrange_duality.html 阅读全文

posted @ 2017-09-24 22:55 imageSet 阅读(170) 评论(0) 推荐(0)

摘要：转自http://www.cnblogs.com/ldphoebe/p/5000769.html 函数间隔的取值并不影响最优化问题的解，因为成比例的改变w和b目标函数和约束条件都不受到影响，所以我们可以让函数间隔为1. 目标函数就变为1/||w||,由于让1/||w||最大化，等价于让分母||w|| 阅读全文

posted @ 2017-09-24 22:30 imageSet 阅读(1423) 评论(0) 推荐(0)

支持向量机中的函数距离和几何距离

摘要：作者：Jason Gu链接：https://www.zhihu.com/question/20466147/answer/28469993来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。 SVM是通过超平面将样本分为两类。在超平面确定的情况下，可以相对地表示点距离超平面阅读全文

posted @ 2017-09-24 21:05 imageSet 阅读(856) 评论(0) 推荐(0)

贝叶斯网络(Bayesian networks)

摘要：http://www.cnblogs.com/leoo2sk/archive/2010/09/18/bayes-network.html 阅读全文

posted @ 2017-09-24 17:46 imageSet 阅读(195) 评论(0) 推荐(0)

朴素贝叶斯分类(Naive Bayesian classification)

posted @ 2017-09-23 19:47 imageSet 阅读(183) 评论(0) 推荐(0)

分类和逻辑回归(Classification and logistic regression)，广义线性模型(Generalized Linear Models) ，生成学习算法(Generative Learning algorithms)

摘要：分类和逻辑回归(Classification and logistic regression) http://www.cnblogs.com/czdbest/p/5768467.html 广义线性模型(Generalized Linear Models) http://www.cnblogs.com 阅读全文

posted @ 2017-09-23 15:20 imageSet 阅读(186) 评论(0) 推荐(0)

希腊字母

摘要：1 Α α alpha a:lf 阿尔法 2 Β β beta bet 贝塔 3 Γ γ gamma ga:m 伽马 4 Δ δ delta delt 德尔塔 5 Ε ε epsilon ep`silon 伊普西龙 6 Ζ ζ zeta zat 截塔 7 Η η eta eit 艾塔 8 Θ θ t 阅读全文

posted @ 2017-09-23 15:05 imageSet 阅读(350) 评论(0) 推荐(0)

量化中的Alpha、Beta、Sharpe、Sortino、Information Ratio、Volatility、Benchmark Volatility交易风险指标

摘要：见http://www.cnblogs.com/chengxin1982/p/7076064.html 阅读全文

posted @ 2017-09-23 10:48 imageSet 阅读(714) 评论(0) 推荐(0)

局部加权线性回归(Locally weighted linear regression)

摘要：这里有现成的，引用一下。http://www.cnblogs.com/czdbest/p/5767138.html 阅读全文

posted @ 2017-09-22 21:47 imageSet 阅读(158) 评论(0) 推荐(0)

随机梯度下降（stochastic gradient descent），批梯度下降（batch gradient descent），正规方程组(The normal equations)

摘要：对于一个线性回归问题有为了使得预测值h更加接近实际值y，定义 J越小，预测更加可信，可以通过对梯度的迭代来逼近极值批梯度下降（batch gradient descent）（the entire training set before taking a single step）随机梯度下降（s 阅读全文

posted @ 2017-09-22 21:08 imageSet 阅读(344) 评论(0) 推荐(0)

机器学习杂记

摘要：主成分分析（ Principal Component Analysis ， PCA ）或者主元分析。用于数据降维。强大的矩阵奇异值分解(SVD)及其应用 http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applicati 阅读全文

posted @ 2017-09-21 23:15 imageSet 阅读(133) 评论(0) 推荐(0)

列表解析、字典解析、集合解析、生成器解析

摘要：列表解析式是列表生成式的一种，即在列表生成式中加入条件字典解析式和列表解析式的用法是差不多的集合解析式跟列表解析式差不多，都是对一个列表的元素全部执行相同的操作，但集合是一种无重复无序的序列。区别：跟列表解析式的区别在于：1.不使用中括号，使用大括号；2.结果中无重复；3.结果是一个set() 阅读全文

posted @ 2017-09-17 17:02 imageSet 阅读(233) 评论(0) 推荐(0)

匿名函数lambda

摘要：匿名函数lambda x: x * x实际上就是：关键字lambda表示匿名函数，冒号前面的x表示函数参数。匿名函数有个限制，就是只能有一个表达式，不用写return，返回值就是该表达式的结果。用匿名函数有个好处，因为函数没有名字，不必担心函数名冲突。此外，匿名函数也是一个函数对象，也可以把匿阅读全文

posted @ 2017-09-17 16:30 imageSet 阅读(186) 评论(0) 推荐(0)

filter

摘要：Python内建的filter()函数用于过滤序列。和map()类似，filter()也接收一个函数和一个序列。和map()不同的是，filter()把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。例如，在一个list中，删掉偶数，只保留奇数，可以这阅读全文

posted @ 2017-09-17 16:04 imageSet 阅读(174) 评论(0) 推荐(0)

map/reduce

摘要：map()函数接收两个参数，一个是函数，一个是可迭代对象Iterable，map将传入的函数依次作用到序列的每个元素，并把结果作为新的迭代器Iterator返回。举例说明，比如我们有一个函数f(x)=x2，要把这个函数作用在一个list [1, 2, 3, 4, 5, 6, 7, 8, 9]上，就阅读全文

posted @ 2017-09-17 15:21 imageSet 阅读(177) 评论(0) 推荐(0)

深入学习python，提高竞争力

摘要：阅读全文

posted @ 2017-09-16 15:34 imageSet 阅读(151) 评论(0) 推荐(0)

python 生成器

摘要：通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不阅读全文

posted @ 2017-09-15 20:50 imageSet 阅读(256) 评论(0) 推荐(0)

python的一些高级特性（列表生成式）

摘要：列表生成式如果要生成[1x1, 2x2, 3x3, ..., 10x10]怎么做？ for循环后面还可以加上if判断，这样我们就可以筛选出仅偶数的平方：还可以使用两层循环，可以生成全排列：因此，列表生成式也可以使用两个变量来生成list：阅读全文

posted @ 2017-09-14 22:50 imageSet 阅读(206) 评论(0) 推荐(0)

python的一些高级特性（切片、迭代）

摘要：之前学习的一些python的高级特性切片迭代如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）。对于字典dict的迭代因为dict的存储不是按照list的方式顺序排列，所以，迭代出的结果顺序很可能不一样。默认阅读全文

posted @ 2017-09-14 21:56 imageSet 阅读(208) 评论(0) 推荐(0)

用python计算菌斑面积

摘要：研究生课题需要所以写了一个：网上用matlab做的比较多，原理也很清楚，就不多说了。没有处理噪声，细节也损失的比较多。阅读全文

posted @ 2017-09-08 23:08 imageSet 阅读(1483) 评论(0) 推荐(1)

如何在字符串中加入变量

摘要：在对文件进行批处理时，如果文件名是字符串+数字格式，同样可以应用以上方法阅读全文

posted @ 2017-09-08 22:11 imageSet 阅读(6354) 评论(0) 推荐(0)

Pandas学习笔记，选择多个行或列

摘要：loc——通过行标签索引行数据 iloc——通过行号获取行数据 ix——结合前两种的混合索引具体见http://blog.csdn.net/xw_classmate/article/details/51333646 另外DataFrame[columnsA == columnsB]或者DataFr 阅读全文

posted @ 2017-09-07 22:17 imageSet 阅读(685) 评论(0) 推荐(0)

DataFrame的横向表头columns和纵向表头index

摘要：对于DataFrame表格来说，dataframe.columns返回的是横向的表头，dataframe.index返回的是纵向的表头 dataframe.loc['A', 'B']表示第A行B列的元素用DataFrame.set_index(keys, drop=True, append=Fal 阅读全文

posted @ 2017-09-07 17:46 imageSet 阅读(1272) 评论(0) 推荐(0)

如何处理DataFrame中缺失项

摘要：查看所有单元格是否为NaN DataFrame.isnull() 这个函数会返回一个和原来表格大小相同的表格，原表格值为NaN，此表中为True，否则为False pandas.notnull() 结果恰好是上一个表格的取反用DataFrame.dropna(axis=0, how='any', 阅读全文

posted @ 2017-09-07 13:46 imageSet 阅读(257) 评论(0) 推荐(0)

一些Pandas常用方法

摘要：Series（列）方法describe()，对于不同类型的变量的列，有不同返回值（http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.describe.html）列方法Series.value_counts( 阅读全文

posted @ 2017-09-06 22:32 imageSet 阅读(379) 评论(0) 推荐(0)

Pandas学习笔记，groupby的一些用法

摘要：当DataFrame中的元素可以根据某一列来分组时，比如各个国家的经济数据根据各个国家所在的大陆分成几组第一行得到的是各个大陆GDP的均值，第二行得到的是整个表格中数字列的（各大陆的）均值。 mean（）也可以换成别的函数，agg（）可以一次进行多个统计值的计算阅读全文

posted @ 2017-09-06 20:37 imageSet 阅读(328) 评论(0) 推荐(0)

Pandas学习笔记，字符串方法（string method），转换数据类型，方法连写等等。

摘要：一般语法格式Series.str.method()。具体方法见http://pandas.pydata.org/pandas-docs/stable/api.html#string-handling 例如作用：Convert strings in the Series/Index to be ca 阅读全文

posted @ 2017-09-06 15:00 imageSet 阅读(833) 评论(0) 推荐(0)

Pandas学习笔记，axis的用法

摘要：axis=1表示列（1是竖着的），axis=0表示行在mean()方法中有所不同，mean(axis=0）返回的是各列的平均值运行结果是可以理解为对各列的所有行做平均。阅读全文

posted @ 2017-09-06 14:35 imageSet 阅读(555) 评论(0) 推荐(0)

Pandas学习笔记，如何用列的值过滤行

摘要：通过tushare引入DataFrame 阅读全文

posted @ 2017-09-05 21:33 imageSet 阅读(556) 评论(0) 推荐(0)

Pandas学习笔记，DataFrame的排序问题

摘要：数据来源见前边的几篇随笔对其中的一列排序可以看到返回的是一个Series 我们也可以对整个DataFrame进行排序优先按high排序，high有相同的，按lower排序阅读全文

posted @ 2017-09-05 20:42 imageSet 阅读(413) 评论(0) 推荐(0)

Pandas学习笔记，如何删除DataFrame中的一列（行）

摘要：同样，引入一个DataFrame 然后使用drop（）函数，删除了换手率‘turnover’列，如下：如需删除多列，可以将data.drop('turnover', axis=1, inplace=True)中的‘turnover’，改成一个需要删除列（列名的）字符串list。删除行 list内阅读全文

posted @ 2017-09-05 20:07 imageSet 阅读(1144) 评论(0) 推荐(0)

Pandas学习笔记，如何重命名DataFrame中的一列

摘要：同样从tushare平台搞到一个DataFrame表格，用data.columns查看列名显示如下：使用DataFrame自带的rename方法改变列名，语法格式和结果如下：可以看到open被open_price代替了，如果想改变多个列名，可以直接将一个包涵各个列名的list复制给data.c 阅读全文

posted @ 2017-09-05 19:41 imageSet 阅读(592) 评论(0) 推荐(0)

Pandas学习笔记，如何从DataFrame里选择一个Series

摘要：从tushare平台获取一个股票的DataFrame格式的数据这里的d和data都是DataFrame格式，具体如下：如果要选择其中一列（Series）如open这一列，有两种写法data.open或者data['open'],通过print（）打印结果如下：用type（data.open）或阅读全文

posted @ 2017-09-05 18:29 imageSet 阅读(451) 评论(0) 推荐(0)

python 如何在一个for循环中遍历两个列表

摘要：利用python自带的zip函数可同时对两个列表进行遍历，代码如下：原理说明 Python3中的zip函数可以把两个或者两个以上的迭代器封装成生成器，这种zip生成器会从每个迭代器中获取该迭代器的下一个值，然后把这些值组装成元组（tuple）。这样，zip函数就实现了平行地遍历多个迭代器。注意阅读全文

posted @ 2017-09-04 14:00 imageSet 阅读(63495) 评论(0) 推荐(4)

09 2017 档案

公告