摘要:
感谢中国人民大学胡鹤老师,课讲得非常好~ 首先,何谓tensor?即高维向量,例如矩阵是二维,tensor是更广义意义上的n维向量(有type+shape) TensorFlow执行过程为定义图,其中定义子节点,计算时只计算所需节点所依赖的节点,是一种高效且适应大规模的数据计算,方便分布式设计,对于 阅读全文
摘要:
感谢中国人民大学胡鹤老师,课程深入浅出,非常好 一、关于SVM 可以做线性分类、非线性分类、线性回归等,相比逻辑回归、线性回归、决策树等模型(非神经网络)功效最好 传统线性分类:选出两堆数据的质心,并做中垂线(准确性低)——上图左 SVM:拟合的不是一条线,而是两条平行线,且这两条平行线宽度尽量大, 阅读全文
摘要:
一、Linear Regression 线性回归是相对简单的一种,表达式如下 其中,θ0表示bias,其他可以看做weight,可以转换为如下形式 为了更好回归,定义损失函数,并尽量缩小这个函数值,使用MSE方法(mean square equal) 缩小方法采用梯度下降法,即不断地向现在站立的山坡 阅读全文
摘要:
由于合作方使用.net编程,jar包不能用,需要转换成dll格式,来回转换了十几个dll文件(心塞。。),终于生成了一个可用的。在这里将走过的弯弯绕绕总结下,希望遇到相似问题的同好们,能走得顺利些。 版本问题: 由于现在java的jre都是用的1.8以上版本,所对应ikvm应该是8版本。而网上大多数 阅读全文
摘要:
由于项目要求(虽然我觉得代码没什么机密可言...),写好的jar包需要做一定加密处理 这里提供两种办法,一种奇葩,一种通用 1. 直接修改jar文件: 具体步骤: 在代码中插入一段不会运行的到的代码 使用eclipse打包文件,右键export > java > JAR file > finish 阅读全文
摘要:
从大一开始接触TF-IDF,一直觉得这个特别简单,,但是图样图森破,,, 即使现在来说,也似乎并非完全搞懂 核心思想: 计算词语在该文章中权重,与词语出现次数和词语价值有关 词语出现次数,重复即强调,越重要 词语价值,出现在越多的文档中越滥情,越廉价 公式: 词频TF = 出现次数 / 总次数 逆向 阅读全文
摘要:
sklearn是scikit-learn的简称,诸多python工具包都需要这个库 安装顺序: wheel numpy scipy sklearn 因为这个库一直安装不好,都没有动力继续深造机器学习了,,,,kuku 报错原因: Windows系统的pip install可能对于scipy等库的安装 阅读全文