摘要: def read_csv(): f = open('train_sales_data.csv') df = pd.read_csv(f) y = np.array(df['UNIT_SALES']) x1 = np.array(df['ITEM_NBR']) x2 = np.array(df['ST 阅读全文
posted @ 2017-12-09 23:30 香港胖仔 阅读(2373) 评论(0) 推荐(0) 编辑
摘要: 这篇也是在阅读了吴军老师的《数学之美》一书后,所写的一些笔记 下面来引用书中的一些搜索引擎反作弊的一些方法: 他们发现通信模型对于搜索反作弊依然适用。 在通信中解决噪音干扰问题的基本思路有两条 1、从信息源出发,加强通信(编码)自身的抗干扰能力 2、从传播来看,过滤掉噪音,还原信息 (1)搜索引擎作 阅读全文
posted @ 2017-10-16 10:20 香港胖仔 阅读(268) 评论(0) 推荐(0) 编辑
摘要: 最近由于.......你懂得,需要一些搜索方面的知识,于是乎我重新复习了一下上半年读的那本书《数学之美》Dr吴军老师写的。 感觉读完这种书还是写一下比较好,因为将来说不定就会忘记了。 接下来几篇就像写一下搜索算法的各种原理了。 虽然在公司我们使用过solr,虽然使用solr之前也知道Solr使用的是 阅读全文
posted @ 2017-10-15 14:37 香港胖仔 阅读(471) 评论(0) 推荐(0) 编辑
摘要: 大家好: 今天开始会将所有的博客搬家到CSDN,以后请参考CSDN上的博客:http://blog.csdn.net/u012416045 谢谢 维真 阅读全文
posted @ 2017-10-13 09:40 香港胖仔 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 1、Recursive Nerual Networks能够更好地体现每个词与词之间语法上的联系这里我们选取的损失函数仍然是交叉熵函数 2、整个网络的结构如下图所示: 每个参数的更新时的梯队值如何计算,稍后再给大家计算相应的数学公式 这里先列出节点的合并规则 1、即假设将一句话中的词先两个合并,并通过 阅读全文
posted @ 2017-10-06 22:37 香港胖仔 阅读(505) 评论(0) 推荐(0) 编辑
摘要: 今天将的还是cs224d 的problem set2 的第三部分习题, 原来国外大学的系统难度真的如此之大,相比之下还是默默地再天朝继续搬砖吧 下面讲述一下RNN语言建模的数学公式: 给出一串连续的词x1,x2...xt关于预测其后面紧跟的词xt+1的建模方式是: vj是词库中的某个词。实现一个循环 阅读全文
posted @ 2017-09-29 21:34 香港胖仔 阅读(495) 评论(0) 推荐(0) 编辑
摘要: 神经网络在命名实体识别中的应用 所有的这些包括之前的两篇都可以通过tensorflow 模型的托管部署到 google cloud 上面,发布成restful接口,从而与任何的ERP,CRM系统集成、 天呀,这就是赤果果的钱呀。好血腥。感觉tensorflow的革命性意义就是能够将学校学到的各种数学 阅读全文
posted @ 2017-09-23 12:08 香港胖仔 阅读(714) 评论(0) 推荐(0) 编辑
摘要: Hi Dear Today we will use tensorflow to implement the softmax regression and linear classifier algorithm. not using the library of tensorflow (like tf 阅读全文
posted @ 2017-09-21 20:42 香港胖仔 阅读(798) 评论(0) 推荐(0) 编辑
摘要: 使用在上一篇博客中训练好的wordvector 在这一节进行情感分析。 因为在上一节中得到的是一个词就是一个向量 所以一句话便是一个矩阵,矩阵的每一列表示一个词向量 情感分析的前提是已知一句话是 (超级消极,比较消极,中立,积极,非常积极)中的一类作为训练集分别用(0,1,2,3,4)进行表示 然后 阅读全文
posted @ 2017-09-19 21:33 香港胖仔 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 首先上来的是最简单的sigmoid激励函数, 至于为什么选他做激励函数, 1、因为这个函数能将定义域为(-inf,+inf)的值映射到(0,1)区间,便于计算(能够消除量纲的影响) 2、这个函数的变化曲线不是特变陡峭,每一点处都可导 3、这个函数的导数为y(1-y),即用他原来的函数值就可以求出其导 阅读全文
posted @ 2017-09-17 22:38 香港胖仔 阅读(1143) 评论(0) 推荐(0) 编辑
摘要: 这是根据斯坦福cs224d课程写出来的, 这是课程里边最开始所讲的词向量, 1、首先将所有的词组织成一个词典 2、对于词典中的每一个词, 扫描词典中的其他词, 对于扫描到的每一个词, 统计原始词在被扫描到的词的前边或者后边出现的次数, 这样就构成了一个由词频所构成的对角阵 3、对该对角阵进行SVD分 阅读全文
posted @ 2017-08-12 19:23 香港胖仔 阅读(398) 评论(0) 推荐(0) 编辑
摘要: 下面是训练的结果 这里边有一个死循环,具体怎么回事我也不太清楚。 下边是可视化训练,展示训练的图像 阅读全文
posted @ 2017-07-23 11:56 香港胖仔 阅读(2535) 评论(0) 推荐(0) 编辑
摘要: 加载数据 > w<-read.table("test.prn",header = T) > w X.. X...1 1 A 2 2 B 3 3 C 5 4 D 5 > library(readxl) > dat<-read_excel("test.xlsx") > dat # A tibble: 4 阅读全文
posted @ 2017-06-09 21:38 香港胖仔 阅读(1782) 评论(0) 推荐(0) 编辑
摘要: 1、读取数据 2、查看数据结构 3、查看摘要统计量 4、查看数据是否有缺失 5、单变量频数分析 6、两个变量的交叉列联表 7、 8、构建更复杂的Table 9、卡方检验 10、连续数据可视化 11、连续变量的分布 阅读全文
posted @ 2017-06-02 15:39 香港胖仔 阅读(1909) 评论(0) 推荐(0) 编辑
摘要: 1、查看当前工作空间 2、查看内存中有哪些对象 3、把指定对象从内存中删除 4、查看函数帮助 5、创建向量和矩阵 6、按行将向量排列成矩阵 7、按列将向量排成矩阵 8、求向量的均值 9、求向量的和 10、 11、生成矩阵 12、矩阵的转置 13、矩阵的加减 14、矩阵乘法 15、矩阵求对角元素 16 阅读全文
posted @ 2017-06-02 11:47 香港胖仔 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 下面是训练的结果,需要等到所有的机器都开起来之后才能进行训练 阅读全文
posted @ 2017-05-28 22:40 香港胖仔 阅读(6709) 评论(0) 推荐(0) 编辑
摘要: 下面是训练完的结果 阅读全文
posted @ 2017-05-27 07:46 香港胖仔 阅读(1241) 评论(0) 推荐(0) 编辑
摘要: ''' Created on 2017年5月23日 @author: weizhen ''' import os import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # minist_i 阅读全文
posted @ 2017-05-25 09:54 香港胖仔 阅读(1625) 评论(0) 推荐(0) 编辑
摘要: ''' Created on May 24, 2017 @author: p0079482 ''' #使用程序输出日志 import tensorflow as tf with tf.Session() as sess: tf.initialize_all_variables().run() for i in range(TRAINING_STEPS): xs,... 阅读全文
posted @ 2017-05-24 17:08 香港胖仔 阅读(5519) 评论(0) 推荐(0) 编辑