论文笔记 - 随笔分类(第2页) - 陈泽泽

【Bootstrap Method】Evaluating The Accuracy of a Classifier

摘要：自助法介绍：非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法，也称为自助法。其核心思想和基本步骤如下：（1）采用重抽样技术从原始样本中抽取一定数量（自己给定）的样本，此过程允许重复抽样。（2）根据抽出的样本计算给定的统计量T。（3）重复上述B次（一般大于1000），得到N个统计量阅读全文

posted @ 2017-05-08 23:21 陈泽泽阅读(283) 评论(0) 推荐(0) 编辑

【Professional English】Words Summary

摘要：01、数据库管理系统（Database Management Systems，DBMS） A database management system (DBMS) is a computer software application that interacts with the user, othe 阅读全文

posted @ 2017-05-05 10:55 陈泽泽阅读(303) 评论(0) 推荐(0) 编辑

【神经网络】Reducing the Dimensionality of Data with Neural Networks

摘要：这篇paper来做什么的？用神经网络来降维、之前降维用的方法是主成分分析法PCA，找到数据集中最大方差方向。（附：降维有助于分类、可视化、交流和高维信号的存储）这篇paper提出了一种非线性的PCA 的推广，通过一个小的中间层来重构高维输入向量，训练一个多层神经网络。利用一个自适应的、多层的编码阅读全文

posted @ 2017-05-03 14:41 陈泽泽阅读(710) 评论(0) 推荐(0) 编辑

【Deep Learning】Hinton. Reducing the Dimensionality of Data with Neural Networks Reading Note

摘要：2006年，机器学习泰斗、多伦多大学计算机系教授Geoffery Hinton在Science发表文章，提出基于深度信念网络（Deep Belief Networks, DBN）可使用非监督的逐层贪心训练算法，为训练深度神经网络带来了希望。如果说Hinton 2006年发表在《Science》杂志上阅读全文

posted @ 2017-04-28 14:50 陈泽泽阅读(1291) 评论(0) 推荐(0) 编辑

【CNN】卷积神经网络

摘要：什么是卷积神经网络卷积神经网络是一种特殊的、简化的深层神经网络模型，它的每个卷积层都是由多个卷积滤波器组成。它最先由lecun在LeNet[40]中提出，网络结构如下图所示。在cnn中，图像的一小部分（局部感受区域）作为层级结构的最低层的输入，信息再依次传输到不同的层，每层通过多个卷积滤波器去获得阅读全文

posted @ 2017-03-31 10:02 陈泽泽阅读(851) 评论(0) 推荐(0) 编辑

Machine Learning、Date Mining、IR&NLP 会议期刊论文推荐

摘要：核心期刊排名查询 http://portal.core.edu.au/conf-ranks/ http://portal.core.edu.au/jnl-ranks/ 1、机器学习推荐会议 NIPS ——主要看文章摘要 2、数据挖掘推荐会议： 3、IR推荐会议 4、NLP推荐会议 CCF推荐会议列表阅读全文

posted @ 2017-03-29 15:40 陈泽泽阅读(427) 评论(0) 推荐(0) 编辑

Natural Language Processing, 2017, Mar.29, Weekly Report

摘要：Distributed Representations of Words and Phrases and their Compositionality T Mikolov, I Sutskever, K Chen, G Corrado, J Dean Advances in Neural Infor 阅读全文

posted @ 2017-03-29 09:06 陈泽泽阅读(194) 评论(0) 推荐(0) 编辑

【word2vec】Distributed Representation——词向量

摘要：Distributed Representation 这种表示，它最早是 Hinton 于 1986 年提出的，可以克服 one-hot representation 的缺点。其基本想法是：通过训练将某种语言中的每一个词映射成一个固定长度的短向量（当然这里的“短”是相对于 one-hot rep 阅读全文

posted @ 2017-03-27 15:12 陈泽泽阅读(3276) 评论(0) 推荐(0) 编辑

十倍交叉验证 10-fold cross-validation

摘要：10-fold cross-validation，用来测试算法准确性。是常用的测试方法。将数据集分成十份，轮流将其中9份作为训练数据，1份作为测试数据，进行试验。每次试验都会得出相应的正确率（或差错率）。10次的结果的正确率（或差错率）的平均值作为对算法精度的估计，一般还需要进行多次10折交叉验证（阅读全文

posted @ 2017-03-08 16:59 陈泽泽阅读(13714) 评论(1) 推荐(2) 编辑

随机梯度下降 Stochastic gradient descent

摘要：梯度下降法先随机给出参数的一组值，然后更新参数，使每次更新后的结构都能够让损失函数变小，最终达到最小即可。在梯度下降法中，目标函数其实可以看做是参数的函数，因为给出了样本输入和输出值后，目标函数就只剩下参数部分了，这时可以把参数看做是自变量，则目标函数变成参数的函数了。梯度下降每次都是更新每个参阅读全文

posted @ 2017-03-08 09:53 陈泽泽阅读(275) 评论(0) 推荐(0) 编辑

【AUC】二分类模型的评价指标ROC Curve

摘要：AUC是指:从一堆样本中随机抽一个，抽到正样本的概率比抽到负样本的概率大的可能性! AUC是一个模型评价指标，只能用于二分类模型的评价，对于二分类模型，还有很多其他评价指标，比如logloss，accuracy，precision。如果你经常关注数据挖掘比赛，比如kaggle，那你会发现AUC和lo 阅读全文

posted @ 2017-02-24 10:51 陈泽泽阅读(2479) 评论(0) 推荐(0) 编辑

IR的评价指标之MRR

摘要：MRR(Mean Reciprocal Rank)：是一个国际上通用的对搜索算法进行评价的机制，即第一个结果匹配，分数为1，第二个匹配分数为0.5，第n个匹配分数为1/n，如果没有匹配的句子分数为0。最终的分数为所有得分之和。把标准答案在被评价系统给出结果中的排序取倒数作为它的准确度，再对所有的阅读全文

posted @ 2017-02-22 10:03 陈泽泽阅读(1058) 评论(0) 推荐(0) 编辑

神经网络架构整理

摘要：新的神经网络架构随时随地都在出现，DCIGN，IiLSTM，DCGAN~ 神经网络通常都有很多层，包括输入层、隐藏层、输出层。单独一层不会有连接，一般相邻的两层是全部相连的（每一层的每个神经元都与另一层的每个神经元相连）。 1. 前向传播网络（FF 或 FFNN）它们从前往后传输信息（分别是输入和阅读全文

posted @ 2016-12-28 14:24 陈泽泽阅读(391) 评论(0) 推荐(0) 编辑

论文参考文献标准格式

摘要：参考文献的类型参考文献（即引文出处）的类型以单字母方式标识，具体如下： M——专著 C——论文集 N——报纸文章 J——期刊文章 D——学位论文 R——报告对于不属于上述的文献类型，采用字母“Z”标识。对于英文参考文献，还应注意以下两点： ①作者姓名采用“姓在前名在后”原则，具体格式是：姓，阅读全文

posted @ 2016-10-25 17:55 陈泽泽阅读(1105) 评论(0) 推荐(0) 编辑

TopCoderのZeze

At Ease, What You Want, Time Will Give You

随笔分类 - 论文笔记

公告