摘要: 一、音乐推荐 1、传统的方式:基于suprise 协同过滤(各种版本)、SVD、矩阵分解 2、基于word2vec,用每个歌单中的song_id,作为一个样本,训练song2vec向量,进而求取相似歌曲, 用户兴趣推荐,根据用户喜欢的歌曲,将时间轴权重,歌曲热度权重叠加到song2vec相似歌曲的相 阅读全文
posted @ 2018-03-26 17:50 lxwlxw 阅读(554) 评论(0) 推荐(0) 编辑
摘要: 一、线性回归 基本的概念:训练集(积累知识)、学习策略(预测函数)、代价函数(均方差,logist loss)(评估)、优化,训练最优的模型参数 欠你和和过拟合: 正则化:惩罚参数,变相减少特征 二、逻辑回归 批量梯度下降:求一次参数,遍历所有的样本 随机梯度下降:每一个样本,求一次参数 多分类:o 阅读全文
posted @ 2018-03-26 10:57 lxwlxw 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 一、用词嵌入,rnn、lstm算法,可以在很小的训练集的基础上,建立精确的分类器 1、简单的baseline 构建数据集: 小的数据集(X,Y)其中,X包含127个句子(字符串),Y包含0-4之间的标签,代表表情符号 训练数据集(127个),测试(56个实例)之间分割数据集 训练集:句子用词嵌入的平 阅读全文
posted @ 2018-03-23 17:57 lxwlxw 阅读(792) 评论(0) 推荐(0) 编辑
摘要: 一、情感分析 阅读全文
posted @ 2018-03-21 16:55 lxwlxw 阅读(78) 评论(0) 推荐(0) 编辑
摘要: 1、词汇表征: one-hot表征、词嵌入 2、学习词嵌入 word2vec:Word2vec算法是一种简单的计算更加高效的方式来实现对词嵌入的学习 Skip-gram:所做的是在语料库中选定某个词(Context),随后在该词的正负10个词距内取一些目标词(Target)与之配对,构造一个用Con 阅读全文
posted @ 2018-03-19 16:06 lxwlxw 阅读(769) 评论(0) 推荐(0) 编辑
摘要: 第一门课:神经网络和深度学习 第二门课:改善深层神经网络:超参数调试、正则化及优化 第三门课:结构化机器学习项目 第四门课:卷积神经网络 三、CNN 1、作业一:一步一步CNN和使用CNN对图片多分类 CNN: cov fun :卷积函数 pool fun : 池化函数:减少计算量 cnn_sing 阅读全文
posted @ 2018-03-19 13:23 lxwlxw 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 一、序列模型-循环神经网络 1、序列模型的应用 语音信号:将输入的语音信号直接输出相应的语音文本信息。无论是语音信号还是文本信息均是序列数据。 2、循环神经网络: RNN:Waa是连接激励函数与隐藏层的参数,Wax是连接输入和隐藏层的参数,Wya是连接隐藏层和输出层的参数 ; 随即梯度计算法方法更新 阅读全文
posted @ 2018-03-19 10:34 lxwlxw 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 1、什么是LDA主题模型? LDA主题模型是一种无监督的贝叶斯模型; 是一种主题模型,它可以将文档集中的每个文档的主题按照概率给出,同时他是一种无监督学习算法,在训练时不需要手工标注的数据集,仅仅需要文档集和主题的数量K即可。此外LDA的每一个主题均可以找到一些词语来描述它。 是一种典型的词袋模型, 阅读全文
posted @ 2018-03-12 20:19 lxwlxw 阅读(732) 评论(0) 推荐(0) 编辑
摘要: 一、数据结构 常见的面试题都是围绕数组、字符串、链表、树、栈及队列这几种常见的数据结构展开,需熟练掌握,数组和字符串是两种最基本的数据结构,他们用连续内存分别存储数字和字符。链表和树是面试中出现频率最高的数据结构,栈是一个与递归紧密相关的数据结构,同样队列与广度优先遍历算法紧密相关,需深刻理解 1、 阅读全文
posted @ 2018-03-07 19:39 lxwlxw 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 1、LDA在自然语言处理中的应用 2、七月在线机器学习项目 3、吴恩达机器学习 4、吴恩达深度学习笔记 5、spark入门指南(w3school) 03.28 原版 6、统计学习方法李航 7、微平台推荐系统介绍(基于java) 看到文档,系统架构有了解,具体的java代码还需要后续的继续看;03.2 阅读全文
posted @ 2018-03-07 18:07 lxwlxw 阅读(92) 评论(0) 推荐(0) 编辑