06 2018 档案

NLP之——Word2Vec详解

摘要：2013年，Google开源了一款用于词向量计算的工具——word2vec，引起了工业界和学术界的关注。首先，word2vec可以在百万数量级的词典和上亿的数据集上进行高效地训练；其次，该工具得到的训练结果——词向量（word embedding），可以很好地度量词与词之间的相似性。随着深度学习（D 阅读全文

posted @ 2018-06-28 19:29 郭耀华阅读(111907) 评论(9) 推荐(101) 编辑

NLP基础——词集模型（SOW）和词袋模型（BOW）

摘要：（1）词集模型（Set Of Words）：单词构成的集合，集合自然每个元素都只有一个，也即词集中的每个单词都只有一个。（2）词袋模型（Bag Of Words）：如果一个单词在文档中出现不止一次，并统计其出现的次数（频数）。为文档生成对应的词集模型和词袋模型考虑如下的文档： list o 阅读全文

posted @ 2018-06-27 13:56 郭耀华阅读(4729) 评论(0) 推荐(1) 编辑

DSSM：深度语义匹配模型（及其变体CLSM、LSTM-DSSM）

摘要：导语在NLP领域，语义相似度的计算一直是个难题：搜索场景下Query和Doc的语义相似度、feeds场景下Doc和Doc的语义相似度、机器翻译场景下A句子和B句子的语义相似度等等。本文通过介绍DSSM、CNN DSSM、LSTM DSSM等深度学习模型在计算语义相似度上的应用，希望给读者带来帮助。阅读全文

posted @ 2018-06-26 15:06 郭耀华阅读(26195) 评论(1) 推荐(10) 编辑

【深度学习】一文读懂机器学习常用损失函数（Loss Function）

摘要：最近太忙已经好久没有写博客了，今天整理分享一篇关于损失函数的文章吧，以前对损失函数的理解不够深入，没有真正理解每个损失函数的特点以及应用范围，如果文中有任何错误，请各位朋友指教，谢谢~ 损失函数（loss function）是用来估量模型的预测值f(x)与真实值Y的不一致程度，它是一个非负实值函数, 阅读全文

posted @ 2018-06-23 14:46 郭耀华阅读(78723) 评论(1) 推荐(35) 编辑

知乎问题代码

摘要：# -*- coding: utf-8 -*- """ Created on Sat May 19 18:44:40 2018 @author: John Kwok """ # import import numpy as np import tensorflow as tf import GetDataUtil # 数据读取及预处理 ''' 定义超参 ''' BATCH_SIZE = 12... 阅读全文

posted @ 2018-06-02 22:50 郭耀华阅读(697) 评论(0) 推荐(0) 编辑

公告

昵称：郭耀华
园龄： 7年8个月
粉丝： 591
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

郭耀华's Blog

欲穷千里目，更上一层楼
项目主页：https://github.com/guoyaohua/

06 2018 档案

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (117)

随笔档案 (158)

相册 (6)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

郭耀华's Blog

欲穷千里目，更上一层楼 项目主页：https://github.com/guoyaohua/

06 2018 档案

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (117)

随笔档案 (158)

相册 (6)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

欲穷千里目，更上一层楼
项目主页：https://github.com/guoyaohua/