09 2020 档案
摘要:cross_entropy 交叉熵是深度学习中常用的一个概念,一般用来求目标与预测值之间的差距。 在介绍softmax_cross_entropy,binary_cross_entropy、sigmoid_cross_entropy之前,先来回顾一下信息量、熵、交叉熵等基本概念。 信息论 交叉熵是信
阅读全文
摘要:关于sklearn——CountVectorizer的一篇详细讲解 https://blog.csdn.net/weixin_38278334/article/details/82320307 使用Keras进行设计全连接层进行文本分类 1 #搭建一个全连接层神经网络进行文本情感分类的demo 2
阅读全文
摘要:命名实体识别(Named Entity Recognition,NER)是NLP中一项非常基础的任务。NER是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。 命名实体识别的准确度,决定了下游任务的效果,是NLP中非常重要的一个基础问题。 作者&编辑 | 小Dream哥 1 命
阅读全文
摘要:关于crf内容我看到了几篇写的不错的博客,具体链接如下,在此记录一下,仅做学习 CRF系列(一)——一个简单的例子 条件随机场CRF(一)从随机场到线性链条件随机场 条件随机场CRF(二) 前向后向算法评估标记序列概率 条件随机场CRF(三) 模型学习与维特比算法解码 CRF可以应用于对一串序列进行
阅读全文
摘要:今天总结一下自然语言处理之词性标注,后附现有比较好的开源实现工具(基于python实现包)~~~ 词性定义 百度百科定义:词性指以词的特点作为划分词类的根据。词类是一个语言学术语,是一种语言中词的语法分类,是以语法特征(包括句法功能和形态变化)为主要依据、兼顾词汇意义对词进行划分的结果。 维基百科定
阅读全文
摘要:关于HMM详细的推导看下面几篇博客 隐马尔科夫模型HMM(一)HMM模型 隐马尔科夫模型HMM(二)前向后向算法评估观察序列概率 隐马尔科夫模型HMM(三)鲍姆-韦尔奇算法求解HMM参数 隐马尔科夫模型HMM(四)维特比算法解码隐藏状态序列 1.1定义、假设和应用 我们先通过一个简单的例子,来了解隐
阅读全文
摘要:记录对《基于深度学习的自然语言处理》书籍的总结。 常见的文本处理技术: 小写/大写转换 去噪 文本规范化 词干提取 词形还原 标记化 删除停用词 1:使用lower进行大写转小写,upper转为大写 s = "I am a boy" s = s.lower() print(s) list = ["I
阅读全文
摘要:本文介绍一个用于 PyTorch 代码的实用工具 TorchSnooper。作者是TorchSnooper的作者,也是PyTorch开发者之一。 GitHub 项目地址: https://github.com/zasdfgbnm/TorchSnooper 大家可能遇到这样子的困扰:比如说运行自己编写
阅读全文
摘要:1 import jieba 2 3 import jieba.analyse 4 5 import jieba.posseg 6 7 8 9 def dosegment_all(sentence): 10 11 ''' 12 13 带词性标注,对句子进行分词,不排除停词等 14 15 :param
阅读全文
摘要:机器学习中,如果参数过多,模型过于复杂,容易造成过拟合(overfit)。即模型在训练样本数据上表现的很好,但在实际测试样本上表现的较差,不具备良好的泛化能力。为了避免过拟合,最常用的一种方法是使用使用正则化,例如 L1 和 L2 正则化。但是,正则化项是如何得来的?其背后的数学原理是什么?L1 正
阅读全文
摘要:转:https://zhuanlan.zhihu.com/p/113623623 重点放在前面: N折交叉验证有两个用途:模型评估、模型选择。 N折交叉只是一种划分数据集的策略。想知道它的优势,可以拿它和传统划分数据集的方式进行比较。它可以避免固定划分数据集的局限性、特殊性,这个优势在小规模数据集上
阅读全文
摘要:1、git基础入门 1.1 基础概念 git是一个开源的分布式版本控制系统,用于敏捷高效的处理或大或小的项目,更是一个内容管理系统(CMS),工作管理系统。 git和snv差异 git是分布式的,svn不是 git把内容按元数据方式存储,而svn是按照文件 git没有一个全局的版本号,而svn有 g
阅读全文
摘要:Resnet系列 关于resnet方面的基础介绍直接看这篇博客,不再叙述 https://www.cnblogs.com/henuliulei/p/13564468.html resnet34的样子如下面 resnet50,101等和34不同的点在于使用了 更深的瓶颈结构: 作者探索的更深的网络。
阅读全文
摘要:BasicModule 程序实现的时候所有模型继承自定义的basicmoudle,主要重写了模型加载和保存等方法 1 import torch 2 from config import opt 3 class BasicModule(torch.nn.Module): 4 def __init__(
阅读全文