随笔分类 - NLP
自然语言处理
摘要:一、模型my_bilstm.py import torch from torch import nn class SiameseLSTM(nn.Module): def __init__(self, input_size): super(SiameseLSTM, self).__init__() s
阅读全文
摘要:一、引言 https://zhuanlan.zhihu.com/p/351678987 在自然语言处理NLP中,文本分类、聚类、表示学习、向量化、语义相似度或者说是文本相似度等等都有非常重要的应用价值。这些任务都是为了能从复杂的文本中,通过采用ML/DL的方法,学习到本文深层次的语义表示,从而更好地
阅读全文
摘要:一、前言 参考:https://zhuanlan.zhihu.com/p/73176084 代码:https://link.zhihu.com/?target=https%3A//github.com/649453932/Chinese-Text-Classification-Pytorch 代码:
阅读全文
摘要:一、资源 (1)预训练模型权重 链接: https://pan.baidu.com/s/10BCm_qOlajUU3YyFDdLVBQ 密码: 1upi (2)数据集选择的THUCNews,自行下载并整理出10w条数据,内容是10类新闻文本标题的中文分类问题(10分类),每类新闻标题数据量相等,为1
阅读全文
摘要:一、代码 import torch.optim as optim import torch.utils.data as Data import torch.nn.functional as F from model.word_2_vector import WordEmbedding import
阅读全文
摘要:BiLSTM_Attention实现
阅读全文
摘要:一、预备知识 1、nn.Embedding 在pytorch里面实现word embedding是通过一个函数来实现的:nn.Embedding. # -*- coding: utf-8 -*- import numpy as np import torch import torch.nn as n
阅读全文
摘要:word2vec + siameseLSTM改进(1)
阅读全文
摘要:一、词嵌入 import jieba from gensim.models import Word2Vec import torch import gensim import numpy as np model = gensim.models.KeyedVectors.load_word2vec_f
阅读全文
摘要:参考文献:https://zhuanlan.zhihu.com/p/59772104https://blog.csdn.net/kejizuiqianfang/article/details/100835528https://www.cnblogs.com/picassooo/p/13577527.
阅读全文
摘要:word2vec的使用详解
阅读全文