08 2020 档案
摘要:笔记摘抄 语料链接:https://pan.baidu.com/s/1YxGGYmeByuAlRdAVov_ZLg 提取码:tzao neg.txt和pos.txt各5000条酒店评论,每条评论一行。 1. 导包和设定超参数 import numpy as np import random impo
阅读全文
摘要:笔记摘抄 1. transformer资料 transformers(以前称为pytorch-transformers和pytorch-pretrained-bert) 提供用于自然语言理解(NLU)和自然语言生成(NLG)的BERT家族通用结构(BERT,GPT-2,RoBERTa,XLM,Dis
阅读全文
摘要:视频讲解 直接看这个-->Github 导包: import re import math import torch import numpy as np from random import * import torch.nn as nn import torch.optim as optim i
阅读全文
摘要:1. ELMO 2. BERT 就是Transformer的Encoder部分:输入input,输出embedding 如果处理中文,用 字 作为单位 (潮水--词,潮--字) 2.1 预测Masked word 2.2 [SEP] 和 [CLS] [SEP]:两个句子的 边界 [CLS]:输出 分
阅读全文
摘要:https://www.cnblogs.com/linzhenyu/p/13277552.html
阅读全文
摘要:摘抄 1. 爬取京东商品评论 JD.py import requests from urllib.parse import quote from urllib.parse import urlencode from lxml import etree import logging import js
阅读全文
摘要:笔记摘抄 Transformer模型(文本分类仅用到Encoder部分): 1. 数据预处理 和上一个博客https://www.cnblogs.com/douzujun/p/13511237.html中的数据和预处理都一致。 import numpy as np import torch from
阅读全文
摘要:摘抄笔记 语料链接:https://pan.baidu.com/s/1aDIp3Hxw-Xuxcx-lQ_0w9A 提取码:hpg7 train.txt pos/neg各500条,一共1000条(用于训练模型) dev.txt pos/neg各100条,一共200条(用于调参数) test.txt
阅读全文
摘要:https://blog.csdn.net/qq_40210472/article/details/87895626 1. nn.Conv2d nn.Conv2d 输入信号的形式为(N, Cin, H, W), N表示batch size,Cin表示channel个数,H,W分别表示特征图的高和宽
阅读全文
摘要:1. 导入包 import os import torch import torch.nn as nn from torch.autograd import Variable import torch.utils.data as Data import torchvision import torc
阅读全文
摘要:1. 创建vocabulary 学习词向量的概念 用Skip-thought模型训练词向量 学习使用PyTorch dataset 和 dataloader 学习定义PyTorch模型 学习torch.nn中常见的Module Embedding 学习常见的PyTorch operations bm
阅读全文
摘要:https://www.jianshu.com/p/8ea7fba72673 https://pytorch.org/tutorials/beginner/data_loading_tutorial.html num_works设置过高出错(多线程错误,使用gpu就没事了) https://blog
阅读全文
摘要:output = torch.max(x,dim=1) input输入的是一个tensor dim是max函数索引的维度0/1,0是每列的最大值,1是每行的最大值 返回的是两个值:一个是每一行最大值的tensor组,另一个是最大值所在的位置 max_col_value = torch.max(x,d
阅读全文
摘要:参考: https://pytorch.org/docs/stable/nn.html https://github.com/apachecn/pytorch-doczh/blob/master/docs/1.0/blitz_data_parallel_tutorial.md https://blo
阅读全文
摘要:笔记摘抄 1. WordNet显示同义词 from nltk.corpus import wordnet as wn # 同义词 poses = {'n': 'noun', 'v': 'verb', 's': 'adj(s)', 'a': 'adj', 'r': 'adv'} for synset
阅读全文