摘要:pytorch学习笔记2 定义 ADAMW优化器 官方手册 构造函数 CLASS torch.optim.AdamW(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0.01, amsgrad=False, *, maxim
阅读全文
摘要:pytorch学习笔记1 模型与参数的关系: 深度学习中的模型可以抽象成一堆参数按照固定的运算规则所组成等的公式。 模型中的每个参数都是具体的数字,运算规则就是模型的网络结构。 在训练过程中,模型通过反复将公式的计算结果与目标值比较,并利用二者的差距对每个参数进行调整。 经过多次调整后的参数,可以使
阅读全文
摘要:基于TensorFlow和Python的机器学习(笔记3) # region 中文情感分析任务 参数配置 task_name = 'CC' # Chinese_classificationdo_train = Truedo_eval = Truedata_dir = '../GLUE/glue_da
阅读全文
摘要:Bert_Doc BERT文档中英文对照版 README.md https://github.com/google-research/bert ... BERT BERT模型的全称是:BidirectionalEncoder Representations from Transformer。从名字中
阅读全文
摘要:BERT论文中文版:用于语言理解的深度双向Transformer的预训练 Jacob Devlin Ming-Wei Chang Kenton Lee kristina Toutanova Google AI Language {jacobdevlin, mingweichang, kentonl,
阅读全文
摘要:BERT模型源码解析 modeling.py 目录 属性 类 class BertConfig(object) BERT模型配置参数类 class BertModel(object) BERT模型类 函数 def gelu(x) 格鲁激活函数 def get_activation(activatio
阅读全文
摘要:基于TensorFlow和Python的机器学习(笔记2) LSTM模型摘要 Model: "sequential_1" _________________________________________________________________ Layer (type) Output Sha
阅读全文
摘要:基于TensorFlow和Python的机器学习(笔记1) Keras和TensorFlow比较 项目 Keras TensorFlow 学习难度 简单 困难 使用弹性 中等 高 开发效率 高 中等 执行性能 高 高 适合用户 初学者 老油条 张量运算 不用自行设计 需要自行设计 数据图片和矩阵表示
阅读全文
摘要:Python特点(对比C#): Python两种运行模式:交互模式、脚本模式; Python最大特点:简洁;Python3不向前兼容(x),但是提供了2to3的转换器; Python常用IDE有VSCode和JupiterNotebook(支持图文混排); JupiterNotebook支持的媒体类
阅读全文