05 2018 档案

摘要:一、命令方法 1.使用cp命令 需要注意的是这几个文件之间不要有空格 2.具有共同前缀 复制的文件是file1, file2, file3, file4 二、脚本方法 使用python脚本 shutil库 2. 将以上代码保存为move.py 3. 运行 $ python move.py /path 阅读全文
posted @ 2018-05-31 15:38 焦距 阅读(5509) 评论(0) 推荐(1) 编辑
摘要:这里介绍一下文本预处理中常用的操作: 1.英文统一小写 2.分词 3.去噪 两种方式 (1)去停用词 包括中英文标点符号、以及噪音词,参考附录[1] (2)只保留指定词典中的词 这个词典与任务强相关,通常是当前任务重点关注的特征词 其中,为了保证分词的结果是我们想要的,通常需要调整jieba词典: 阅读全文
posted @ 2018-05-29 12:01 焦距 阅读(1011) 评论(0) 推荐(0) 编辑
摘要:常用的中英字符/汉字: 英文字符可以从string包得到: 阅读全文
posted @ 2018-05-18 11:58 焦距 阅读(6643) 评论(0) 推荐(0) 编辑
摘要:序贯(Sequential)模型 序贯模型是多个网络层的线性堆叠,也就是“一条路走到黑”。 可以通过向Sequential模型传递一个layer的list来构造该模型: from keras.models import Sequential from keras.layers import Dens 阅读全文
posted @ 2018-05-17 10:41 焦距 阅读(942) 评论(0) 推荐(0) 编辑
摘要:Keras FAQ:常见问题 如何引用Keras? 如果Keras对你的研究有帮助的话,请在你的文章中引用Keras。这里是一个使用BibTex的例子 @misc{chollet2015keras, author = {Chollet, François and others}, title = { 阅读全文
posted @ 2018-05-17 09:58 焦距 阅读(669) 评论(0) 推荐(0) 编辑
摘要:Keras项目github源码(python):keras-team/keras: Deep Learning for humans 里面的docs包含说明文档 中文文档:Keras中文文档 预训练模型的权重文件(Xception VGG16 VGG19 ResNet50 InceptionV3 I 阅读全文
posted @ 2018-05-16 21:07 焦距 阅读(172) 评论(0) 推荐(0) 编辑
摘要:在用apt-get安装软件包的时候遇到E: Sub-process /usr/bin/dpkg returned an error code (1)问题,解决方法如下: 到此问题得以顺利解决。 参考:https://www.cnblogs.com/nkh222/p/8126455.html 阅读全文
posted @ 2018-05-16 16:17 焦距 阅读(50076) 评论(6) 推荐(11) 编辑
摘要:一、用于对话系统的中英文语料 Datasets for Training Chatbot System 参考:GitHub - candlewill/Dialog_Corpus: 用于训练中英文对话系统的语料库 Datasets for Training Chatbot System 本项目收集了一 阅读全文
posted @ 2018-05-15 09:58 焦距 阅读(8895) 评论(0) 推荐(0) 编辑
摘要:在训练深度学习模型的时候,通常将数据集切分为训练集和验证集.Keras提供了两种评估模型性能的方法: 使用自动切分的验证集 使用手动切分的验证集 一.自动切分 在Keras中,可以从数据集中切分出一部分作为验证集,并且在每次迭代(epoch)时在验证集中评估模型的性能. 具体地,调用model.fi 阅读全文
posted @ 2018-05-14 15:45 焦距 阅读(26076) 评论(2) 推荐(4) 编辑
摘要:一、数值类型(int、float) # %d、%f是占位符>>> a = 3.1415926>>> print("%d"%a) #%d只能输出整数,int类3>>> print("%f"%a) #%f输出浮点数3.141593>>> print("%.2f"%a) #按照要求输出小数位数3.14>> 阅读全文
posted @ 2018-05-07 15:57 焦距 阅读(14932) 评论(0) 推荐(0) 编辑