02 2018 档案

摘要:转自: Linguistic Data Consortium (LDC) 因为Kaldi里面各种语料涉及到LDC,搜罗一下,好像并没有相应的教程和网站用法。。。。 搞 NLP 的人经常会听到一个神秘的名字 LDC,因为大量的论文所使用的数据都来自于 LDC,本文就来揭露其神秘面目。 About LD 阅读全文
posted @ 2018-02-28 17:13 dahu1 阅读(1849) 评论(1) 推荐(0) 编辑
摘要:参考 kaldi 的全部资料_v0.4 cmd.sh 脚本为: 可以很清楚的看到有 3 个分类分别对应 a,b,c。a 和 b 都是集群上去运行这个样子, c 就是我们需要的。我们在虚拟机上运行的。你需要修改这个脚本 Path.sh 的内容: 在这里一般只要修改 export KALDI_ROOT= 阅读全文
posted @ 2018-02-28 16:59 dahu1 阅读(3740) 评论(0) 推荐(0) 编辑
摘要:参考 交叉验证 交叉验证 (Cross Validation)刘建平 一、训练集 vs. 测试集 在模式识别(pattern recognition)与机器学习(machine learning)的相关研究中,经常会将数据集(dataset)分为训练集(training set)跟测试集(testi 阅读全文
posted @ 2018-02-28 14:06 dahu1 阅读(1174) 评论(0) 推荐(0) 编辑
摘要:lstm,参考: Understanding LSTM Networks 零基础入门深度学习 (6) - 长短时记忆网络 (LSTM) 完整的: 阅读全文
posted @ 2018-02-28 10:25 dahu1 阅读(157) 评论(0) 推荐(0) 编辑
摘要:自己写的一个例子: 可以监控各个集群的性能,当然他的功能远不止此,还有很多很强大的技能,原文: Python 远程部署利器 Fabric 详解 可以去原网址看,以下内容纯属备份,以防原文被删。 Python 远程部署利器 Fabric 详解 Fabric 是一个 Python 的库,它提供了丰富的同 阅读全文
posted @ 2018-02-26 20:14 dahu1 阅读(291) 评论(0) 推荐(0) 编辑
摘要:这里分享两个技巧 1.scrapy-redis分布式爬虫 我们知道scrapy-redis的工作原理,就是把原来scrapy自带的queue队列用redis数据库替换,队列都在redis数据库里面了,每次存,取,删,去重,都在redis数据库里进行,那我们如何使用分布式呢,假设机器A有redis数据 阅读全文
posted @ 2018-02-10 21:14 dahu1 阅读(913) 评论(0) 推荐(0) 编辑
摘要:假设一个分布是离散的。{x1,x2,x3....xn} 对应的概率{p1,p2,p3...pn} 可得 $$ \sum_{i=1}^{n}p_{i}=1 $$ 阅读全文
posted @ 2018-02-01 14:56 dahu1 阅读(7546) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示