02 2018 档案
摘要:转自: Linguistic Data Consortium (LDC) 因为Kaldi里面各种语料涉及到LDC,搜罗一下,好像并没有相应的教程和网站用法。。。。 搞 NLP 的人经常会听到一个神秘的名字 LDC,因为大量的论文所使用的数据都来自于 LDC,本文就来揭露其神秘面目。 About LD
阅读全文
摘要:参考 kaldi 的全部资料_v0.4 cmd.sh 脚本为: 可以很清楚的看到有 3 个分类分别对应 a,b,c。a 和 b 都是集群上去运行这个样子, c 就是我们需要的。我们在虚拟机上运行的。你需要修改这个脚本 Path.sh 的内容: 在这里一般只要修改 export KALDI_ROOT=
阅读全文
摘要:参考 交叉验证 交叉验证 (Cross Validation)刘建平 一、训练集 vs. 测试集 在模式识别(pattern recognition)与机器学习(machine learning)的相关研究中,经常会将数据集(dataset)分为训练集(training set)跟测试集(testi
阅读全文
摘要:lstm,参考: Understanding LSTM Networks 零基础入门深度学习 (6) - 长短时记忆网络 (LSTM) 完整的:
阅读全文
摘要:自己写的一个例子: 可以监控各个集群的性能,当然他的功能远不止此,还有很多很强大的技能,原文: Python 远程部署利器 Fabric 详解 可以去原网址看,以下内容纯属备份,以防原文被删。 Python 远程部署利器 Fabric 详解 Fabric 是一个 Python 的库,它提供了丰富的同
阅读全文
摘要:这里分享两个技巧 1.scrapy-redis分布式爬虫 我们知道scrapy-redis的工作原理,就是把原来scrapy自带的queue队列用redis数据库替换,队列都在redis数据库里面了,每次存,取,删,去重,都在redis数据库里进行,那我们如何使用分布式呢,假设机器A有redis数据
阅读全文
摘要:假设一个分布是离散的。{x1,x2,x3....xn} 对应的概率{p1,p2,p3...pn} 可得 $$ \sum_{i=1}^{n}p_{i}=1 $$
阅读全文