摘要: https://github.com/Kyubyong/neural_chinese_transliterator 使用seq2seq的方式,将拼音序列转换为汉字序列,模型结构: 1.准备训练数据 zho_news_2007-2009_1M-sentences.txt,100w,分词,实际上没有使用 阅读全文
posted @ 2020-03-24 16:47 AliceYing 阅读(337) 评论(0) 推荐(0)
摘要: https://www.aclweb.org/anthology/D19-5522.pdf 论文解读 包括一个降噪自动编码器(DAE)和一个解码器。DAE生成可以将错误文本修改为正确文本的可能的候选项矩阵,解码器在这个矩阵中寻找最佳候选项路径作为输出。 DAE因为可以在大规模正常语料数据上无监督训练 阅读全文
posted @ 2020-03-09 12:38 AliceYing 阅读(1133) 评论(0) 推荐(0)
摘要: 使用groupby按某个key分组后,想按其他key再将值排序 from itertools import groupby, imap from operator import itemgetter for id, items in groupby(imap(lambda x: x.strip(). 阅读全文
posted @ 2020-01-02 16:35 AliceYing 阅读(460) 评论(0) 推荐(0)
摘要: https://my.oschina.net/u/200646/blog/894970 解决方案: 删除.crc文件 阅读全文
posted @ 2019-11-11 14:01 AliceYing 阅读(221) 评论(0) 推荐(0)
摘要: 使用inner join联合查询两张表,查询每张表时都可以加单独的where条件: select tabel1.id, tabel1.name, tabel2.address, from ( select id, name, age from id_name_age_table where age 阅读全文
posted @ 2019-11-08 16:50 AliceYing 阅读(1330) 评论(0) 推荐(0)
摘要: 在python中经常会到用多线程处理某个函数来缩短运行时间,但通常multiprocessing.Pool的map函数只接受一个可迭代参数。 运行上面的程序就会多线程处理并打印出输入x的计算结果。 但是这个函数仅允许函数的输入变量为1,如果函数需要多个参数输入,那个就无法用上面的程序。比如: 当附加 阅读全文
posted @ 2019-11-01 11:36 AliceYing 阅读(4979) 评论(0) 推荐(0)
摘要: C++引入了ostringstream、istringstream、stringstream这三个类,要使用他们创建对象就必须包含<sstream>头文件,通常是用来做数据转换的。 istringstream类用于执行C++风格的串流的输入操作。 ostringstream类用于执行C风格的串流的输 阅读全文
posted @ 2019-10-18 13:40 AliceYing 阅读(2086) 评论(0) 推荐(0)