随笔分类 -  海豚实习

摘要:这是text_tech1文件的样子: 这是调用corenlp的命令行: java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP\ -props StanfordCoreNLP-chinese.properties -file file 阅读全文
posted @ 2017-03-26 16:37 有梦就要去实现他 阅读(276) 评论(0) 推荐(0) 编辑
摘要:这是文档 在用gearmand -d启动gearman服务时,会出现错误: 这时需要在/var/log/目录下建立文件gearmand.log,之后继续运行gearmand -d,会出现错误: 这时需要改变文件gearmand.log的权限,我用的chmod 777,之后就能正确运行gearmand 阅读全文
posted @ 2017-03-22 10:50 有梦就要去实现他 阅读(586) 评论(0) 推荐(0) 编辑
摘要:glove.840B.300d.txt是词典文件,包含词及词对应的词向量,需要检查是否每一个词的词向量都是100维的。 向量每一维都是空格隔开的,词与向量也是空格隔开。 文件格式如下: 假设第五行的向量为99维,运行此代码检查的结果为下图: assert: 1、assert语句用来声明某个条件是真的 阅读全文
posted @ 2017-03-20 13:51 有梦就要去实现他 阅读(854) 评论(0) 推荐(0) 编辑
摘要:此代码目的是统计3个文件中所有切分出来的词的词频,并按照词频从大到小的顺序写入另一个文件 阅读全文
posted @ 2017-03-15 16:20 有梦就要去实现他 阅读(557) 评论(0) 推荐(0) 编辑
摘要:解决办法: 阅读全文
posted @ 2017-02-20 15:12 有梦就要去实现他 阅读(178) 评论(0) 推荐(0) 编辑
摘要:运行train文件训练模型出现了以下错误: train文件在app文件目录下: raw_vectors.txt文件则在cnn-Sentence-Classifier目录下: 这是train代码调用read_glove_vectors: 这是read_glove_vectors函数的定义: 这是参数文 阅读全文
posted @ 2017-02-20 14:27 有梦就要去实现他 阅读(362) 评论(0) 推荐(0) 编辑
摘要:需要将cs文件中同一个intend下所有的query构造成a.toks和b.toks用于寻找相同intend却分数很低的句子对 最原始的做法,有30个intend,写一个代码把每个intend从文件中切分出来形成新的文件,然后再写一个代码对每个文件再进行处理,这样的方法很愚蠢,需要很多人工操作,并且 阅读全文
posted @ 2017-02-18 15:23 有梦就要去实现他 阅读(241) 评论(0) 推荐(0) 编辑
摘要:此代码是公司已写好的代码,自己拿来学习,此代码的目标是得出pr图(即准确率和召回率图)所需数据 s4.txt结构:query,标准intend,测出的intend,得分 输出结果: 没经过sorted的prs: 经过sorted的prs: 如果按照.key()方式处理,prs的样子为: http:/ 阅读全文
posted @ 2017-02-17 18:42 有梦就要去实现他 阅读(177) 评论(0) 推荐(0) 编辑
摘要:需要计算每个intend下有多少个query,即计算Q开头的 intend之间有空行 不仅有I,Q,R,有些还有P 这是最后一个intend的样子 错误代码: 报的错误: 正确代码: 错误原因分析:当line1为最后一个空白时,while循环继续执行,这个时候再调用readline函数读下一行就是空 阅读全文
posted @ 2017-02-17 16:39 有梦就要去实现他 阅读(395) 评论(0) 推荐(0) 编辑
摘要:文件名一个不起眼的空格就会改变文件名,这个小细节要注意 阅读全文
posted @ 2017-02-16 11:47 有梦就要去实现他 阅读(161) 评论(0) 推荐(0) 编辑
摘要:此代码是结合代码11的 需要将正例即为1的query减少一半 阅读全文
posted @ 2017-02-15 17:19 有梦就要去实现他 阅读(251) 评论(0) 推荐(0) 编辑
摘要:sim的排列是0和1交叉,但不是标准的一个0一个1的形式。任务就是将a,b,sim按照标准的形式排列,并且需注意无法确定0,1的个数是1:1的(实际上1要多一些) 代码: 阅读全文
posted @ 2017-02-15 16:22 有梦就要去实现他 阅读(166) 评论(0) 推荐(0) 编辑
摘要:local length = part2:size(1) local file = io.open('/home/xbwang/Desktop/part2original','a') for j = 1,length do number = part2[j] file:write(tostring(number)..'\n') end 阅读全文
posted @ 2017-01-22 10:59 有梦就要去实现他 阅读(1067) 评论(0) 推荐(0) 编辑
摘要:这是sim文件 需要将sim中的10行复制40次再次写入文件 a读出的结果是['1\n', '0\n', '0\n', '0\n', '0\n', '0\n', '0\n', '0\n', '1\n', '2\n'],这时候利用join函数将列表转换成一个字符串整体'1\n0\n0\n0\n0\n0 阅读全文
posted @ 2017-01-18 17:24 有梦就要去实现他 阅读(222) 评论(0) 推荐(0) 编辑
摘要:应学到的东西:sort函数是针对列表的排序,列表添加元素用append函数 阅读全文
posted @ 2017-01-18 16:55 有梦就要去实现他 阅读(147) 评论(0) 推荐(0) 编辑
摘要:自己在写从文件循环读每个句子的时候出现问题 错误1: 错误2: 用这两个代码读文件后,会发现命令行中循环一直没有中止,并且会发现,第一个少了最后一行最后一个“哦,谢谢”,第二个少了最后一个vector的最后一个坐标,导致只有99维。这两个错在一个地方,都是用line == None去判断循环是否结束 阅读全文
posted @ 2017-01-18 16:19 有梦就要去实现他 阅读(886) 评论(0) 推荐(0) 编辑
摘要:在gedit中搜索 阅读全文
posted @ 2017-01-10 13:22 有梦就要去实现他 阅读(136) 评论(0) 推荐(0) 编辑
摘要:代码 报错 阅读全文
posted @ 2017-01-06 12:21 有梦就要去实现他 阅读(224) 评论(0) 推荐(0) 编辑
摘要:错误代码 阅读全文
posted @ 2017-01-06 12:16 有梦就要去实现他 阅读(153) 评论(0) 推荐(0) 编辑
摘要:需要将相应数值转换为相应英文类别 转换前的图: 转换后的图 错误代码: 正确代码: 阅读全文
posted @ 2017-01-05 17:37 有梦就要去实现他 阅读(233) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示