摘要: import matplotlib.pyplot as pltimport numpy as npimport matplotlib# 设置matplotlib正常显示中文和负号matplotlib.rcParams['font.sans-serif']=['SimHei'] # 用黑体显示中文ma 阅读全文
posted @ 2018-11-25 11:27 yjy888 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 问题一: 160length:4length:4length:4length:4290length:2length:2160length:5length:5length:5length:5length:538本来非零元素应该为5*8为40个,可是因为一句话中的相似词,会出现重复,所以可能出现前一个词 阅读全文
posted @ 2018-11-23 15:09 yjy888 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 常见问题:Kds电子厨打自助点餐机会员卡读卡器钱箱标签机****购买系统这块的问题也可以加上(看看现在4000多个问题里有没有类似的问题) 小票机坏了这种问题,如何统一处理 1212 问题记录 微信支付、支付宝支付需要收手续费吗['手续费', '微信支付', '支付宝', '支付', '收']tim 阅读全文
posted @ 2018-11-20 17:45 yjy888 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 什么是深度学习? 一种机器学习算法,based on 【多层】【非线性变换】的【神经网络】结构 优点:可以使用 低维 稠密 连续 的向量表示不同粒度的语言单元, 还可以使用循环、卷积、递归等神经网络模型对不同的语言单元向量进行组合,获得更大的语言单元, 甚至可以将图像、语言等不同的东西表示在同一个语 阅读全文
posted @ 2018-11-15 16:27 yjy888 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 钱箱 阅读全文
posted @ 2018-11-15 15:58 yjy888 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 批量更改变量名,就在该变量名上shift+f6 ../data 两个点,就是上一级目录,一个点就是当前目录 unhashable type: 'list' 使用set进行去重 a = [1,2,2,3,4] set(a)是可以的 可是如果a = [[1,2],2,2]就不行,set 进行哈希的时候, 阅读全文
posted @ 2018-11-15 08:56 yjy888 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 目的:标注团队会不断的新增精简过的问题,如何把这些问题导入到问题库,由售后的同事接手写答案 【迭代】 初始:问题库里已有130类问题 假设新增问题数共有900条 repeat: Select First Question: 匹配问题库里的所有问题: if 匹配到了,就将该问题及相似问题,导入给这个问 阅读全文
posted @ 2018-11-14 10:00 yjy888 阅读(109) 评论(0) 推荐(0) 编辑
摘要: important_dic = {'预付卡'}weight = 3 #可以修改,也可以再字典里添加权值k=0for word in set(sent): if word in important_dic: k = weight else: k = 0 if word in dic: index = 阅读全文
posted @ 2018-11-13 17:58 yjy888 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 【问题】word2vec训练以后,得到预付卡和购物卡非常接近,可是实际上这两个东西是不一样的,如何区分这两个东西? 解决:建立一个独立词典,这个词典里的词是没有近义词的,独立的词,比如预付卡是很独特的,我们加进词典了,每次遇到这个词,我们就不是取TOPN 为1, 我们取topn为1.2, 这样就会实 阅读全文
posted @ 2018-11-13 16:43 yjy888 阅读(526) 评论(0) 推荐(0) 编辑
摘要: 今天在测试相似度算法的过程中,出现了一些问题,比如 ('预付卡怎么设置\n', '预付卡 设置', '预付卡怎么设置\n', '预付卡 设置', 1.029370301661967)('预付卡怎么设置\n', '预付卡 设置', '怎么使用购物卡\n', '使用 购物卡', 0.5975588878 阅读全文
posted @ 2018-11-13 16:14 yjy888 阅读(132) 评论(0) 推荐(0) 编辑