06 2018 档案

摘要:之前写过《中英文维基百科语料上的Word2Vec实验》,近期有不少同学在这篇文章下留言提问,加上最近一些工作也与Word2Vec相关,于是又做了一些功课,包括重新过了一遍Word2Vec的相关资料,试了一下gensim的相关更新接口,google了一下"wikipedia word2vec" or 阅读全文
posted @ 2018-06-22 17:51 华行天下 阅读(1090) 评论(0) 推荐(0) 编辑
摘要:1.下载 JDK1.6官方未提供1.6的mac版本,需要去apple的开发者网站 JDK1.7、JDK1.8可以去Oracle官方下载 此处提供网盘下载地址: 链接: http://pan.baidu.com/s/1jHBp9VC 密码: ixwy 2.安装 JDK默认安装路径为/Library/J 阅读全文
posted @ 2018-06-20 17:34 华行天下 阅读(595) 评论(0) 推荐(0) 编辑
摘要:之前一直使用 Mac OS 自带的终端,用起来虽然有些不太方便,但总体来说还是可以接受的,是有想换个终端的想法,然后今天偶然看到一个终端利器 iTerm2,发现真的很强大,也非常的好用,按照网上配置了主题什么的,还是有些坑的,这边再记录下,以便后面查阅。 1. 安装 iTerm2 下载地址:http 阅读全文
posted @ 2018-06-10 12:30 华行天下 阅读(2256) 评论(1) 推荐(0) 编辑
摘要:Bitmap bmp = null; Mat tmp = new Mat (height, width, CvType.CV_8U, new Scalar(4)); try { //Imgproc.cvtColor(seedsImage, tmp, Imgproc.COLOR_RGB2BGRA); Imgproc.cvtColor(seedsImage, tmp, Imgproc... 阅读全文
posted @ 2018-06-08 22:08 华行天下 阅读(2813) 评论(0) 推荐(0) 编辑
摘要:传统的 hash 算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上相当于伪随机数产生算法。产生的两个签名,如果相等,说明原始内容在一定概 率 下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能差别极大。从这个意义 上来 阅读全文
posted @ 2018-06-03 22:42 华行天下 阅读(4509) 评论(0) 推荐(1) 编辑
摘要:N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-Gram来预计或者评估一个句子是否合理。另外一方面,N-Gram的另外一个作用是用来评估两个字符串之间的差异程度。这是模糊匹配中常用的一种手段。本文将从此开始,进而向读者展示N-G 阅读全文
posted @ 2018-06-03 20:02 华行天下 阅读(981) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示