eeshaxia

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年6月23日

摘要: 2017年6月12在 CSDN 上看到兴业数金举办的金融数据人工智能比赛,由于之前面试这家公司,印象很深 (主要因为在家旁边)所以拉上同事就报名了,虽然他最后没去,但是还是很幸运的获得了三等奖,据说有5000大洋。 由于智商逐年下降,所以赶快写下来整理下。 题目主要是NLP 分类 + 情感判别。 分 阅读全文
posted @ 2017-06-23 17:14 eeshaxia 阅读(132) 评论(0) 推荐(0) 编辑

2017年4月28日

摘要: 用在容错率低的场合下 Step 1m位的位数组0 0 0 0 0 0 0 0 0 0 0 0 n个元素集合 S = {x1, x2, ..., xn}使用独立k个哈希函数将元素映射到 {1,..., m}的范围中 如何判断一个新元素y属于这个集合S?对y使用k次哈希函数,如果所有 hi(y)位置都为 阅读全文
posted @ 2017-04-28 12:17 eeshaxia 阅读(134) 评论(0) 推荐(0) 编辑

2017年4月25日

摘要: 随便想的,如果不对望指导下~ 有个概率论问题 假设我们有红白球,其中有些球是小明的,两个颜色小明都有,小明有K个球。 其中我们觉得红球有N个 我们只取红球n个,n个里面有m个是小明的,求小明有几个红球? 小红的版本: 我们从N中取n个,取得比例是 n/N 有m个是小明的,反推小明应该有的球是 m / 阅读全文
posted @ 2017-04-25 16:59 eeshaxia 阅读(256) 评论(0) 推荐(0) 编辑

2017年4月13日

摘要: 介于我百度的时候发现文档比较少 就写一下防止忘记SingleColumnValueFilter('', '', , '', , ) filterStr = "SingleColumnValueFilter('entry', 'num', =, 'substring:25', true, false)";note: comparator需要加binary, 否则可能会抛错误, 我也想想是为什么row... 阅读全文
posted @ 2017-04-13 12:09 eeshaxia 阅读(820) 评论(0) 推荐(0) 编辑

2017年4月12日

摘要: 通过读源码 判定过程如下 1. 分词, 得到 w1, w2, w3, ....., wn 2. 贝叶斯判定 构建 neg, pos数组A、B 数组 = log(属于该数组的词 - 所有词) + log(分词w1~wn在该数组[neg、pos]的频次) pos | neg 概率 = exp(数组[ne 阅读全文
posted @ 2017-04-12 15:32 eeshaxia 阅读(366) 评论(1) 推荐(1) 编辑

2017年4月7日

摘要: Genism word2vec 研读 neaural networks in https://code.google.com/p/word2vec/ 初始化中的参数作用def __init__( self, sentences=None, size=100, alpha=0.025, window= 阅读全文
posted @ 2017-04-07 20:34 eeshaxia 阅读(498) 评论(0) 推荐(0) 编辑

摘要: #coding=utf-8 import sysreload(sys)sys.setdefaultencoding('utf-8') import xlrdimport jiebaimport codecsimport csvimport numpy as npfrom wordcloud impo 阅读全文
posted @ 2017-04-07 13:58 eeshaxia 阅读(597) 评论(0) 推荐(0) 编辑