Hiroki

大部分笔记已经转移到 https://github.com/hschen0712/machine_learning_notes ,QQ:357033150, 欢迎交流

2015年12月11日

任务五 通用类问题相关度计算实现

摘要: 任务五 通用类问题相关度计算实现 标签(空格分隔): 一找 任务描述 在百度答案、经验、知道、百科中选择最相关内容 目前优先百度答案,但某些query使用百度答案并非为最相关内容(二胎政策) 实现方案 1.用查询词和标题取交集(都放到一个HashSet里去重过),除以标题和... 阅读全文

posted @ 2015-12-11 14:34 Hiroki 阅读(236) 评论(0) 推荐(0) 编辑

任务四 娱乐相关节目和娱乐人物关系代码整理

摘要: 任务四 娱乐相关节目和娱乐人物关系代码整理 标签(空格分隔): 一找 任务描述 分别对娱乐相关节目和娱乐人物关系代码进行整理: 1、娱乐相关节目代码提交到yz dolphin serv crawler模块com.yeezhao.dolphin.crawler.entertainme... 阅读全文

posted @ 2015-12-11 14:09 Hiroki 阅读(213) 评论(0) 推荐(0) 编辑

任务三 非人物分析判断

摘要: 任务三 非人物分析判断标签(空格分隔): 一找 任务描述 目前非人物以人工标注的方式处理希望修改为:训练人物类数据,判断非人物情况。数据库已经存储人物类的数据有:1.基本属性2.摘要3.目录结构4.标签5.人物关系个人的补充:做这个任务主要是为了优化NER(命名实体识别)的词库,如果不进行优化,... 阅读全文

posted @ 2015-12-11 11:58 Hiroki 阅读(171) 评论(0) 推荐(0) 编辑

任务二 人物类与娱乐类关联优化分析

摘要: 任务二 人物类与娱乐类关联优化分析 标签(空格分隔): 一找 任务描述 根据人物ID,娱乐ID,关联两类在界面显示。 具体方案为: 1.根据娱乐类节目的相关人员:导演、演员、编剧的人物名字(t_movie_douban表) 在人物类(t_people_baike_info) 中文名、... 阅读全文

posted @ 2015-12-11 11:39 Hiroki 阅读(192) 评论(0) 推荐(0) 编辑

任务一 相关节目识别

摘要: 任务一 相关节目识别 标签(空格分隔): 一找 任务描述 一、同一系列电影识别 1、根据数据表t_movie_douban,参考电影名、别名、导演、演员等各个字段的相似性来判断电影之间是否是同一系列。 2、识别出系列序号、系列名,比如:“速度与激情3:东京漂移”。 二、重名电影识别... 阅读全文

posted @ 2015-12-11 11:23 Hiroki 阅读(297) 评论(0) 推荐(0) 编辑

导航