摘要: 用户标签中候选标签的构建 摘要: 本文介绍了在用户标签构建过程中,如何提取候选标签。从TFIDF模型原理出发,引申到基于该模型在用户标签提取场景中的应用。并以覆盖率为基准,分别对基于TFIDF模型、贪心法和贪婪法三种模型的候选标签提取方法进行对比评估。 1 研究意义 近年来,社交网络作为新型的互联网 阅读全文
posted @ 2017-12-22 14:40 DianeSoHungry 阅读(596) 评论(0) 推荐(0) 编辑
摘要: 前言: 这篇文章主要对两篇论文进行综述,一篇是美国一些知名的数据管理领域的专家学者从专业的研究角度出发联合发布的《大数据白皮书》,另一篇是孟晓峰和慈祥的《大数据管理:概念、技术与挑战》[1]。前者介绍了大数据的产生、分析了大数据的处理流程,并提出了大数据所面临的若干挑战,而后者介绍了大数据的基本概念 阅读全文
posted @ 2017-12-22 09:07 DianeSoHungry 阅读(10870) 评论(0) 推荐(0) 编辑
摘要: 查找最晚入职员工的所有信息 CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) 阅读全文
posted @ 2017-12-10 10:26 DianeSoHungry 阅读(453) 评论(0) 推荐(0) 编辑
摘要: 1. Two Sum Given an array of integers, return indices of the two numbers such that they add up to a specific target. You may assume that each input wo 阅读全文
posted @ 2017-12-05 02:16 DianeSoHungry 阅读(508) 评论(0) 推荐(0) 编辑
摘要: NONE 阅读全文
posted @ 2017-12-04 15:48 DianeSoHungry 阅读(244) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2017-12-04 00:24 DianeSoHungry 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 1. Configure the director 2. 阅读全文
posted @ 2017-11-29 17:41 DianeSoHungry 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 1 python 1.1 报错:'charmap' codec can't decode byte 0x8f in position 33: character maps to <undefined> 源代码: 解决:打开文件的时候,没有指定文件编码类型,源文件的类型是utf-8,open()里加上 阅读全文
posted @ 2017-11-23 17:57 DianeSoHungry 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 运行Hadoop程序时,有时候会报以下错误: org.apache.hadoop.dfs.SafeModeException: Cannot delete /user/hadoop/input. Name node is in safe mode 这个错误应该还满常见的吧(至少我运行的时候是这样的) 阅读全文
posted @ 2017-11-23 14:40 DianeSoHungry 阅读(585) 评论(0) 推荐(0) 编辑
摘要: 用ggplot2的geom_density_2d时,总是不能填充图案,并报错: Warning message: In validDetails.polygon(x) : 强制改变过程中产生了NA 解决方案: 运行脚本:options(stringsAsFactors = TRUE) 药到病除! 阅读全文
posted @ 2017-11-06 21:15 DianeSoHungry 阅读(7649) 评论(0) 推荐(0) 编辑