摘要:Evernote Export 一组数据的分布特征可以从那几个方面进行测度? 数据的分布特征可以从三个方面进行测度和描述,一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 怎样理解平均数在统计学中的
阅读全文
摘要:Evernote Export 数据的预处理包括哪些内容? 1.数据审核 2.数据筛选 3.数据排序 4.数据透视表 分类数据和顺序数据的整理和图示方法各有哪些? 1.分类数据整理:对于定性数据,使用频数分布进行描述,还可以进行比例、百分比、比率等级统计量描述。 分类数据的图示 条形图 帕累托图 饼
阅读全文
摘要:Evernote Export 什么是二手资料?使用二手资料需要注意些什么? 数据的间接来源,即数据是由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以利用。 资料是谁搜集的?这主要是考察数据搜集者的实力和社会信誉度。 为什么目的而搜集?为了某个集团的利益而搜集的数据是值得怀疑的。 数据怎样
阅读全文
摘要:Evernote Export 比赛题目介绍 facebook想要准确的知道用户登录的地点,从而可以为用户提供更准确的服务 为了比赛,facebook创建了一个虚拟世界地图,地图面积为100km2,其中包含了超过1000000个地点 通过给定的坐标,以及坐标准确性,判断用户登录地点 训练集和测试集是
阅读全文
摘要:Evernote Export 思考题 什么是统计学? 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学 解释描述性统计和推断统计 描述性统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法 推断统计:研究如何利用样本数据来推断总体特征的统计方法 统计数据可分为哪几种类型?不
阅读全文
摘要:Evernote Export 比赛题目介绍 TalkingData是中国最大的第三方移动数据平台,移动设备用户日常的选择和行为用户画像。目前,TalkingData正在寻求每天在中国活跃的5亿移动设备70%以上的行为数据,帮助客户更好的了解与其用户互动。 TalkingData提供了大约20万用户
阅读全文
摘要:Evernote Export 推荐系统比赛(常见比赛) 推荐系统分类 最能变现的机器学习应用 基于应用领域分类:电子商务推荐,社交好友推荐,搜索引擎推荐,信息内容推荐等 **基于设计思想:**基于协同过滤的推荐,基于内容的推荐,基于知识的推荐,混合推荐 基于使用何种数据:基于用户行为数据的推荐,基
阅读全文
摘要:Evernote Export Crowdflower搜索结果相关性 文件和数据描述 train.csv训练数据集包括: id:产品ID查询:使用的搜索词 product_description:完整的产品说明以及HTML格式标记 median_relevance:3个评分者的中位数相关性得分。该值
阅读全文