摘要:
个人将数据挖掘的流程简单表示为“ 数据 → 特征 → 模型 ”。 首先,明确问题的性质和任务(分类、回归、聚类、推荐、排序、关联分析、异常检测等); 其次,理解数据(含义、类型、值的范围),并通过描述性统计分析(describing data)和可视化分析(visualizing data)等工作对 阅读全文
该文被密码保护。 阅读全文
摘要:
随机变量 - 通俗地讲,是指随机事件的数量表现。 - 从变量取值的不同可以分为离散型随机变量和连续型随机变量。 · 离散型:变量取值只能取离散型的自然数。 · 连续型:变量可以在某个区间内取任一实数(变量的取值可以是连续的)。 · 参考链接: - 离散型随机变量与连续型随机变量的区别与特点~ - 随 阅读全文
摘要:
搜索也是有门道的。 有时候,在搜索框里面输入一句话要比输入这句话里面的关键词搜索出来的效果差;然而有时候,你还不得不搜索一句话来确保达到最佳搜索效果。什么意思呢?一步一步看下面的高级搜索语法。 先放一张高级搜索语法图: 场景一: 我现在需要找一些关于商务模式分析的PPT资料,我在搜索框里面输入“商务 阅读全文
摘要:
什么是数据? 以二进制的形式进行存储,都可以认为是数据。 以生活的范围来说,数据可以分为统计数据、电商数据、搜索数据、社交数据、交通数据、影视数据、语料数据、课表数据以及等等。接下来我们聊聊这些数据会对我们产生什么样的帮助,从哪里去搜索这些数据比较可靠。 先上一张思维导图。没错,就是这么直接。 统计 阅读全文
摘要:
垂直搜索包括了站内搜索和狭义的垂直搜索引擎两类。站内搜索大家都懂,只搜索本网站之内的结果。垂直搜索引擎指的是什么呢?举个栗子,在爱奇艺视频上搜索一个电影名称,出来的结果可能不仅仅是爱奇艺站内的,也有来自于优酷、搜狐等这类视频网站,因此这个垂直搜索引擎涵盖了站内和站外的资源。 垂直搜索的内容有很多,包 阅读全文
摘要:
最近在中国大学MOOC平台学习北大的曹健老师上的“人工智能实践——Tensorflow”课程,开始我的人工智能之旅。第一天,讲解如何搭建实验室环境,我是mac系统,所以只写mac系统上的实验室环境安装笔记。在曹健老师的课中,也有windows系统的安装教程,需要的人可以自行前往观看视频。 第一步,安 阅读全文