漫话数据搜索
什么是数据?
以二进制的形式进行存储,都可以认为是数据。
以生活的范围来说,数据可以分为统计数据、电商数据、搜索数据、社交数据、交通数据、影视数据、语料数据、课表数据以及等等。接下来我们聊聊这些数据会对我们产生什么样的帮助,从哪里去搜索这些数据比较可靠。
先上一张思维导图。没错,就是这么直接。
统计数据
举个栗子,各省市的人口数量、就业人数、农产品价格等等需要统计的数据,都是统计数据。全国的统计数据可以通过国家统计局和全国/国家统计年鉴进行查找,各省市的统计数据可以通过各省市的统计局和统计年鉴进行查找。全球的统计数据则可以通过世界银行公开数据或者OECD进行查找啦。P.S.国家统计局不仅可以查找数据,同时还能直接可视化数据,具体在哪里,自己去找哈哈哈。
电商数据
电子商务行业人潮涌动,尤其是淘宝上活跃的买家,为阿里巴巴贡献了不少数据,因此诞生了“热心肠”的阿里指数。阿里指数作为一个数据分析平台,可以帮助你:
- 了解市场行情
- 查看热门行业
- 分析用户群体
- 研究产业基地
再来举个栗子,打开阿里指数,输入一个关键词,比如你想了解今年连衣裙的行情怎么样,哪些裙子卖的最好,哪些卖裙子的店家生意最好,那你就输入“连衣裙”这三个字。阿里指数会显示行业大盘、属性细分、阿里排行,分别对应了前面三个问题的答案。如果你是卖家,想卖一个产品又不知道挑哪个最合适的时候,不妨去阿里指数先搜一下。
搜索数据
本文标题是“数据搜索”,这个小标题是“搜索数据”,是不是有点迷。其实很简单,“数据搜索”,是对于各种属性的数据,去相应的平台进行搜索,它是一个动态的过程。而“搜索数据”,完整的称呼应该是“人们在搜索引擎上留下的行为痕迹形成的数据”,是一个名词。
大天朝的人们使用的最多的搜索引擎是什么?当然是度娘啦!海量网民的行为数据,创造了一个叫做“百度指数”的东西。通过这个百度指数,可以帮助我们进行合理地决策。它有以下几个特点:
- 查看某一个词在某一地区的搜索热度
- 可以对多个关键词进行对比
- 比较关键词在不同地区的搜索情况
- 洞察舆情
- 对搜索某个关键词的人群进行画像,适合商家精准营销
来个栗子,最近很火的复联3,我想知道这部影片分别在黑龙江、上海、浙江、云南、台湾的搜索指数趋势,对比了一下,发现浙江>上海>黑龙江>云南>台湾,看来我大浙江人还是很喜欢看英雄片的。
又对开发者社区的用户搜索行为感到好奇,然后分别输入了“博客园、CSDN、开源中国、infoq以及segmentfault”,搜索时间段设置为半年,发现CSDN仍然是当前开发者社区行业的NO.1,但是其商业氛围真的太浓厚了。然后感慨一下2月份过年了,果然大家团聚在一起都不想编程的事情了。
社交数据
顾名思义,用户在社交时产生的数据,在这里提供俩工具——“微指数”以及“微信指数”。微指数,指的微博用户的社交行为产生的数据。微信指数,当然是指微信用户在社交时产生的行为数据。这俩工具的用法和用途其实和百度指数有着异曲同工之妙。
交通数据
出行是人们必不可少的环节。实时查看飞机动态、公交动态和火车动态成了当前人们的基本需求。
本人在等待公交车的时候,特别喜欢用“车来了”APP,先计算我去某个站台等待公交车前在路上需要花费的时间,然后公交车到达该站台需要花费的时间,两相比较,挑个合适的时间出发,减少在公交站台辛辛苦苦等公交车的“无奈感”和吃力感,毕竟我们要“善于等待”不是嘛。除了“车来了”APP,“高德地图”也是等车的一大利器,不必多说,会用的人都知道。
查看火车动态,可以看12306;查看飞机动态,可以查看携程旅游。至于怎么查看,等你有需求了,实践出真知吧。
影视数据
像什么中国票房网、爱奇艺指数、优酷指数以及艺恩指数之类的,都可以查到相关影视的数据。如果不知道哪部影片比较好看,去瞅瞅哪部影片的票房卖的最火吧。从中也可以分析最近大众喜欢什么口味的影视剧。
语料数据
图片里面的搜索语料数据的引擎名字很奇怪,不过一般来说称呼linggle就好咯。(网址是http://linggle.com/)
这个网站可以帮助大家来学习英文写作。什么叫查语料,打个比方,我在英文写作的时候,写到 discuss about the issue,问题是,discuss的后面确实是需要这个about吗?然后我在输入框里输入 discuss ?about the issue ,about前面的问号表示对about这个单词是否应该存在有疑问。点击搜索,结果告诉我们,99%的人不会在discuss the issue 的中间加个 about ,剩下那1%的人,大概没来这里查过吧。
课表数据
作为一个即将大学毕业的社会人士,想回归大学校园生活蹭个课,用超级课程表,想必是个不错的选择。