POI数据介绍
POI是“Point of Interest”的缩写,中文可以翻译为“兴趣点”。POI数据会包含各种信息,如前面提到的名称、别名等信息,可以将这些信息看成一个个的标签(tag),而分类是其中最重要的一个tag,在OSM中 “An OSM element should represent a single on-the-ground feature once and only once”作为一个基本规则,一般来说POI数据可以进行一级和二级分类,每个分类都有对应的行业和名称,这些分类在数据采集和应用中都是十分重要的信息,通常在OSM展示中依靠分类进行信息展示,而名称、地址、坐标在OSM展示和检索作为基础信息来使用。而兴趣是一个非常主观性非常强的词语,在特定的情况下例如用户想发一封电子邮件的时候,电话远远没有邮箱地址有趣。所以POI在不同使用场景下,对POI数据有不同需求,当一个POI数据平台提供一系列接口和数据输出的时候必须考虑不同场景下用户的需求和数据特点。
通常我们将POI的信息划分为基础信息和详情信息,随着社会的发展,LBS、O2O服务相继出现,用户的需求也在不断演化:
以前我们在网上搜索全聚德在北京有几个店,那个离自己最近,如何换乘地铁或公交,这时候地图是用来寻址规划路线的;
现在我们直接搜索某个区域有什么店铺,那个评分更高服务更好,招牌菜是否符合口味,甚至直接团购下单,现在地图是为了生活服务的;
这时候我们发现POI包含的信息演化包含了三个部分:
1. 基础信息:名称、地址、坐标、别名、电话、分类等
2. 详情信息:评分、菜单、价格、评论、团购信息、营业时间、图片等垂直行业信息。
3. 挖掘信息:营业状态、可信度等挖掘产生的数据
有了第1部分我们可以提供基础的检索服务,可以根据用户输入的名称或者当前位置检索到需要的特定类型的POI信息,完成用户的搜索需求;而第2部分可以优化一定场景下的用户体验或者提供高附加值的服务;第3部分数据优化用户体验,避免用户流失。
当然,在地图上POI可能不是一个点,而地图上点也未必是一个POI,如一个步行街、一片海滩又或者两条铁路的交叉口。通常人们会将步行街或者海滩这些区域简化为一个点也就是POI,而铁路的交叉口在地图上可能呈现一个点,可实际上并非一个POI或者有价值的POI,因此,地图上的点和POI实际并非一个概念,虽然我们通常将POI映射为一个点。
地图数据的最终愿景是复刻这个世界,而POI则是这个愿景的基石。