[转]FlightCaster如何预测飞机准点的
FlightCaster 创立于2009 年,它所提供的服务,是在航空公司发出正式通知6 小时之前,就能够对航班晚点做出预报。FlightCaster 的预报是基于交通统计局的数据、联邦航空局航空交通管制系统指令中心的警报、FlightStats(一个发布航班运营状况信息的网站)的数据、美国气象局的天气预报等所发布的。这些数据都是公开数据,有需要的话,任何人都可以获得。 基于这些数据,FlightCaster 可以做出类似“正点概率为3%,轻微晚点(60 分钟以内)概率为14%,晚点60 分钟以上概率为83%”这样的预测。如果预报显示该航班有很大概率会晚点,还会给出相应的理由,如“目的地因暴雨天气风力较强”、“(往返飞行的)到达航班已经晚点72 分钟”等。 该公司服务的强项在于,可以对过去10 年的统计数据加上实时数据所构成的庞大数据,通过其拥有专利的人工智能算法进行分析,做出准确率高达85% ~ 90% 的航班晚点预测。 既然能够产生如此准确的预测结果,我们不禁要关心其所运用的技术和硬件架构。FlightCaster 是一家创业型公司,并没有丰厚的资金,为了控制初期投资,其庞大的数据处理都是在Amazon 的云计算平台(EC2 和S3)上搭建的Hadoop 集群中完成的。这个Hadoop 集群是Cloudera 公司提供的一项名为AMI(Amazon Machine Image)的服务,而FlightCaster 正是利用了这个集群上的机器学习功能来进行数据挖掘的。 另一方面,其前端部分是在Heroku 公司(被Salesforce.com 收购)的云计算平台上开发的,Heroku 提供了Ruby on Rails(开发框架)的PaaS(Platform as a Service)服务。顺便说一下,Heroku 的PaaS 是部署在EC2、S3 等Amazon 云平台上的。 此外,该公司还运用了大量的新技术,如将Hadoop 进行抽象化的高级工作流语言Cascading,以及用Java 编写的Lisp 方言动态语言Clojure 等,对于技术极客们来说还是相当有吸引力的。FlightCaster 上还发布了一组到达航班晚点可能性最高和最低的机场排名,这里列出来供大家参考。 |