摘要: 在百度上抓取了大量的乡镇信息,但都是大段大段的文字,并无法直接用于结构化的数据分析,因此还需要在其中提取真正有用数据。这其中数字则是最为直观的数据。想要提取数字并不困难,用一个正则表达式比配一下就都出来了。但就这么一个光秃秃的数字是没有任何含义的,还需要知道这些数字要表达的是什么。以以下一段文字为例 阅读全文
posted @ 2016-06-17 14:57 七块五 阅读(835) 评论(0) 推荐(0) 编辑