会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
七块五
博客园
首页
新随笔
联系
管理
订阅
2016年6月17日
在正文中提取有实际意义的数字
摘要: 在百度上抓取了大量的乡镇信息,但都是大段大段的文字,并无法直接用于结构化的数据分析,因此还需要在其中提取真正有用数据。这其中数字则是最为直观的数据。想要提取数字并不困难,用一个正则表达式比配一下就都出来了。但就这么一个光秃秃的数字是没有任何含义的,还需要知道这些数字要表达的是什么。以以下一段文字为例
阅读全文
posted @ 2016-06-17 14:57 七块五
阅读(839)
评论(0)
推荐(0)
编辑
公告