摘要: 经常采集数据,肯定会碰到解析字符串,包括整个页面的html,或者json以及一些不标准的json格式。以前用json序列化,有时候需要实体类,有的时候没有,比较麻烦,听说可以用JsonMapper,解析为字典格式。不过没用过,习惯了用最原始的方法来解析字符串,所以这里分享几个解析的案例。也许会有点作用。 解析字符串最常用的应该是Splite和Replace了。分割,然后替换一些引号之类的。最后组合。特别是采集的时候,经常会把html页面中某一段要提取出来,可能很多人用正则表达式,可是不会啊,也不愿意去学。那只好用这些原始的方法了,时间久了,也积累一些经验或者函数。看看几个例子。 阅读全文
posted @ 2015-06-10 08:13 数据之巅 阅读(13398) 评论(29) 推荐(18) 编辑