09 2012 档案

摘要:正则表达式中“\d”表示[0-9]的数字,“\d+”表示由[0-9]的数字组成的数字,“\w”表示[A-Z0-9],“\w+”表示由数字、26个英文字母或者下划线组成的字符串,“\d+.+\d+”表示小数"^\d+$" //非负整数(正整数 + 0)"^\[0-9\]*\[1-9\]\[0-9\]*$" //正整数"^((-\d+)\|(0+))$" //非正整数(负整数 + 0)"^-\[0-9\]*\[1-9\]\[0-9\]*$" //负整数"^-?\d+$" //整数"^\d+ 阅读全文
posted @ 2012-09-19 12:43 月井石 阅读(316) 评论(0) 推荐(0) 编辑
摘要:在写Android程序时,有时需要解析HTML页面,特别是那类通过爬网站抓取数据的应用,比如:天气预报等应用。如果是桌面应用可以使用htmlparser这个强大的工具,但是在Android平台上使用会出现错误;另一种办法是使用正则表达式来抽取数据;再有一个办法是纯字符串查找定位来实现。文本将要介绍的是使用Jsoup这个开源的解析器来实现。Jsoup既可以通过一个url网址,也可以通过存储html脚本的文件或者是存储html脚本的字符串作为数据源,然后通过DOM、CSS选择器来查找、抽取数据。示例://url网址作为输入源Document doc = Jsoup.connect("ht 阅读全文
posted @ 2012-09-18 16:20 月井石 阅读(3595) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示