2011年12月26日
摘要: 又到岁末,大家都忙着捞年底最后一桶金,我也不例外,忙着采集数据,不过有时候需要付出一点点时间而已。在本案例中,我遇到了一个纯数字的电话号码变成了图片需要采集过来,在原网页上以<img src="一个JSP文件地址加一串密码" />的形式展现给我们,在采集的时候,有人建议我绕过去,直接采图片算了,不过本着对品质的追求,还是觉得应该做到采集的同时转化为文本。我的思路是这样的,先处理保存0-9及“-”的黑白图片到本地磁盘,并分别取名为0.gif,1.gif....9.gif,-.gif,之后采集图片流到内存中,处理成黑白图片后,按长度等分切割,并与本地图片循环比对。这 阅读全文
posted @ 2011-12-26 15:45 maomaom 阅读(557) 评论(0) 推荐(1) 编辑
  2011年7月17日
摘要: 形如"ed.txt*2343rdgrgs3*,fgf.rar*sdf435hf*http://www.818u.com,http://www.k518.com",需要使用正则表达式删除两段*号之间(包含*)的字符,请高手指导public class MainDemo{ public static void main(String []args) { String str = "ed.txt*2343rdgrgs3*,fgf.rar*sdf435hf*"; str = str.replaceAll("\\*.*?\\*","& 阅读全文
posted @ 2011-07-17 21:44 maomaom 阅读(113) 评论(0) 推荐(0) 编辑

免费发布信息免费发布供求信息免费发布分类信息