摘要: 上一篇介绍到 利用Jsoup抓取各个电商网站的信息不过有时候会遇到价格是图片的问题这时候你只能得到一张图片了如果有个能把图片解析出来那该多爽啊去百度一搜“京东(360Buy)价格识别” 还真有猪八戒上有人还发布任务了,不过那都是老早以前的了网上有好多版本,我自己也做了一个java版的识别率 99.9%我们相信java的强大,不过怕涉及到侵权问题,源码我就不贴了 需要学习的可以留邮箱,我发给你这里我只讲思路(1)首先你的会切图 用java 下面给个小例子:这个是个切图的方法,x,y 是原来图片要切割的起始坐标, wight 和hight 是 要切割的宽和高, img 是原图的流 这是一个队Png 阅读全文
posted @ 2013-01-04 16:05 杨桃 阅读(1808) 评论(11) 推荐(0) 编辑
摘要: 有时候我们想了解 各大电商的商品信息就得用爬虫抓取出必要的商品信息就像etao 一样,一淘的那么多信息 tmall ,淘宝。像 知我药妆, 买好,米奇 等 美妆网站或者是团购网站 聚美,乐峰,天天 香舍臻品 。。。。他们不可能主动给etao,他怎么来的呢,下面给出一种方法这只是我个人猜想爬虫工具很多,我个人喜欢用Jsoup下面我把例子贴出来供有兴趣的人参考Jsoup 必须的包,数据库连接包得导入获得Document的例子:public static Document readUrlFist(String url) { Document doc = null; Con... 阅读全文
posted @ 2013-01-04 10:47 杨桃 阅读(1285) 评论(0) 推荐(0) 编辑
摘要: 现在好多网站都有图片搜索的功能现在java有个开源项目 为Lire 的,他是基于Lucene 3.3.0 的官网:http://www.semanticmetadata.net/lire/现在写下他的使用方法他有十三个Builder ,他们分别从不同的角度对图片做分析(当然你的Builder也可以只填一种)可以分别根据他们的Search方法来 查出各自角度的相似图片进行排序让后从相似度由大到小返回回来 ,首先举个例子,对某个文件夹里的图片建立索引,将他的名字保存到document里 descriptorImageIdentifier (这个在源码里可以看见)域里indexSource 是图片的 阅读全文
posted @ 2013-01-04 09:47 杨桃 阅读(1357) 评论(0) 推荐(0) 编辑