06 2014 档案

机器学习入门阶段程序员易犯的5个错误
摘要:机器学习入门阶段程序员易犯的5个错误http://f.dataguru.cn/forum.php?mod=viewthread&tid=298490&fromuid=937421.将机器学习看得高不可攀机器学习不过是另一堆技术的集合,你可以用它来解决复杂问题。这是一个飞速发展的领域,因此,机器学习的... 阅读全文

posted @ 2014-06-22 21:56 雨渐渐 阅读(248) 评论(0) 推荐(0) 编辑

asp.net viewstate的模拟登陆
摘要:其实 VIEWSTATE 不用太在意,倒是 JTCookieID 需要注意,这个才应该是服务器上用来维护 Session 的那个 Cookie。所以,你用 httpclient 的时候,不能上来就直接发到“POST /PersonLogin.aspx”上,因为那样的话,服务器上还没有建立一个有效的 ... 阅读全文

posted @ 2014-06-19 14:48 雨渐渐 阅读(1772) 评论(0) 推荐(0) 编辑

数据采集服务提供商,ip提供商 里面有些不错的基础数据
摘要:http://user.qzone.qq.com/1649677458这家公司的爬虫应该挺牛的!@#!#!~#¥¥¥@@http://www.site-digger.com/ 阅读全文

posted @ 2014-06-19 11:17 雨渐渐 阅读(127) 评论(0) 推荐(0) 编辑

百度预测 及 maven pom搜索地址
摘要:http://trends.baidu.com/ http://mvnrepository.com/artifact/net.sourceforge.htmlcleaner/htmlcleaner/2.8 阅读全文

posted @ 2014-06-18 14:30 雨渐渐 阅读(208) 评论(0) 推荐(0) 编辑

simhash--文本排重
摘要:转载自 https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/06.12.mdhttp://grunt1223.iteye.com/blog/964564simhash来历如果某一天,面试官... 阅读全文

posted @ 2014-06-11 10:08 雨渐渐 阅读(831) 评论(0) 推荐(0) 编辑

dddddd
该文被密码保护。

posted @ 2014-06-06 22:31 雨渐渐 阅读(1) 评论(0) 推荐(0) 编辑

python 处理cookie简单很多啊 httpclient版本是4.3.3
摘要:模拟登录流程:1 请求host_url2 从host_url中解析出 隐藏表单 的值 添加到POST_DATA中3 添加账户,密码到POST_DATA中4 编码后,发送POST请求 要点1:java下,HttpClient必须是单例模式 要点2:post的url可能跟登录界面的url不同。post_... 阅读全文

posted @ 2014-06-05 18:38 雨渐渐 阅读(1693) 评论(0) 推荐(0) 编辑

导航