上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 57 下一页

2013年8月15日

网络爬虫速成指南(一)网页下载

摘要: 注解:此处仅仅是介绍一些类库及常规使用,如果要详细了解Http协议推荐看下《Http权威指南》。net 方向 主要是用到HttpWebRequest下载内容:JAVA方向:主要是用到HttpClient下载内容示例代码:相关类库(httpclient-4.1.2 httpcore-4.1.4)示例代... 阅读全文

posted @ 2013-08-15 10:25 雨渐渐 阅读(643) 评论(0) 推荐(0) 编辑

2013年8月14日

Python 操作Mysql

摘要: python 插入 汉字:# -*- coding: utf8 -*-import MySQLdbfrom datetime import datetry: con = MySQLdb.Connect(host='localhost', user='root', passwd='wm87661... 阅读全文

posted @ 2013-08-14 16:42 雨渐渐 阅读(190) 评论(0) 推荐(0) 编辑

2013年8月13日

网络爬虫速成指南 (三) 编码识别

摘要: 问题的提出:采用上节的方法偶尔会下载到的HTML乱码,原因是上节的代码中进行了简易的编码识别,比如根据头信息,根据meta中的charset:。即使这样也会遇到下载到乱码的情况,原因是这两者提供的charset都可能不准确。解决方案:1 手动指定编码2 自动识别编码如果只采一个网站,自己指定下编码就... 阅读全文

posted @ 2013-08-13 14:35 雨渐渐 阅读(714) 评论(0) 推荐(0) 编辑

2013年8月12日

nutch-1.7-二次开发-Content中增加编码

摘要: 1 识别nutch-1.7的编码,完成以前1.2是在 org.apache.nutch.parse.html.HtmlParser EncodingDetector detector = new EncodingDetector(conf); detector.autoDetectClues(content, true); detector.addClue(sniffCharacterEncoding(contentInOctets), "sniffed"); String enco... 阅读全文

posted @ 2013-08-12 15:39 雨渐渐 阅读(785) 评论(0) 推荐(0) 编辑

2013年8月9日

matplotlib.pyplot 绘图详解 matplotlib 安装

摘要: apt-get install python-matplotlib转载自:http://www.cnblogs.com/qianlifeng/archive/2012/02/13/2350086.htmlBasic:import matplotlib.pyplot as pyplotpyplot.b... 阅读全文

posted @ 2013-08-09 14:10 雨渐渐 阅读(1808) 评论(0) 推荐(0) 编辑

2013年8月8日

Git 学习

摘要: http://jiangli.easymorse.com/?cat=36 阅读全文

posted @ 2013-08-08 11:21 雨渐渐 阅读(146) 评论(0) 推荐(0) 编辑

2013年8月7日

pycharm console 控制台乱码的解决

摘要: 阅读全文

posted @ 2013-08-07 11:27 雨渐渐 阅读(5480) 评论(0) 推荐(1) 编辑

2013年8月6日

概率质量函数:怀孕周期的PMF

摘要: __author__ = 'dell'import surveyimport Pmfimport matplotlib.pyplot as pyplottable = survey.Pregnancies()table.ReadRecords()print "Number of pregnancie... 阅读全文

posted @ 2013-08-06 17:36 雨渐渐 阅读(463) 评论(0) 推荐(0) 编辑

Python 正则表达式

摘要: http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 阅读全文

posted @ 2013-08-06 15:36 雨渐渐 阅读(127) 评论(0) 推荐(0) 编辑

TF-IDF

摘要: 参考源:http://www.ruanyifeng.com/blog/2013/03/tf-idf.html 写的很明了package com.data.text.tfidf;import java.io.BufferedReader;import java.io.File;import java.... 阅读全文

posted @ 2013-08-06 15:15 雨渐渐 阅读(370) 评论(0) 推荐(0) 编辑

上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 57 下一页

导航