摘要: XPath 简介XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。在学习之前应该具备的知识:在您继续学习之前,应该对下面的知识有基本的了解:HTML / XHTMLXML / XML 命名空间如果您希望首先学习这些项目,请在我们的首页访问这些教程。什么是 XPath?XPath 使用路径表达式在 XML 文档中进行导航XPath 包含一个标准函数库XPath 是 XSLT 中的主要元素XPath 是一个 W3C 标准XPath 路径表达式XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑 阅读全文
posted @ 2013-05-06 21:17 java程序员填空 阅读(256) 评论(0) 推荐(0) 编辑
摘要: import randomrandom.random(): 产生[0,1)之间的随机数random.uniform(a,b):产生[a,b]之间的随机数random.randint(a,b):产生[a,b]之间的整数random.randrange(start,stop[,step]):在[start,stop]范围内,按指定的基数递增,获取一个随机数。random.choice(sequence):从一个指定的序列中,随机获取一个元素。random.shuffle(x[,random]):用于将一个列表中的元素打乱,然后返回打乱的结果,原列表不变。random.sample(sequence 阅读全文
posted @ 2013-05-06 21:16 java程序员填空 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 在python编程的过程中,编码和解码是经常遇见的问题。常见的编码有unicode,gb2312,gbk,utf-8等等。在编码和解码的过程过,使用最频繁的函数就是decode()和encode。其中decode()函数,表示把字符串从原有编码,解码成unicode中间编码。 encode()函数,表示把字符串从unicode中间编码,转换成目标编码。举例:lines = open(input_file_name, 'r').readlines() for line in lines: line = line.strip() line = line.decode('gb 阅读全文
posted @ 2013-05-06 21:14 java程序员填空 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 在使用BeautifulSoup解析HTML文件的过程中,经常使用到类似如下的语句:soup = BeautifulSoup(html) for string in soup.strings: string = string.strip()注意,上述代码中,没有对string的编码进行任何的设置,所以string的默认编码为ascii。如果不注意,这种默认的编码方式,会带来很大的麻烦。即便你使用:string = string.decode('ascii').encode('utf-8')也不能转换string的编码。所以最好的方式如下所示:soup = Bea 阅读全文
posted @ 2013-05-06 21:11 java程序员填空 阅读(214) 评论(0) 推荐(0) 编辑
摘要: HTML 中的常用字符实体是不间断空格(;)。 编码为160,而普通的空格编码为32。在处理HTML文件的时候,最好直接将 直接替换为普通空格,以免在后续的处理中,带来不必要的麻烦。html = html.replace(' ', ' ') 阅读全文
posted @ 2013-05-06 21:09 java程序员填空 阅读(704) 评论(1) 推荐(0) 编辑
摘要: 在使用libsvm的过程中,会用到gnuplot,具体安装过程如下所示。1.下载gnuplot(版本4.6.3)2.解压文件 tar zxvf gnuplot-4.6.3.tar.gz3.配置安装路径 cd gnuplot-4.6.3 ./configure --prefix=/public/software/gnuplot4.编译 make5.安装 make install6.启用环境 source /etc/profile.d/gnuplot.sh7. 修改libsvm/tools/easy.py中,gnuplot的路径:修改:gnuplot_exe = "/usr... 阅读全文
posted @ 2013-05-06 21:01 java程序员填空 阅读(424) 评论(0) 推荐(0) 编辑
摘要: 1常用参数svm-train training_set_file model_filesvm-predict test_file model_file output_file自动脚本:pythoneasy.py train_data test_data自动选择最优参数,自动进行归一化。对训练集合和测试结合,使用同一个归一化参数。-c:参数-g:参数-v:交叉验证数-s svm_type : set type of SVM (default 0)0 -- C-SVC1 -- nu-SVC2 -- one-class SVM3 -- epsilon-SVR4 -- nu-SVR-t kernel_ 阅读全文
posted @ 2013-05-06 20:56 java程序员填空 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 首先 最常用的 hide show $(function () { $('#spinfo').click(function () { if ($(this).text() == '隐藏') { $('#divcontent').hide(2000, function () { $('#spinfo').text('显示'); }); ... 阅读全文
posted @ 2013-05-06 15:35 java程序员填空 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 前言昨晚刚想明白kmp算法,今天当然想找到题目练手,感觉用上kmp反而麻烦了,但是也算对学过的知识进行巩固吧题目题目描述: 给定一个短字符串(不含空格),再给定若干字符串,在这些字符串中删除所含有的短字符串。 输入: 输入只有1组数据。 输入一个短字符串(不含空格),再输入若干字符串直到文件结束为止。 输出: 删除输入的短字符串(不区分大小写)并去掉空格,输出。 样例输入: in #include int main() { printf(" Hi "); } 样例输出: #clude tma() { prtf("Hi"); } 提示: 注:将字符串中的I 阅读全文
posted @ 2013-05-06 10:11 java程序员填空 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 需求例如图示这种http请求,我现在有两种需求:呈现图片下载图片例如这个url,nginx实现了浏览器对这个图片的呈现,实现下载功能就不能不提Content-Disposition的作用了header中的Content-Dispositioncontent-disposition是MIME协议的扩展,MIME协议指示MIME用户如何显示附加文件。当Internet Explorer接到头时,它会激活文件下载对话框,它的文件名框自动填充了头中指定的文件名。服务器向客户端浏览器发送文件时,如果是浏览器支持的文件类型,一般会默认使用浏览器打开,比如txt,png等,会直接在浏览器中显示,如果需要提示 阅读全文
posted @ 2013-05-06 03:58 java程序员填空 阅读(1269) 评论(0) 推荐(0) 编辑