09 2017 档案
摘要:starts-with 顾名思义,匹配一个属性开始位置的关键字 contains 匹配一个属性值中包含的字符串 text() 匹配的是显示文本信息,此处也可以用来做定位用 eg //input[starts-with(@name,'name1')] 查找name属性中开始位置包含'name1'关键字
阅读全文
摘要:质区别 text()是一个node test,而string()是一个函数,data()是一个函数且可以保留数据类型。此外,还有点号(.)表示当前节点。 使用要点 XML例子: <book><author>Tom John</author></book> 特殊用例 XML例子: text() 经常在
阅读全文
摘要:python的os模块 os模块调用CMD命令有两种方式:os.popen(),os.system(). 都是用当前进程来调用。 os.system是无法获取返回值的。当运行结束后接着往下面执行程序。用法如:os.system("ipconfig"). os.popen带返回值的,如何获取返回值。如
阅读全文
摘要:认识selenium 在爬取百度文库的过程中,我们需要使用到一个工具selenium(浏览器自动测试框架),selenium是一个用于web应用程序测试的工具,它可以测试直接运行在浏览器中,就像我们平时用浏览器上网一样,支持IE(7,8,9,10,11),firefox,safari,chrome,
阅读全文
摘要:知乎内容需要登陆后才能查看,与之前案例不同,这里要向浏览器提交登录信息。 首先爬取知乎登录页面 此时出现 500 Server Error,解决方法为通过 headers={...} 更改用户代理为浏览器 在知乎登录页面打开Chrome浏览器F12,这里打钩之后新跳转的页面的信息就不会覆盖之前接受到
阅读全文
摘要:Beautiful Soup库基础知识 Beautiful Soup库是解析xml和html的功能库。html、xml大都是一对一对的标签构成,所以Beautiful Soup库是解析、遍历、维护“标签树”的功能库,只要提供的是标签类型Beautiful Soup库都可以进行很好的解析。 Beaut
阅读全文
摘要:requests库的7个常用方法 get方法: r = equests.get(url,params=None,**kwargs),r 是服务器返回的一个包含服务器所有资源的Response对象 url :要获取的API/网页的URL链接 params:URL中的额外参数,可以是字典、字节流格式,可
阅读全文
摘要:import requests import re import time #获取html页面 def getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = "utf-8" #...
阅读全文
摘要:程序结构设计: 1.获取网页内容 getHTMLText() 2.获取网络内容信息并存储到合适的数据结构中 fillUnivList() 3.利用数据结构展示并输出结果 printUnivList() 实现代码
阅读全文
摘要:1、零宽断言 所谓零宽断言就是并不去真正的匹配字符串文本,而仅仅是匹配对应的位置。 正则表达式中有很多这样的断言,常见的如匹配字符串或者行的起始位置 ^ 和 /A,匹配字符串或者行的末尾 $ 和 /Z,单词边界/B等等。这些简单的就不说了,今天主要说一下界定的使用方法。 表达式结构: (?<=<(\
阅读全文
摘要:[转] [hyddd(http://www.cnblogs.com/hyddd/)] Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE。URL全称是资源描述符,我们可以这样认为:一个URL地址,它用于描述一个网络上的资源,而HTTP中的GET,P
阅读全文
摘要:1、cd 用 window + R 打开 cmd 时,默认进入 C 盘目录,使用 cd + temp 命令会跳转到 temp 目录下, 若 temp 为其他盘所在文件目录, 路径不会跳转,解决方法如下: 2、type type + temp(路径名用 ‘\’) 显示文件内容
阅读全文
摘要:void InsertionSort(int arr[]) { for(int i=1; i 0) { //move key to previous position arr[j] = arr[j-1]; j--; } arr[j] = key; ...
阅读全文
摘要:1、类的定义 private&protected 成员不能从外部进行访问 public 成员可以从外部进行访问 例如: 如果在类体起始点无访问说明符,系统默认为私有(private) 2、成员函数的定义 通常在类的定义中,成员函数仅作说明,函数定义通常在类的说明之后进行,格式如下: 3、类成员的访问
阅读全文
摘要:from numpy import exp, array, random, dot class NeuralNetwork(): def __init__(self): random.seed(1) self.synaptic_weights = 2 * random.random((3,1)) - 1 def __sigmoid(se...
阅读全文
摘要:import os # 查找当前目录下所有包含关键字的文件 def findFile(path, filekw): return[os.path.join(path,x) for x in os.listdir(path) if os.path.isfile(x) and os.path.split(x)[1].find(filekw)>-1] # 获取指定目录下的次级目录 def...
阅读全文
摘要:想理解Python的decorator首先要知道在Python中函数也是一个对象,所以你可以 将函数复制给变量 将函数当做参数 返回一个函数 函数在Python中和变量的用法一样也是一等公民,也就是高阶函数(High Order Function)。所有的魔法都是由此而来。 1,起源 我们想在函数l
阅读全文
摘要:首先介绍:用#import导入dll和用#pragma comment导入lib还有在程序中LoadLibrary加载dll有什么区别 (1) #import导入的dll是com组建的dll,主要用来解析com组建内部结构,便与c++识别调用, (2) #pragma comment是静态加载库 (
阅读全文
摘要:静态加载: 如果你有a.dll和a.lib,两个文件都有的话可以用静态加载的方式: message函数的声明你应该知道吧,把它的声明和下面的语句写到一个头文件中 #pragma comment(lib, "a.lib") 然后你的对话框.cpp中包含这个头文件就可以使用message函数了。 动态加
阅读全文
浙公网安备 33010602011771号