09 2017 档案

摘要:starts-with 顾名思义,匹配一个属性开始位置的关键字 contains 匹配一个属性值中包含的字符串 text() 匹配的是显示文本信息,此处也可以用来做定位用 eg //input[starts-with(@name,'name1')] 查找name属性中开始位置包含'name1'关键字 阅读全文
posted @ 2017-09-26 15:04 推杯问盏 阅读(186) 评论(0) 推荐(0)
摘要:质区别 text()是一个node test,而string()是一个函数,data()是一个函数且可以保留数据类型。此外,还有点号(.)表示当前节点。 使用要点 XML例子: <book><author>Tom John</author></book> 特殊用例 XML例子: text() 经常在 阅读全文
posted @ 2017-09-26 11:31 推杯问盏 阅读(668) 评论(0) 推荐(0)
摘要:python的os模块 os模块调用CMD命令有两种方式:os.popen(),os.system(). 都是用当前进程来调用。 os.system是无法获取返回值的。当运行结束后接着往下面执行程序。用法如:os.system("ipconfig"). os.popen带返回值的,如何获取返回值。如 阅读全文
posted @ 2017-09-25 15:35 推杯问盏 阅读(657) 评论(0) 推荐(0)
摘要:认识selenium 在爬取百度文库的过程中,我们需要使用到一个工具selenium(浏览器自动测试框架),selenium是一个用于web应用程序测试的工具,它可以测试直接运行在浏览器中,就像我们平时用浏览器上网一样,支持IE(7,8,9,10,11),firefox,safari,chrome, 阅读全文
posted @ 2017-09-23 19:59 推杯问盏 阅读(372) 评论(0) 推荐(0)
摘要:知乎内容需要登陆后才能查看,与之前案例不同,这里要向浏览器提交登录信息。 首先爬取知乎登录页面 此时出现 500 Server Error,解决方法为通过 headers={...} 更改用户代理为浏览器 在知乎登录页面打开Chrome浏览器F12,这里打钩之后新跳转的页面的信息就不会覆盖之前接受到 阅读全文
posted @ 2017-09-17 19:50 推杯问盏 阅读(353) 评论(0) 推荐(0)
摘要:Beautiful Soup库基础知识 Beautiful Soup库是解析xml和html的功能库。html、xml大都是一对一对的标签构成,所以Beautiful Soup库是解析、遍历、维护“标签树”的功能库,只要提供的是标签类型Beautiful Soup库都可以进行很好的解析。 Beaut 阅读全文
posted @ 2017-09-16 19:03 推杯问盏 阅读(303) 评论(0) 推荐(0)
摘要:requests库的7个常用方法 get方法: r = equests.get(url,params=None,**kwargs),r 是服务器返回的一个包含服务器所有资源的Response对象 url :要获取的API/网页的URL链接 params:URL中的额外参数,可以是字典、字节流格式,可 阅读全文
posted @ 2017-09-16 17:09 推杯问盏 阅读(320) 评论(0) 推荐(0)
摘要:import requests import re import time #获取html页面 def getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = "utf-8" #... 阅读全文
posted @ 2017-09-16 16:17 推杯问盏 阅读(238) 评论(0) 推荐(0)
摘要:程序结构设计: 1.获取网页内容 getHTMLText() 2.获取网络内容信息并存储到合适的数据结构中 fillUnivList() 3.利用数据结构展示并输出结果 printUnivList() 实现代码 阅读全文
posted @ 2017-09-16 16:09 推杯问盏 阅读(313) 评论(0) 推荐(0)
摘要:1、零宽断言 所谓零宽断言就是并不去真正的匹配字符串文本,而仅仅是匹配对应的位置。 正则表达式中有很多这样的断言,常见的如匹配字符串或者行的起始位置 ^ 和 /A,匹配字符串或者行的末尾 $ 和 /Z,单词边界/B等等。这些简单的就不说了,今天主要说一下界定的使用方法。 表达式结构: (?<=<(\ 阅读全文
posted @ 2017-09-14 16:09 推杯问盏 阅读(158) 评论(0) 推荐(0)
摘要:[转] [hyddd(http://www.cnblogs.com/hyddd/)] Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE。URL全称是资源描述符,我们可以这样认为:一个URL地址,它用于描述一个网络上的资源,而HTTP中的GET,P 阅读全文
posted @ 2017-09-14 09:50 推杯问盏 阅读(150) 评论(0) 推荐(0)
摘要:1、cd 用 window + R 打开 cmd 时,默认进入 C 盘目录,使用 cd + temp 命令会跳转到 temp 目录下, 若 temp 为其他盘所在文件目录, 路径不会跳转,解决方法如下: 2、type type + temp(路径名用 ‘\’) 显示文件内容 阅读全文
posted @ 2017-09-11 18:49 推杯问盏 阅读(118) 评论(0) 推荐(0)
摘要:void InsertionSort(int arr[]) { for(int i=1; i 0) { //move key to previous position arr[j] = arr[j-1]; j--; } arr[j] = key; ... 阅读全文
posted @ 2017-09-10 19:59 推杯问盏 阅读(128) 评论(0) 推荐(0)
摘要:1、类的定义 private&protected 成员不能从外部进行访问 public 成员可以从外部进行访问 例如: 如果在类体起始点无访问说明符,系统默认为私有(private) 2、成员函数的定义 通常在类的定义中,成员函数仅作说明,函数定义通常在类的说明之后进行,格式如下: 3、类成员的访问 阅读全文
posted @ 2017-09-10 14:28 推杯问盏 阅读(284) 评论(0) 推荐(0)
摘要:from numpy import exp, array, random, dot class NeuralNetwork(): def __init__(self): random.seed(1) self.synaptic_weights = 2 * random.random((3,1)) - 1 def __sigmoid(se... 阅读全文
posted @ 2017-09-10 10:11 推杯问盏 阅读(405) 评论(0) 推荐(0)
摘要:import os # 查找当前目录下所有包含关键字的文件 def findFile(path, filekw): return[os.path.join(path,x) for x in os.listdir(path) if os.path.isfile(x) and os.path.split(x)[1].find(filekw)>-1] # 获取指定目录下的次级目录 def... 阅读全文
posted @ 2017-09-10 10:00 推杯问盏 阅读(527) 评论(0) 推荐(0)
摘要:想理解Python的decorator首先要知道在Python中函数也是一个对象,所以你可以 将函数复制给变量 将函数当做参数 返回一个函数 函数在Python中和变量的用法一样也是一等公民,也就是高阶函数(High Order Function)。所有的魔法都是由此而来。 1,起源 我们想在函数l 阅读全文
posted @ 2017-09-09 17:29 推杯问盏 阅读(161) 评论(0) 推荐(0)
摘要:首先介绍:用#import导入dll和用#pragma comment导入lib还有在程序中LoadLibrary加载dll有什么区别 (1) #import导入的dll是com组建的dll,主要用来解析com组建内部结构,便与c++识别调用, (2) #pragma comment是静态加载库 ( 阅读全文
posted @ 2017-09-09 11:35 推杯问盏 阅读(558) 评论(0) 推荐(0)
摘要:静态加载: 如果你有a.dll和a.lib,两个文件都有的话可以用静态加载的方式: message函数的声明你应该知道吧,把它的声明和下面的语句写到一个头文件中 #pragma comment(lib, "a.lib") 然后你的对话框.cpp中包含这个头文件就可以使用message函数了。 动态加 阅读全文
posted @ 2017-09-09 10:13 推杯问盏 阅读(149) 评论(0) 推荐(0)