python与web基础 - 随笔分类 - huhuuu

python 文件清理

摘要：有个文本文件，需要替换里面的一个词，用python来完成，我是这样写的： 1 2 3 4 5 def modify_text(): with open('test.txt', "r+") as f: read_data = f.read() f.truncate() #清空文件 f.write(re 阅读全文

posted @ 2021-09-08 17:19 huhuuu 阅读(199) 评论(0) 推荐(0) 编辑

python捕捉详细异常堆栈的方法

摘要：python中有 try——except 的方法捕获异常，可以获取到异常的种类以及自定义异常，但是有时候对于debug测试来说，信息不全，比如说触发异常的具体位置在哪： import tracebacktry: num= int('abc')except Exception: traceback 阅读全文

posted @ 2020-02-11 11:39 huhuuu 阅读(1131) 评论(0) 推荐(0) 编辑

python 批量请求url

摘要：import urllib2 from urllib import quote f = open("data.in", "r") out = file("data2.out","w+") a = 1.0 for line in f: #print line stri = quote(line) ur 阅读全文

posted @ 2016-02-16 15:10 huhuuu 阅读(2483) 评论(0) 推荐(0) 编辑

用python向邮箱发信息

摘要：#!/usr/bin/env python# -*- coding: utf-8 -*-#导入smtplib和MIMETextimport smtplibfrom email.MIMEText import MIMETextmail_to="XXXXXXXX@qq.com"#要发给谁def send... 阅读全文

posted @ 2014-09-25 19:37 huhuuu 阅读(949) 评论(0) 推荐(0) 编辑

使用scrapy框架爬取自己的博文（3）

摘要：既然如此，何不再抓一抓网页的文字内容呢？谷歌浏览器有个审查元素的功能，就是按树的结构查看html的组织形式，如图：这样已经比较明显了，博客的正文内容主要在div 的class =cnblogs_post_body 的字段p中，xpath秒杀搞定的节奏。sel.xpath('//div[@... 阅读全文

posted @ 2014-05-05 16:36 huhuuu 阅读(1581) 评论(0) 推荐(0) 编辑

使用scrapy框架爬取自己的博文（2）

摘要：之前写了一篇用scrapy框架爬取自己博文的博客，后来发现对于中文的处理一直有问题- - 显示的时候[u'python\u4e0b\u722c\u67d0\u4e2a\u7f51\u9875\u7684\u56fe\u7247 - huhuuu - \u535a\u5ba2\u56ed'] 而... 阅读全文

posted @ 2014-05-05 15:14 huhuuu 阅读(4188) 评论(0) 推荐(0) 编辑

使用scrapy框架爬取自己的博文

摘要：scrapy框架是个比较简单易用基于python的爬虫框架，http://scrapy-chs.readthedocs.org/zh_CN/latest/ 这个是不错的中文文档几个比较重要的部分： items.py：用来定义需要保存的变量，其中的变量用Field来定义，有点像python的... 阅读全文

posted @ 2014-05-04 15:00 huhuuu 阅读(24333) 评论(0) 推荐(1) 编辑

Scrapy下xpath基本的使用方法

摘要：Scrapy是基于python的开源爬虫框架，使用起来也比较方便。具体的官网档：http://doc.scrapy.org/en/latest/ 之前以为了解python就可以直接爬网站了，原来还要了解HTML，XML的基本协议，在了解基础以后，在了解下xpath的基础上，再使用正则表达式(p... 阅读全文

posted @ 2014-04-30 11:52 huhuuu 阅读(14814) 评论(0) 推荐(0) 编辑

html基础

摘要：My first Heading My first paragraph. 与之间的文本描述网页与之间的文本是可见的页面内容与之间的文本被显示为标题与之间的文本被显示为段落第二个例子：My first Heading My second Heading My first para... 阅读全文

posted @ 2014-04-29 11:52 huhuuu 阅读(441) 评论(0) 推荐(0) 编辑

python下的类的部分特点

摘要：#coding=utf-8class data: def __init__(self): #构造函数 self.name='1234' def pp(self): print self.nameclass data2(data): #data2 继承 d... 阅读全文

posted @ 2014-04-25 21:04 huhuuu 阅读(290) 评论(0) 推荐(0) 编辑

python下爬某个网页的图片

摘要：#coding=utf-8import reimport urllibdef getHtml(url): #获取url对应得源码 page = urllib.urlopen(url) html = page.read() return htmldef getImg(html): #... 阅读全文

posted @ 2014-04-25 19:06 huhuuu 阅读(497) 评论(0) 推荐(0) 编辑

python小练习

摘要：假如有列表：books = [ {"name":"C#", "price":23.7, "store":"amaing"}, {"name":"ASP.NET", "price":44.5, "store":"amaing"}, {"name":"C#", "price":24.7, "store":"dd& 阅读全文

posted @ 2013-12-01 10:35 huhuuu 阅读(501) 评论(0) 推荐(0) 编辑

摘要：1.self类的方法与普通的函数只有一个特别的区别——它们必须有一个额外的第一个参数名称，但是在调用这个方法的时候你不为这个参数赋值，Python会提供这个值。这个特别的变量指对象本身，按照惯例它的名称是self。你一定很奇怪Python如何给self赋值以及为何你不需要给它赋值。举一个例子会使此变得清晰。假如你有一个类称为MyClass和这个类的一个实例MyObject。当你调用这个对象的方法MyObject.method(arg1, arg2)的时候，这会由Python自动转为MyClass.method(MyObject, arg1, arg2)——这就是self的原理了。观察如下代码：阅读全文

posted @ 2013-11-30 20:52 huhuuu 阅读(252) 评论(0) 推荐(0) 编辑

python笔记

摘要：1.函数的动态重载def func(a, b = 5, c = 10): print("a is", a, "and b is", b, "and c is", c) func(3, 7)func(25, c = 24)func(c = 50, a = 100)func(50, c = 100,b=109)这个深深的冲击力我以前的语言观！动态语言果然跟静态语言不一样= =2.函数的返回值def func(a, b = 5, c = 10): print("a is", a, "and b is" 阅读全文

posted @ 2013-11-30 11:15 huhuuu 阅读(397) 评论(0) 推荐(0) 编辑

雕刻时光

公告

搜索

常用链接

积分与排名

随笔分类 (567)

随笔档案 (547)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

随笔分类 - python与web基础