雕刻时光

just do it……nothing impossible
随笔 - 547, 文章 - 0, 评论 - 82, 阅读 - 86万
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

随笔分类 -  python与web基础

摘要:有个文本文件,需要替换里面的一个词,用python来完成,我是这样写的: 1 2 3 4 5 def modify_text(): with open('test.txt', "r+") as f: read_data = f.read() f.truncate() #清空文件 f.write(re 阅读全文

posted @ 2021-09-08 17:19 huhuuu 阅读(199) 评论(0) 推荐(0) 编辑

摘要:python中有 try——except 的方法捕获异常,可以获取到异常的种类以及自定义异常, 但是有时候对于debug测试来说,信息不全,比如说 触发异常的具体位置在哪: import tracebacktry: num= int('abc')except Exception: traceback 阅读全文

posted @ 2020-02-11 11:39 huhuuu 阅读(1131) 评论(0) 推荐(0) 编辑

摘要:import urllib2 from urllib import quote f = open("data.in", "r") out = file("data2.out","w+") a = 1.0 for line in f: #print line stri = quote(line) ur 阅读全文

posted @ 2016-02-16 15:10 huhuuu 阅读(2483) 评论(0) 推荐(0) 编辑

摘要:#!/usr/bin/env python# -*- coding: utf-8 -*-#导入smtplib和MIMETextimport smtplibfrom email.MIMEText import MIMETextmail_to="XXXXXXXX@qq.com"#要发给谁def send... 阅读全文

posted @ 2014-09-25 19:37 huhuuu 阅读(949) 评论(0) 推荐(0) 编辑

摘要:既然如此,何不再抓一抓网页的文字内容呢? 谷歌浏览器有个审查元素的功能,就是按树的结构查看html的组织形式,如图: 这样已经比较明显了,博客的正文内容主要在div 的class =cnblogs_post_body 的字段p中,xpath秒杀搞定的节奏。sel.xpath('//div[@... 阅读全文

posted @ 2014-05-05 16:36 huhuuu 阅读(1581) 评论(0) 推荐(0) 编辑

摘要:之前写了一篇用scrapy框架爬取自己博文的博客,后来发现对于中文的处理一直有问题- - 显示的时候[u'python\u4e0b\u722c\u67d0\u4e2a\u7f51\u9875\u7684\u56fe\u7247 - huhuuu - \u535a\u5ba2\u56ed'] 而... 阅读全文

posted @ 2014-05-05 15:14 huhuuu 阅读(4188) 评论(0) 推荐(0) 编辑

摘要:scrapy框架是个比较简单易用基于python的爬虫框架,http://scrapy-chs.readthedocs.org/zh_CN/latest/ 这个是不错的中文文档 几个比较重要的部分: items.py:用来定义需要保存的变量,其中的变量用Field来定义,有点像python的... 阅读全文

posted @ 2014-05-04 15:00 huhuuu 阅读(24333) 评论(0) 推荐(1) 编辑

摘要:Scrapy是基于python的开源爬虫框架,使用起来也比较方便。具体的官网档:http://doc.scrapy.org/en/latest/ 之前以为了解python就可以直接爬网站了,原来还要了解HTML,XML的基本协议,在了解基础以后,在了解下xpath的基础上,再使用正则表达式(p... 阅读全文

posted @ 2014-04-30 11:52 huhuuu 阅读(14814) 评论(0) 推荐(0) 编辑

摘要:My first Heading My first paragraph. 与 之间的文本描述网页 与 之间的文本是可见的页面内容 与 之间的文本被显示为标题 与 之间的文本被显示为段落第二个例子:My first Heading My second Heading My first para... 阅读全文

posted @ 2014-04-29 11:52 huhuuu 阅读(441) 评论(0) 推荐(0) 编辑

摘要:#coding=utf-8class data: def __init__(self): #构造函数 self.name='1234' def pp(self): print self.nameclass data2(data): #data2 继承 d... 阅读全文

posted @ 2014-04-25 21:04 huhuuu 阅读(290) 评论(0) 推荐(0) 编辑

摘要:#coding=utf-8import reimport urllibdef getHtml(url): #获取url对应得源码 page = urllib.urlopen(url) html = page.read() return htmldef getImg(html): #... 阅读全文

posted @ 2014-04-25 19:06 huhuuu 阅读(497) 评论(0) 推荐(0) 编辑

摘要:假如有列表:books = [ {"name":"C#", "price":23.7, "store":"amaing"}, {"name":"ASP.NET", "price":44.5, "store":"amaing"}, {"name":"C#", "price":24.7, "store":"dd& 阅读全文

posted @ 2013-12-01 10:35 huhuuu 阅读(501) 评论(0) 推荐(0) 编辑

摘要:1.self类的方法与普通的函数只有一个特别的区别——它们必须有一个额外的第一个参数名称,但是在调用这个方法的时候你不为这个参数赋值,Python会提供这个值。这个特别的变量指对象本身,按照惯例它的名称是self。你一定很奇怪Python如何给self赋值以及为何你不需要给它赋值。举一个例子会使此变得清晰。假如你有一个类称为MyClass和这个类的一个实例MyObject。当你调用这个对象的方法MyObject.method(arg1, arg2)的时候,这会由Python自动转为MyClass.method(MyObject, arg1, arg2)——这就是self的原理了。观察如下代码: 阅读全文

posted @ 2013-11-30 20:52 huhuuu 阅读(252) 评论(0) 推荐(0) 编辑

摘要:1.函数的动态重载def func(a, b = 5, c = 10): print("a is", a, "and b is", b, "and c is", c) func(3, 7)func(25, c = 24)func(c = 50, a = 100)func(50, c = 100,b=109)这个深深的冲击力我以前的语言观!动态语言果然跟静态语言不一样= =2.函数的返回值def func(a, b = 5, c = 10): print("a is", a, "and b is" 阅读全文

posted @ 2013-11-30 11:15 huhuuu 阅读(397) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示