vivianC

2013年5月23日

摘要： http://www.rafekettler.com/magicmethods.htmlA Guide to Python's Magic Methods主要包括一些 attributeaccess，reflection， context manager，pickling等http://www.cnblogs.com/Jerryshome/archive/2012/03/26/2417624.html 阅读全文

posted @ 2013-05-23 19:17 vivianC 阅读(186) 评论(0) 推荐(0) 编辑

window install python easy_install

摘要： 1. install python 2.X, eg 2.72. edit environment variable , add python path into PATH (better as adminstrator)3. runez_setup.py (because it is windows system)4. just typeeasy_install in cmd windows5. add easy_installpath into PATH6. restart computerhttp://peak.telecommunity.com/DevCenter/EasyInstall 阅读全文

posted @ 2013-05-23 19:02 vivianC 阅读(243) 评论(0) 推荐(0) 编辑

Python 用HTMLParser解析HTML文件 - 转

摘要：转自：http://andylin02.iteye.com/blog/908170HTMLParser是Python自带的模块，使用简单，能够很容易的实现HTML文件的分析。本文主要简单讲一下HTMLParser的用法.使用时需要定义一个从类HTMLParser继承的类，重定义函数：handle_starttag( tag, attrs)handle_startendtag( tag, attrs)handle_endtag( tag)来实现自己需要的功能。tag是的html标签，attrs是 (属性，值)元组(tuple)的列表(list).HTMLParser自动将tag和attrs都转为阅读全文

posted @ 2013-05-23 16:58 vivianC 阅读(241) 评论(0) 推荐(0) 编辑

python对xpath的支持 - 转

摘要：转 http://padden.blog.51cto.com/2514314/464141介绍python的Xpath的python开元项目:1.libxml2-python-2.6.4.tar.gz安装：下载对应python版本的软件包à解压àpython setup.py install例一：import libxml2def text() :doc = libxml2.parseFile('/tmp/books.xml')for book in doc.xpathEval('/bookstore/book') : print book. 阅读全文

posted @ 2013-05-23 14:41 vivianC 阅读(796) 评论(0) 推荐(0) 编辑

python 各种解析xml包使用方法总结 - 转

摘要： python 各种解析xml包使用方法总结转http://outofmemory.cn/code-snippet/914/python-kinds-jiexi-xml-bao-usage-method-summary使用python开发时，由于python的开源生态圈非常的给力，对于实现同一个功能，往往在这方面的类库非常多，而开发者也同样面临着如何选择最佳的类库作为辅助开发的工具。本文将记录本人在使用python处理xml格式数据时测试过的类库，有些类库由于先天不足，无法支持一些特性，涉及的类库或模块有xml(python自带)、libxml2 、lxml 、xpath 。附注：本文处理x 阅读全文

posted @ 2013-05-23 14:34 vivianC 阅读(1160) 评论(0) 推荐(0) 编辑

BeautifulSoup - Python中第三方的用于解析HTML的库：BeautifulSoup - 转

摘要：转http://www.crifan.com/python_third_party_lib_html_parser_beautifulsoup/背景在Python去写爬虫，网页解析等过程中，比如：如何用Python，C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站常常需要涉及到HTML等网页的解析。当然，对于简单的HTML中内容的提取，Python内置的正则表达式Re模块，就足够用了，但是对于复杂的HTML的处理，尤其是一些非法的，有bug的html代码的处理，那么最好还是用专门的HTML的解析的库。Python中的，专门用于HTML解析的库，比较好用的，就是BeautifulSoup 阅读全文

posted @ 2013-05-23 14:21 vivianC 阅读(1715) 评论(0) 推荐(1) 编辑

Python开发者应该知道的7个开发库 - 转

摘要：转：http://developer.51cto.com/art/201211/364737.htmAD：2013大数据全球技术峰会课程PPT下载在我多年的 Python 编程经历以及在 Github 上的探索漫游过程中，我发掘到一些很不错的 Python 开发包，这些包大大简化了开发过程，而本文就是为了向大家推荐这些开发包。请注意我特别排除了像SQLAlchemy和Flask这样的库，因为其实在太优秀了，无需多提。下面开始：1.PyQuery(with lxml)安装方法 pip install pyqueryPython 解析 HTML 时最经常被推荐的是Beautiful Soup，而且阅读全文

posted @ 2013-05-23 14:15 vivianC 阅读(215) 评论(0) 推荐(0) 编辑

2013年5月21日

一些 HTML内容比较/文本差异比较开源代码

摘要： http://blog.csdn.net/zuoming120/article/details/6956963http://htmldiff.codeplex.com/#1. DiffPlex - a .NET Diff Generator http://diffplex.codeplex.com/SourceControl/changeset/view/052fd342999b 原网站dll下载 http://diffplex.codeplex.com/简介：具体使用可以参考http://diffplex.codeplex.com/wikipage?title=library&ref 阅读全文

posted @ 2013-05-21 08:52 vivianC 阅读(2140) 评论(1) 推荐(0) 编辑

2013年5月16日

Win8修改保护视力的窗口颜色 - 转

摘要： win7以前版本只需分别将色调设为85，饱和度设为90，亮度设为205。设置窗口颜色即可。但win8 一直没找到在哪设置。。。还好可以通过修改注册表来实现同样效果：在Windows默认主题下，打开注册表编辑器（win键+R，即运行，输入regedit），依次双击打开HKEY_CURRENT_USER\Control Panel\Colors\，将Window的键值修改为204 232 207（此为RGB的颜色值，故与方法一的值不同），修改成功后重启电脑阅读全文

posted @ 2013-05-16 17:06 vivianC 阅读(396) 评论(0) 推荐(0) 编辑

2013年5月3日

python subprocess模块 - 转

摘要： http://blog.chinaunix.net/uid-15007890-id-3491843.htmlhttp://blog.csdn.net/dbzhang800/article/details/6879239从python2.4版本开始，你就可以用可以用subprocess这个模块来产生子进程，并连接到子进程的标准输入 /输出/错误中去，还可以得到子进程的返回值。subprocess意在替代其他几个老的模块或者函数，比如：os.system os.spawn* os.popen* popen2.* commands.*下面将一一介绍如何用subprocess来替代这些函数或者模块。s 阅读全文

posted @ 2013-05-03 19:27 vivianC 阅读(343) 评论(0) 推荐(0) 编辑

公告