随笔分类 -  Python

摘要:声明:本文为网络转载from win32com.client import DispatchEximport timeie=DispatchEx("InternetExplorer.Application") ie.Navigate("http://hi.baidu.com/mirguest/creat/blog/")ie.Visible=1while ie.Busy: time.sleep(1) body=ie.Document.body# headerfor i in body.getElementsByTagName("input&quo 阅读全文
posted @ 2011-09-28 11:51 Done 阅读(598) 评论(0) 推荐(0)
摘要:Sphinx官方自带的api有 PHP, Python, Java, Ruby, and pure C,还有其它开源的api如下:Perl API port, Sphinx::Search, by Jon SchutzC++ API port, C++ Sphinx client, by Seznam.czHaskell API port, Haskell Sphinx client, by TupilC# API port, C# .NET client, by Christopher GooleySphinx的api文件放在下载的源文件的api目录下,进入该目录看到有如下文件: Code 阅读全文
posted @ 2011-04-30 19:02 Done 阅读(4322) 评论(0) 推荐(2)
摘要:Sphinx是一个在GPLv2下分发的全文检索引擎;Coreseek 是一个可供企业使用的、基于Sphinx(可独立于Sphinx原始版本运行)的中文全文检索引擎,按照GPLv2协议发行,商业使用(例如, 嵌入到其他程序中)需要联系我们以获得商业授权。 一般而言,Sphinx是一个独立的全文搜索引擎;而Coreseek是一个支持中文的全文搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度... 阅读全文
posted @ 2010-11-14 18:22 Done 阅读(1695) 评论(0) 推荐(0)
摘要:sphinx不支持中文分词,国内也有人写了好多个分词组件,本文就讲安装LibMMSeg,它是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。 先从http://www.coreseek.cn/news/7/99/ 上下载到LibMMSeg的安装包,如下:[代码] 然后解压缩:[代码] 进入... 阅读全文
posted @ 2010-11-14 15:07 Done 阅读(2397) 评论(0) 推荐(0)
摘要:在上一篇文章中说到安装mysql和sphinx的mysql引擎sphinxSE的安装,这一篇说的是sphinx的安装和运行测试,关于下载和解压缩sphinx都用上一篇文章里说的。 进入到sphinx的源码文件夹里,运行下列命令就可以安装sphinx了:[代码] 其中--prefix是指向sphinx的安装路径,--with-mysql是指向mysql的安装路径。如果上面都没有报错,那sphinx就... 阅读全文
posted @ 2010-11-04 20:53 Done 阅读(5834) 评论(1) 推荐(0)
摘要:Beyond 2是向网络虚拟世界的统一平台迈出的重要一步。作为一个开源系统,它可以加快那些虚拟世界项目的开发工作。Beyond建立在另一个开源项目—— Twisted 网络服务器[Leftkowitz02]之上并对其加以扩展,从而使任意数量的三维客户端都可以连接到一个共同的仿真框架上。Beyond 还提供了一个客户端的参考实现,它使用了开源三维引擎星云设备(Nebula D... 阅读全文
posted @ 2010-11-04 11:41 Done 阅读(285) 评论(0) 推荐(0)
摘要:本文讲的是源码Tarball的安装方式,不是RPM安装方式,为了以后后到sphinx,安装时把mysql的sphinx引擎也安装上去。 从mysql官网找到mysql的源码下载,这里下载的是Generic Linux (Architecture Independent), Compressed TAR Archive(mysql-5.1.52.tar.gz )版本,如下:Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->cd/usr/local 阅读全文
posted @ 2010-11-04 11:38 Done 阅读(3718) 评论(2) 推荐(1)
摘要:1声明本程序只供学习交流使用,不做其它用途2程序使用步骤2.1下载安装2.2用校网账号登录,登录成功系统保存登录信息2.3登录到主界面,第一次登录就点击GETFRIENDS按钮,获取自己好友列表,系统自动保存好友列表到本地,不是第一次登录系统从本地读取好友列表,需要更新好友列表也点GETFRIENDS按钮。2.4选择你要访问的好友,点击BGEINGING按钮,开始访问好友。2.5最小化程序,不用退... 阅读全文
posted @ 2010-11-03 12:47 Done 阅读(1501) 评论(2) 推荐(0)
摘要:全文检索引擎1、Sphinx1.1.Sphinx是什么Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎。意图为其他应用提供高速、低空间占用、高结果 相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式 的XML数据。通过修改源代码,用户可以自行增加新... 阅读全文
posted @ 2010-10-22 19:40 Done 阅读(7770) 评论(2) 推荐(2)
摘要:本文讲从下载到安装jdk、eclipse到配置PyDev... 阅读全文
posted @ 2010-10-21 17:43 Done 阅读(5866) 评论(0) 推荐(0)
摘要:介绍了linux下从下载、编译、安装python的详细过程... 阅读全文
posted @ 2010-10-20 16:51 Done 阅读(49549) 评论(1) 推荐(2)
摘要:1、从http://www.codegood.com/上下载到国外有人编译好的,自己就免去这一环节2、import MySQLdb时出现如下错误:[代码]解决方法:1) 在文件 "__init__" 中将:from sets import ImmutableSet class DBAPISet(ImmutableSet): 替换为class DBAPISet(frozenset)2) 在文件 "c... 阅读全文
posted @ 2010-09-06 18:12 Done 阅读(337) 评论(0) 推荐(0)
摘要:HTTP的访问过程就是一来一回的. python提供的urllib2很方便发起访问请求:* urllib2.urlopen(url)url为完整的URL* urllib2.urlopen(request)request为urllib2.Request类实例这样就发起了HTTP访问请求.现在的网站一般都会对自动处理脚本起防范的. 比如在header段的cookie, 还有就是在post请求发出的数据... 阅读全文
posted @ 2010-09-05 01:54 Done 阅读(32139) 评论(0) 推荐(0)
摘要:httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现。[代码][代码] HTTPConnection类的构造函数,表示一次与服务器之间的交互,即请求/响应。参数host表示服务器主机,如:http://www.csdn.net/;port为端口号,默认值为80; 参数strict的 默认值为fa... 阅读全文
posted @ 2010-08-30 21:46 Done 阅读(27426) 评论(0) 推荐(3)
摘要:在python类中所定义的所有方法中,都有一个self参数,而且必须是第一个参数,这个参数代表实例对象本身,就象其它面向对象语言中的this,当你用实例调用方法时,由解释器自动传给方法,你不用自己去传self参数进来。  但是self并不是python的关键字,本质上只是一个函数的参数,用self只是种约定的写法,自己可以用其它变量来替代,如下:[代码]  输出:say hello to pete... 阅读全文
posted @ 2010-08-19 10:17 Done 阅读(854) 评论(0) 推荐(0)
摘要:1.序言本文旨在说明:在Python里自定义class时,方法的第一个参数必须是该class的instance自身的引用(一般用self命名)。在其他语言里,定义方法的时候,第一个参数不必是类实例的引用,一般约定俗成用this关键字来表示当前实例的引用,可是Python自成一派。由于网络上绝大部分文章都说成这是硬性规定,因此笔者觉得很有必要去研究一下Python里的class System是如何构... 阅读全文
posted @ 2010-08-18 17:52 Done 阅读(3450) 评论(0) 推荐(0)
摘要:HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析。本文主要简单讲一下HTMLParser的用法. 使用时需要定义一个从类HTMLParser继承的类,重定义函数: handle_starttag( tag, attrs)handle_startendtag( tag, attrs) handle_endtag( tag)来实现自己需要的功能。 tag是的h... 阅读全文
posted @ 2010-08-10 12:42 Done 阅读(2167) 评论(0) 推荐(1)
摘要:字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。  decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码... 阅读全文
posted @ 2010-08-03 12:11 Done 阅读(827) 评论(0) 推荐(0)
摘要:浮点型:[代码]整型:[代码]字符串:[代码][代码]  在上面的例子中,a和b指向了相同的整数对象,但是c和d没有指向相当的浮点数对象,Python仅缓存简单的整数类型和字符串类型,而且缓存的整数类型的范围是(-1,100),被缓存的对象也会被回收。 阅读全文
posted @ 2010-08-02 11:04 Done 阅读(298) 评论(0) 推荐(0)