摘要: 1.读取命令行选项(1)sys.argspython启动时,命令行选项设置在列表sys.args中。sys.args[0]:xxx.pysys.args[1:]: 其他参数(2)optparser复杂参数可以使用optparser模块处理:USAGE = 'usage: python mymodule.py [cid] -l [level] -i [interval]'import optparserparser = optparser.OptionParser()parser.add_option("-i",,dest='interval' 阅读全文
posted @ 2014-01-27 18:53 Django's blog 阅读(299) 评论(0) 推荐(0) 编辑
摘要: http://www.kuqin.com/database/20120715/322528.htmlHadoop这个单词如今铺天盖地,几乎成了大数据的代名词。仅仅数年时间,Hadoop从边缘技术迅速成长为一个事实标准。如今想玩转大数据,搞企业分析或者商业智能,没有Hadoop还真不行。但Hadoop狂热的背后却酝酿着一场技术变革,Hadoop的核心技术在Google那里已经过时,因为Hadoop并不擅长处理“快数据”。今天,Hadoop似乎已经毫无争议地成了企业大数据技术标准,看上去Hadoop将根植企业,其地位在未来十年似乎都不会动摇。但是GigaOM的专栏作家Mike Miller却发出了 阅读全文
posted @ 2014-01-27 18:11 Django's blog 阅读(710) 评论(0) 推荐(0) 编辑
摘要: http://rsj217.diandian.com/post/2012-11-01/40041235132Beautiful Soup 是用 Python 写的一个 HTML/XML 的解析器,它可以很好的处理不规范标记并生成剖析树。通常用来分析爬虫抓取的web文档。对于 不规则的 Html文档,也有很多的补全功能,节省了开发者的时间和精力。Beautiful Soup 的官方文档齐全,将官方给出的例子实践一遍就能掌握。官方英文文档,中文文档一 安装Beautiful Soup安装 BeautifulSoup 很简单,下载BeautifulSoup源码。解压运行python setup.py 阅读全文
posted @ 2014-01-27 16:21 Django's blog 阅读(419) 评论(0) 推荐(0) 编辑
摘要: http://pythoner.org/wiki/257/毫无疑问:Python程序没有编译型语言高效快速. 甚至Python拥护者们会告诉你Python不适合这些领域. 然而,YouTube已用Python服务于每小时4千万视频的请求. 你所要做的就是编写高效的代码和需要时使用外部实现(C/C++)代码. 这里有一些建议,可以帮助你成为一个更好的Python开发者:1.使用内建函数: 你可以用Python写出高效的代码,但很难击败内建函数. 经查证. 他们非常快速.2.使用join()连接字符串. 你可以使用 "+" 来连接字符串. 但由于string在Python中是不 阅读全文
posted @ 2014-01-27 16:00 Django's blog 阅读(228) 评论(0) 推荐(0) 编辑
摘要: http://pythoner.org/wiki/751/代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构、优化、扩展以及文档相关的事情通常需要消耗 80% 的工作量。优化通常包含两方面的内容:减小代码的体积,提高代码的运行效率。改进算法,选择合适的数据结构一个良好的算法能够对性能起到关键作用,因此性能改进的首要点是对算法的改进。在算法的时间复杂度排序上依次是:O(1) -> O(lg n) -> O(n lg n) -> O(n^2) -> O(n^3) -> O(n^k) -> O 阅读全文
posted @ 2014-01-27 15:50 Django's blog 阅读(552) 评论(0) 推荐(0) 编辑
摘要: http://pythoner.org/wiki/10/编码 所有的 Python 脚本文件都应在文件头标上 # -*- coding:utf-8 -*- 。设置编辑器,默认保存为 utf-8 格式。注释 业界普遍认同 Python 的注释分为两种的概念,一种是由 # 开头的“真正的”注释,另一种是 docstrings。前者表明为何选择当前实现以及这种实现的原理和难点,后者表明如何使用这个包、模块、类、函数(方法),甚至包括使用示例和单元测试。 坚持适当注释原则。对不存在技术难点的代码坚持不注释,对存在技术难点的代码必须注释。但与注释不同,推荐对每一个包、模块、类、函数(方法)写 docst 阅读全文
posted @ 2014-01-27 15:48 Django's blog 阅读(625) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.zhihu.com/topic/195528261. C 程序员对于内存管理,计算机体系的理解能力;2. C++ 程序员对元编程的理解能力;3. Java程序员对于OO和设计模式的理解,对规模项目掌控的能力, 对虚拟机实现理解的能力;4. Ruby程序员创造Web应用的能力;5. Python 程序员在小中型Startup中应对各种问题的能力;6. Javascript 程序员研究颠覆同行对Web交互认知的技术的能力; 阅读全文
posted @ 2014-01-27 15:21 Django's blog 阅读(273) 评论(0) 推荐(0) 编辑
摘要: Hi Pythonistas!测试和调试 Testing & Debugging框架及Web Frameworks & Web并发 Concurrency任务调度 Job Schedulers实用工具 Utilities & Tools科学科学及可视化 Data Science & Visualization编辑器及其改善 Editors & Editor Enhancements持续交付 DevopsGitMail & Chat音频和视频 Audio & Video其它好物 Other Awesomeness.是也乎Hi Pythoni 阅读全文
posted @ 2014-01-27 14:56 Django's blog 阅读(645) 评论(0) 推荐(0) 编辑
摘要: problem:Attempted relative import in non-package所谓相对路径其实就是相对于当前module的路径,但如果直接执行脚本,这个module的name就是“__main__”, 而不是module原来的name, 这样相对路径也就不是原来的相对路径了,导入就会失败,出现错误“ValueError: Attempted relative import in non-package”solve:方法1:把src目录加入到sys.path里去方法2:把整个工程myproject写成package放进site-packages然后这样引用from myproj 阅读全文
posted @ 2014-01-27 11:19 Django's blog 阅读(3196) 评论(0) 推荐(0) 编辑