04 2017 档案
摘要:目前有很多xml,html文档的parser,如标准库的xml.etree , beautifulsoup , 还有lxml. 都用下来感觉lxml不错,速度也还行,就他了. 围绕三个问题: 问题1:有一个XML文件,如何解析 问题2:解析后,如果查找、定位某个标签 问题3:定位后如何操作标签,比如
阅读全文
摘要:如题 当然你要是用的不爽,也可以自己设置 比如说格式化代码是 alt + ctrl + L,这个在linux下跟锁屏是冲突的,可以修改成alt + ctrl + K 常用操作: 编辑类: 运行类: 调试类: 导航类: 查找/替换类: 搜索类: 重构类: 一般:
阅读全文
摘要:原文这里,非常实用,转载一下 再来一篇,两篇一起看,美滋滋 本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。 注意:本文基于Python2.4完成
阅读全文
摘要:近期公司培训讲到了三门问题。题目这样: 这个游戏的玩法是:参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门就可以赢得该汽车,而另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛
阅读全文
摘要:0.安装solr之前,确保已安装好java8, java -version 查看是否安装 1.新建本地目录solr1 并 解压两个压缩包文件 2.将CATALINA_HOME写入到~/.bashrc 3.验证tomcat是否可以启动 如果OK,则会出现首页源码,点击网址会如下: 4.配置solr,拷
阅读全文
摘要:公司内部代码管理使用git,简单使用一下,还蛮好的。 我简单的理解是:在本地建立文件夹,可以放project,里面什么file、dir都可以放,放完了之后,提交到git里,可以供展示,或者是别人下载更新之类。高级的用法目前没用到。 1.全局设置 2.建仓提交 以上我的事就完成了,下面的我都没怎么看,
阅读全文
摘要:作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 在随机变量中,我提到了连续随机变量。相对于离散随机变量,连续随机变量可以在一个连续区间内取值。比如一个均匀分布,从0到1的区间内取值。一个区间内包含了无穷多个实数,连续随机变量的取值
阅读全文
摘要:作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 我们已经知道什么是离散随机变量。离散随机变量只能取有限的数个离散值,比如投掷一个撒子出现的点数为随机变量,可以取1,2,3,4,5,6。每个值对应有发生的概率,构成该离散随机变量的概
阅读全文
摘要:作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 我们了解了“样本空间”,“事件”,“概率”。样本空间中包含了一次实验所有可能的结果,事件是样本空间的一个子集,每个事件可以有一个发生的概率。概率是集合的一个“测度”。 这一讲,我们将
阅读全文
摘要:作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 在概率公理中,我们建立了“概率测度”的概念,并使用“面积”来类比。这是对概率的第一步探索。为了让概率这个工具更加有用,数学家进一步构筑了“条件概率”,来深入探索概率中包含的数学结构。
阅读全文
摘要:作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 概率论早期用于研究赌博中的概率事件。赌徒对于结果的判断基于直觉,但高明的赌徒尝试从理性的角度来理解。然而,赌博中的一些结果似乎有矛盾。比如掷一个骰子,每个数字出现的概率相等,都是1/
阅读全文
摘要:作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 概率 概率论研究随机事件。它源于赌徒的研究。赌博中有许多随机事件,比如投掷一个骰子,是否只凭运气呢? 赌徒逐渐发现随机事件的规律。投掷两个骰子是常见的赌博游戏。如果重复很多次,那么总
阅读全文
摘要:官网 vamei的博客还是读了就秒懂,很妙, matplotlib核心剖析 官网翻译也不错,但缺少了 Logarithmic and other nonlinear axis对数等非线性轴 这一模块,还好,看上去不是太费劲。 Python matplotlib简介 Pyplot教程 这篇文章也可以参
阅读全文
摘要:参考 《python标准库》 也可以参考Vamei博客 列表用着很舒服,但迭代器不需要将所有数据同时存储在内存中。 本章练习一下python 标准库中itertools模块 合并 和 分解 迭代器 1.chain() 1.chain() 处理多个序列,而不比构造一个大的,两个合在一起,遍历就好了 2
阅读全文
摘要:原文地址 读完体会颇深,每个人身上都有伤口,踩过的坑多了,才知道以后的路怎么走才舒服,没有人一上来就各种牛逼。这种感性的抗压能力,或者叫逆境商,人与人之间的,人和组织之间的,很重要。 以下是原文: ‘-’*20 几年前曾经有个朋友,在我觉得工作中有点焦虑的时候说,“恭喜你,你遇到了瓶颈点,这就是你成
阅读全文
摘要:学习笔记,用作数据库查询,原文参考 官方文档参考 ubuntu本地安装mongodb
阅读全文
摘要:非常基础的json库的用法,后续添加数据格式、编码等内容 参考文章 json进阶 Python的json模块提供了一种很简单的方式来编码和解码JSON数据。 其中两个主要的函数是 json.dumps() 和 json.loads() , 要比其他序列化函数库如pickle的接口少得多。 下面演示如
阅读全文
摘要:goodtools! 原文
阅读全文
摘要:原文 先mark,后续尝试。 1.NLTK NLTK 在用 Python 处理自然语言的工具中处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的借口,还有分类、分词、除茎、标注、语法分析、语义推理等类库。 网站 http://www.nltk.org/ 安装 安装 NLTK: sudo
阅读全文
摘要:以给定的优先级对元素进行排序,每次pop删除优先级最高的 结果: H:\Python27_64\python.exe H:/myfile/python-cookbook-master/src/1/implementing_a_priority_queue/example.py ('Should be
阅读全文
摘要:这篇文章讲的比较全面 自python2.6开始,新增了一种格式化字符串的函数str.format(),可谓威力十足。那么,他跟之前的%型格式化字符串相比,有什么优越的存在呢? 语法 它通过{}和:来代替%。“映射”示例 通过位置 字符串的format函数可以接受不限个参数,位置可以不按顺序,可以不用
阅读全文
摘要:原文地址:http://blog.csdn.net/mspinyin/article/details/6137815#t12 现在自然语言处理的研究绝对是一个非常火热的方向,主要是被当前的互联网发展所带动起来的。在互联网上充斥着大量的信息,主要是文字方面的信息,对这些信息的处理离不开自然语言处理的技
阅读全文
摘要:堆排序heapq的用法 基本用法: 复杂数据结构: 输出结果: H:\Python27_64\python.exe H:/myfile/python-cookbook-master/src/1/finding_the_largest_or_smallest_n_items/example.py [{
阅读全文
摘要:cookbook系列 问题:对要搜索的值的最后几项做个有限的历史记录。 方案: 案例文件:somefile.txt Keeping the Last N Items Problem You want to keep a limited history of the last few items se
阅读全文