随笔分类 - Python
摘要:PhantomJS 是一个无界面 、可脚本编程的 WebKit 浏览器引擎,它原生支持多 Web 标准 DOM操作、 css 选择器、 JSON、Canvas 以及 SVG。 Selenium 支持 PhantomJS ,这样在运行的时候就不会再弹出 个浏览器了 而且 PhantomJS 的运行效率
阅读全文
摘要:GeckoDriver用于驱动Firefox,在这之前请确保已经正确安装好了Firefox浏览器并可以正常运行。 一、GeckoDriver的安装 GitHub:https://github.com/mozilla/geckodriver 下载地址:https://github.com/mozill
阅读全文
摘要:官方提供的邮件列表和新闻组: https://www.python.org/community/lists/
阅读全文
摘要:Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'NewConnectionError('<pip._vendor.urllib3.co
阅读全文
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- import ftplib import os import sys class FTPSync(object): conn = ftplib.FTP() def __init__(self,host,port=21): self.conn.connect(host,port)...
阅读全文
摘要:Python中默认安装的ftplib模块定义了FTP类,其中函数有限,可用来实现简单的ftp客户端,用于上传或下载文件.FTP的工作流程及基本操作可参考协议RFC959. ftp登陆连接 ftp相关命令操作 实例 一个上传代码:
阅读全文
摘要:看了一些网上的解释,最主流的解释是“str是给人看的,repr是给机器看的”,如果已经理解了的,这句话是对的,但是是有问题的,对于没懂的,这句话是无法理解的。 我来尝试解释一下。先直译一下官方文档: repr(object) Return a string containing a printabl
阅读全文
摘要:这个一定要吐槽一下,虽然没什么用。如果想改,早就改了。腾讯家大业大,不怎么在乎个别用户的吐槽。而且,开发者,并不是用户。写文档的兄弟勿怪,虽然我觉得你不会看到。之所以说这些,是因为,腾讯一向以完美的产品称霸天下。一个页面的文字就能挑出来这么多问题,是不是有点说不过去? 第一,模模糊糊感觉,似乎要做微
阅读全文
摘要:从GitHub中整理出的15个最受欢迎的Python开源框架。这些框架包括事件I/O,OLAP,Web开发,高性能网络通信,测试,爬虫等。 Django Python Web应用开发框架Django 应该是最出名的Python框架,GAE甚至Erlang都有框架受它影响。Django是走大而全的方向
阅读全文
摘要:此文旨在把trainNB0这个函数详细讲清楚。 下面所做的工作都是为了求下面这个贝叶斯概率,也叫条件概率: 为了计算方便,书中的操作实际上是把这个式子转化为了下式: 概率P(ci)就是通过类别i(侮辱性留言或非侮辱性留言)中文档数除以总的文档数来得到的,也就是最后得到的计算结果0.5。 这里有一个重
阅读全文
摘要:这一节中关于概率分布的描述,省略了一些语句,所以有点看不明白,经过反复推敲琢磨分析以后,把这些省略的文字补足,这样就能看懂了。【】中为补充的文字。 文中的“需要”的意思是“需要足够的数据样本来得到好的概率分布” 假设词汇表中有1000个单词。要得到好的概率分布,就需要足够的数据样本,假定样本数为N,
阅读全文
摘要:这个plotTree函数,比较聪明,比较简化,比较抽象,作者一定是逐步优化和简化到这个程度的。我是花了小两天时间,断断续续看明白的,还是在参考了另一篇文章以后。这里是链接http://www.cnblogs.com/fantasy01/p/4595902.html。现在尝试讲明白。 总体思想是,找出
阅读全文
摘要:matplotlib.pyplot是一个命令行风格的函数集合,使matplotlib像MATLAB一样工作。每个pyplot 函数会对图形窗口(figure)做一些改变,例如:创建一个图形窗口、在图形窗口上创建一个绘图区(plotting area)、在绘图区上画一些线条、在线条上标注说明文字等等。
阅读全文
摘要:有点乱,等我彻底想明白时再来整理清楚。
阅读全文
摘要:splitDataSet这个函数困扰了我好一阵子,为什么以某一特征值为标准进行划分数据集以后,变成了局部?例如,如果以第1个特征为0为标准进行划分,那么返回的结果集就是不含有此特征的结果集,如下图红框部分所示: 代码表示为:[[1, 'no'], [1, 'no']] 同理,如果以第1个特征为1作为
阅读全文
摘要:以下输出结果是每个样本的类别都不同时的输出结果: 样本总数:8当前labelCounts状态:{'1': 1}当前labelCounts状态:{'1': 1, '2': 1}当前labelCounts状态:{'1': 1, '2': 1, '3': 1}当前labelCounts状态:{'1': 1
阅读全文
摘要:这段代码,如果仅启用 就会在 b = open("trainingDigits/0_0.txt") 这个位置报 TypeError: Required argument 'flags' (pos 2) not found这个错 如果仅启用 就会在a = listdir("trainingDigits
阅读全文
摘要:以下代码,在Sublime中跑不起来,似乎Sublime无法交互输入文字,在IDLE或控制台中可以输入。 测试结果其实也挺搞笑的,这姑娘的喜好唯一取决于每周吃多少冰淇淋,前两项输入0,第三项输入236,就是small does,输入237,就是large doses。 所以,一个不玩游戏,不是飞行常
阅读全文
摘要:所以,第三个参数不能超过前两个的乘积,如果用fig.add_subplot(a,b,c)来表示的话,ab>=c,否则会报错。 对于fig.add_subplot(3,4,12)这个函数,官方网站的解释似乎有点问题,链接https://matplotlib.org/api/_as_gen/matplo
阅读全文