随笔分类 -  Python

摘要:常用的国内 PyPI 镜像列表 豆瓣 https://pypi.doubanio.com/simple/ 网易 https://mirrors.163.com/pypi/simple/ 阿里云 https://mirrors.aliyun.com/pypi/simple/ 清华大学 https:// 阅读全文
posted @ 2019-12-07 21:35 夏末秋凉 阅读(3527) 评论(0) 推荐(0)
摘要:最近在服务器上跑脚本,linux自带的是python 2.x,中文显示经常有问题,通过下面两篇终于弄懂了。 https://www.cnblogs.com/575dsj/p/7112767.html https://blog.csdn.net/u010223750/article/details/5 阅读全文
posted @ 2019-01-20 23:23 夏末秋凉 阅读(181) 评论(0) 推荐(0)
摘要:下载 https://share.weiyun.com/5NVc5U3 并将 JetbrainsCrack-3.1-release-enc.jar 放置到 pycharm安装目录的\bin目录下(位置可随意,只要配置文件填写相对应的路径)。 在 Pycharm安装目录的\bin目录下找到 pycha 阅读全文
posted @ 2018-11-28 17:33 夏末秋凉 阅读(323) 评论(0) 推荐(0)
摘要:Seaborn是Python的一个制图工具库,在Matplotlib上构建,支持numpy和pandas的数据结构可视化。 他有多个内置的主题,颜色的主题 可视化单一变量,二维变量用于比较各个变量的分布情况 可视化线性回归模型中的独立变量以及不独立变量 可视化矩阵数据,通过聚类算法探索矩阵间的结构 阅读全文
posted @ 2017-02-16 21:16 夏末秋凉 阅读(687) 评论(0) 推荐(0)
摘要:前面(1)(2)的内容已经足够爬虫如链家网之类的不需要登录可以直接获取数据的网站。 而要爬取社交网站比较鲜明的特点就是需要登录,否则很多东西都无法获取。经过测试发现,微博,知乎都不是很好登录,知乎有时候的验证码会类似12306那样,而微博除了验证码,在传递参数的时候会对用户名进行base64加密。这 阅读全文
posted @ 2017-01-24 14:11 夏末秋凉 阅读(4283) 评论(1) 推荐(0)
摘要:前面说过由于GIL的存在,Python的多线程效率没有希望的那么高,python的多线程适合IO密集型的情况,而爬虫恰好就是一个IO密集的情况,因为爬虫中很大一部分时间,是在等待socket返回数据。 下面写一个例子: 换成多线程之后: 速度有了很大的提升 线程池 threadpool.Thread 阅读全文
posted @ 2017-01-24 12:42 夏末秋凉 阅读(383) 评论(0) 推荐(0)
摘要:Python上手很容易,免费开源,跨平台不受限制,面向对象,框架和库很丰富。 Python :Monty Python's Flying Circus (Python的名字来源,和蟒蛇其实无关)。 通过homebrew和pyenv可以维护多个Python版本。 相关知识 HTTP = HyperTe 阅读全文
posted @ 2017-01-18 12:58 夏末秋凉 阅读(516) 评论(0) 推荐(0)
摘要:1.首先使用exe文件安装python-mysql.链接: http://pan.baidu.com/s/1kVqILTX 密码: manj。 2.虚拟环境创建后,我们把已经在公共环境使用exe安装好的mysql涉及到的四个文件复制到虚拟环境对应目录(copy到虚拟环境下的\venv\Lib\sit 阅读全文
posted @ 2017-01-05 12:38 夏末秋凉 阅读(264) 评论(0) 推荐(0)
摘要:Pycharm 鼠标移动到函数上,CTRL+Q可以快速查看文档,CTR+P可以看基本的参数。 apply(),applymap()和map() apply()和applymap()是DataFrame的函数,map()是Series的函数。 apply()的操作对象是DataFrame的一行或者一列 阅读全文
posted @ 2016-11-30 14:55 夏末秋凉 阅读(16112) 评论(0) 推荐(1)
摘要:进程:程序的一次执行(程序载入内存,系统分配资源运行)。每个进程有自己的内存空间,数据栈等,进程之间可以进行通讯,但是不能共享信息。 线程:所有的线程运行在同一个进程中,共享相同的运行环境。每个独立的线程有一个程序入口,顺序执行序列和程序的出口。 线程的运行可以被强占,中断或者暂时被挂起(睡眠),让 阅读全文
posted @ 2016-11-30 11:07 夏末秋凉 阅读(9892) 评论(0) 推荐(1)
摘要:自然语言处理 -->计算机数据 ,计算机可以处理vector,matrix 向量矩阵。 NLTK 自然语言处理库,自带语料,词性分析,分类,分词等功能。 简单版的wrapper,比如textblob。 一 简单的文本预处理流水线 1.分词 Tokenize 长句子分成有意义的小部件。 nltk的分词 阅读全文
posted @ 2016-11-06 19:45 夏末秋凉 阅读(4942) 评论(0) 推荐(0)
摘要:一 内置函数 bin()、oct()、hex()的返回值均为字符串,且分别带有0b、0o、0x前缀。 实例 统计二进制数里1的个数 二 format 实例 求两个二进制字符串的和 不能用内置函数 此外format还有很多其他功能,控制精度,对齐等格式化输出。 上面统计1的个数也可以写成 阅读全文
posted @ 2016-11-01 11:23 夏末秋凉 阅读(181) 评论(0) 推荐(0)
摘要:可视化的工具有很多,如Tableau,各种JS框架,我个人感觉应该是学JS最好,因为JS不需要环境,每个电脑都有浏览器,而像matplotlib需要Python这样的开发环境,还是比较麻烦的,但是毕竟用Python处理数据,本文还是要写点自己的学习笔记的,当然知道画什么最重要(我并不知道-。-)! 阅读全文
posted @ 2016-10-31 11:37 夏末秋凉 阅读(620) 评论(0) 推荐(0)
摘要:Numpy Numpy是python的一个库。支持维度数组与矩阵计算并提供大量的数学函数库。 Pandas pandas 处理时间序列,缺失数据的处理。 上面numpy,pandas有很多东西没说,还是要实战才容易记住,多多加油吧! 阅读全文
posted @ 2016-09-09 14:19 夏末秋凉 阅读(635) 评论(0) 推荐(0)
摘要:方法 类方法@classmethod,实例方法,静态方法@staticmethod,特殊方法,__init__ 形式上的区别:调用是通过类和实例进行,不能直接调用,有自己的特殊参数,如__init__有self,类方法有参数class,有自己的声明方式。 实质上的区别:类方法与类绑定,实例方法绑定实 阅读全文
posted @ 2016-07-23 15:27 夏末秋凉 阅读(286) 评论(0) 推荐(0)
摘要:部分参考自:http://www.geekfan.net/7862/ 新式类与经典类 2和3不一样,3都是新式类。 新式类和经典类的区别: 新式类要指明父类,上面代码class B 声明他的父类为object。 python是动态语言,可以动态的添加属性。 __slots__槽,属性限制了实例b只能 阅读全文
posted @ 2016-07-16 22:02 夏末秋凉 阅读(1091) 评论(0) 推荐(0)
摘要:参考自:http://www.cnblogs.com/huxi/category/251137.html 迭代器 迭代器是访问集合内元素的一种方式,他不能倒退只能一直迭代下去。可以写到for循环in后面的对象都是可迭代的,比如list,dict,字符串等。 迭代器的一个优点就是它不要求你事先准备好整 阅读全文
posted @ 2016-07-14 23:34 夏末秋凉 阅读(326) 评论(0) 推荐(0)
摘要:python中一切皆对象,函数也看做对象。函数被函数名所引用,但是同样的他也可以被其他标识符所引用,可以作为参数传递。 可见a引用了函数返回值,b引用了函数本身,a不可调用,b可调用。而函数作为参数,即引用函数本身,下面的装饰器就是以函数作为参数,引用的函数本身,而不是返回值。 常用的几个内建函数M 阅读全文
posted @ 2016-07-13 02:16 夏末秋凉 阅读(309) 评论(0) 推荐(0)
摘要:列表list list是用的最多的类型 可以count计数 可嵌套,多钟类型并存 支持 + * 引用,a变化a_ref也变化 指向同一个地址 可以用id(a)查看,除非拷贝a_copy。但是如b = a * 2 + *不是a的引用,b会变成一个新的列表 x已经和l没有关系了,x不会变,y会变 字符串 阅读全文
posted @ 2016-04-26 17:30 夏末秋凉 阅读(397) 评论(0) 推荐(0)