随笔分类 - Python
摘要:效果: 详细参考: https://www.cnblogs.com/easypython/p/9084426.html https://www.cnblogs.com/ping-y/p/5897018.html
阅读全文
摘要:转自:TCP编程 - 廖雪峰的官方网站 Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。 客户端 大多数连接都是可靠的TCP连接。创建TCP连接时,主动发起连接的叫客户端,被动
阅读全文
摘要:转自:分布式进程 - 廖雪峰的官方网站 在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。 Python的 multiprocessing 模块不但支持多进程,其中 ma
阅读全文
摘要:英文原文:PEP 8 -- Style Guide for Python Code 1. Introduction 介绍 本文提供的Python代码编码规范基于Python主要发行版本的标准库。Python的C语言实现的C代码规范请查看相应的PEP指南1。 这篇文档以及PEP 257(文档字符串的规
阅读全文
摘要:想学爬虫主要是因为算法和数据是密切相关的,有数据之后可以玩更多有意思的事情,数据量大可以挖掘挖掘到更多的信息。 之前只会通过python中的request库来下载网页内容,再用BeautifulSoup、re正则工具来解析;后来了解到Scrapy爬虫框架,现在入门先写个小小的爬虫项目,这里做个简单的
阅读全文
摘要:1. 词云简介 词云,又称文字云、标签云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。常见于博客、微博、文章分析等。 除了网上现成的Wordle、Tagxedo、Tagul、Tagcrowd等词云制作工
阅读全文
词云:解决pip install wordcloud安装过程中报错“error: command 'x86_64-linux-gnu-gcc' failed with exit status 1”问题
摘要:外部环境:ubuntu16.04, 64bits, 全局环境python2.7 在虚拟环境(python3.5)中执行 pip install wordcloud 时安装失败,报错: 解决方案:在外部环境执行 sudo apt-get install python3-dev ,再在虚拟环境中重新 p
阅读全文
摘要:一、数值类型(int、float) # %d、%f是占位符>>> a = 3.1415926>>> print("%d"%a) #%d只能输出整数,int类3>>> print("%f"%a) #%f输出浮点数3.141593>>> print("%.2f"%a) #按照要求输出小数位数3.14>>
阅读全文
摘要:原因: h5py 和 numpy 版本冲突,h5py 官方已修复合并到 master 分支,但是还没发新版,在发版之前可以用降级 numpy 的方法跳过这个问题。 降级命令如下: 参考: https://wuwb.me/2018/03/h5py-futurewarning-problem-fix.h
阅读全文
摘要:2018-04-09 update 利用python中的内置函数 eval() ,函数说明: 样例1: 样例2: *********************************************************************************************
阅读全文
摘要:Python中针对dict字典有两种复制: (1)浅复制:利用 copy() 或者 dict() ;复制后对原dict的内部子对象(方括号[]内元素)进行操作时,由浅复制得到的dict会受该操作影响 (2)深复制:利用 deepcopy() ;复制后对原dict的内部子对象(方括号[]内元素)进行操
阅读全文
摘要:一、Python2.7 Python 2.7教程 - 廖雪峰的官方网站 Python 基础教程 | 菜鸟教程 二、Python3 Python教程 - 廖雪峰的官方网站 Python3 教程 | 菜鸟教程 迁移参考: 在Python 2.7即将停止支持时,我们为你准备了一份3.x迁移指南 参考: 如
阅读全文
摘要:1.余弦相似度可用来计算两个向量的相似程度 对于如何计算两个向量的相似程度问题,可以把这它们想象成空间中的两条线段,都是从原点([0, 0, ...])出发,指向不同的方向。两条线段之间形成一个夹角,如果夹角为0度,意味着方向相同、线段重合;如果夹角为90度,意味着形成直角,方向完全不相似;如果夹角
阅读全文
摘要:一、TextRank原理 TextRank是一种用来做关键词提取的算法,也可以用于提取短语和自动摘要。因为TextRank是基于PageRank的,所以首先简要介绍下PageRank算法。 1. PageRank算法 PageRank设计之初是用于Google的网页排名的,以该公司创办人拉里·佩奇(
阅读全文
摘要:利用lambda实现排序;要实现多条件排序,只需要依次指定排序的标准,具体实现如下
阅读全文
摘要:关于Anaconda的安装参考本人之前的博文 http://www.cnblogs.com/bymo/p/8034661.html 关于Anaconda的概述和详细使用参考:https://www.jianshu.com/p/2f3be7781451 这里介绍conda常用的命令操作 # 查看con
阅读全文
摘要:利用plt.hist() 模块化: 把多个数据分布显示在一个直方图表中对比: 生成渐变色: 例如下面这种(看到眼花哈哈哈): 还是选择几种比较特别的颜色会方便看一些. Matplotlib uses a dictionary from its colors.py module. To print t
阅读全文
摘要:一、语法 1. 使用正则表达式进行匹配的流程 2. Python支持的正则表达式元字符和语法 参考: AstralWind的Python正则表达式指南 官方文档:7.2. re — Regular expression operations 二、常用操作 1. 匹配 match()方法判断是否匹配,
阅读全文
摘要:print np.mean(df.title.apply(lambda x: len(x))) # 24.072694718 print df.title.apply(lambda x: len(x) < 30).value_counts() """ True 4069 False 1516 """
阅读全文
摘要:python 中除了整型,其他进制的只能用字符串来表示
阅读全文