摘要:
不论是数据挖掘还是数学建模,都免不了数据可视化的问题。对于 Python 来说,matplotlib 是最著名的绘图库,它主要用于二维绘图,当然也可以进行简单的三维绘图。它不但提供了一整套和 Matlab 相似但更为丰富的命令,让我们可以非常快捷地用 python 可视化数据。 matplotlib 阅读全文
摘要:
pandas是python下强大的数据分析和探索工具,是的python在处理数据时非常快速、简单。它是构建在numpy之上的,包含丰富的数据处理函数,支持时间序列分析功能,支持灵活处理缺失数据。 pandas基础 # 安装 pip install pandas pandas 基本的数据结构是 Ser 阅读全文
摘要:
Python中没有提供数组功能,虽然列表可以完成基本的数组功能,但并不是真正的数组,而且在数据量较大时,使用列表的速度回非常慢。因此,Numpy提供了真正的数组功能,以及对数据进行快速处理的函数。Numpy内置函数处理数据的速度是C语言级别的,因此,尽量使用其内置函数。 Numpy安装 Numpy安 阅读全文
摘要:
题目描述 给出两个非空的链表用来表示两个非负的整数。其中,它们各自的位数是按照 逆序的方式存储的,并且它们的每个节点只能存储一位数字。如果,我们将这两个数相加起来,则会返回一个新的链表来表示它们的和。您可以假设除了数字 0 之外,这两个数都不会以 0 开头。 1 示例: 2 输入:(2 -> 4 阅读全文
摘要:
题目描述: Given an array of integers, return indices of the two numbers such that they add up to a specific target. You may assume that each input would h 阅读全文
摘要:
一、进程 1、多任务原理 多任务是指操作系统同时可以运行多个任务。 单核CPU实现多任务原理:操作系统轮流让各个任务交替执行; 多核CPU实现多任务原理:真正的执行多任务只能在多核CPU上实现,多出来的任务轮流调度到每个核心上执行。 并发:看上去一起执行,任务数多于CPU核心数; 并行:真正的一起执 阅读全文
摘要:
前面整理了一些爬虫的内容,今天写一个小小的栗子,内容不深,大佬请忽略。内容包括对豆瓣读书网站中的书籍的基本信息进行爬取,并整理,便于我们快速了解每本书的中心。 一、爬取信息 每当爬取某个网页的信息时,首先就是要进入到网页中,看看有没有什么爬取过程中的限制,可以查看网站的robots协议。就是在原网址 阅读全文
摘要:
一、request入门 之前写过一个urllib的爬虫方法,这个库是python内建的,从那篇文章也可以看到,使用起来很繁琐。现在更流行的一个爬虫库就是requests,他是基于urllib3封装的,也就是将之前比较繁琐的步骤封装到一块,更适合人来使用。 该库中主要有7个方法:request() g 阅读全文
摘要:
在数据分析当中的东西还是很多的,我在这里只是启发式的介绍一下,了解到这方面的东西之后,使用的时候可以更快的找到解决办法,希望能对大家有所帮助。 这次,依然是使用的sklearn中的iris数据集,对其进行通过热图来展示。 预处理 sklearn.preprocessing是机器学习库中预处理的模块, 阅读全文
摘要:
在这篇博客中,用一个小栗子来介绍一下散点图在多变量数据中的一方面应用。 scikit库中提供了一些数据,这里使用iris数据集,是一种鸢尾属植物,所给数据中包括两种类型的花,目的是根据所给信息判断两种花分别属于哪一类。也就是说找到区分这两种花的方法。 加载库 1 from sklearn.datas 阅读全文
摘要:
网络爬虫是一种按照一定规则自动抓取万维网信息的程序。在如今网络发展,信息爆炸的时代,信息的处理变得尤为重要。而这之前就需要获取到数据。有关爬虫的概念可以到网上查看详细的说明,今天在这里介绍一下使用urllib进行网络爬虫的方法使用,在最后的一个案例中把最基本的爬虫要素运用进去,可以作为初学者的一个模 阅读全文
摘要:
单变量:表达式、方程式、函数或者一元多项式等 数据:http://www.presidency.ucsb.edu/data/sourequests.php美国总统历年在国情咨文中对国会提起的诉求数量 一、获取数据 本次使用到的数据量并不多,不过还是按照常规思路,通过爬虫获取。 1 import ur 阅读全文
摘要:
Tkinter模块("Tk 接口")是Python的标准Tk GUI工具包的接口.Tk和Tkinter可以在大多数的Unix平台下使用,同样可以应用在Windows和Macintosh系统里.Tk8.0的后续版本可以实现本地窗口风格,并良好地运行在绝大多数平台中。 目录:1、简单实例 2、Label 阅读全文
摘要:
mysql在之前写过一次,那时是我刚刚进入博客,今天介绍一下mysql的python交互,当然前面会把mysql基本概述一下。 目录: 一、命令脚本(mysql) 1、基本命令 2、数据库操作命令 3、表操作命令 4、数据操作命令 5、查 6、关联 二、python交互 1、数据库连接 2、创建数据 阅读全文
摘要:
正则表达式,英文:Regular Expression。它通常用来检索和替换符合某种模式的文本。 Python自1.5版本开始增加了re模块,使得Python拥有了全部的正则表达式功能。 一、基本函数(match、search、findall) 在使用re模块之前,要先引入,re模块使已经在内置在P 阅读全文
摘要:
map()和reduce()是一种在处理大数据时的重要思想,在平时也可以利用。在python中内置了这两个方法,map取映射的意思,reduce取归纳的意思。 一、map() map(func, lsd) 参数1是函数 参数2是序列 功能:将传入的函数依次作用在序列中的每一个元素,并把结果作为一个新 阅读全文
摘要:
这两个方法是python类中的基本方法,经常会在一些面试中问到。即便没有要面试之类的,学习一下其内部的原理和使用也是有必要的。 首先区分一下这两个方法: __init__:初始化方法 __new__:构造函数 __init__:实例方法 __new__:静态方法 __new__:创建实例,并返回cl 阅读全文
摘要:
首先说下线性表,线性表是一种最基本,最简单的数据结构,通俗点讲就是一维的存储数据的结构。 线性表分为顺序表和链接表: 顺序表示指的是用一组地址连续的存储单元依次存储线性表的数据元素,称为线性表的顺序存储结构或顺序映像; 链式表示指的是用一组任意的存储单元存储线性表中的数据元素,称为线性表的链式存储结 阅读全文
摘要:
stay hungry, stay foolish.求知若饥,虚心若愚。 今天和大家分享一个python的实战案例,很多人在学习过程中都希望通过一些案例来试一下,也给自己一点动力。那么下面介绍一下这次要介绍的内容,这个也是博主最近学的,要相信自己可以搞得定。 那么现在进入正题,实战要求是做一个银行系 阅读全文
摘要:
大家好,下面我说一下我对面向对象的理解,不会讲的很详细,因为有很多人的博客都把他写的很详细了,所以,我尽可能简单的通过一些代码让初学者可以理解面向对象及他的三个要素。 摘要:1、首先介绍一下面向对象 2、然后分别讲一下封装、继承和多态 3、最后通过一段面向对象的案例来更好的理解一下面向对象 pyth 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ 一、递归 递归调用:一个函数,调用的自身,称为递归调用 递归函数:一个可以调用自身的函数称为递归函数 凡是循环能干的事,递归都能干 方法: 1、写出临界条件 2、找这一次和上一次的关系 3、假设当前函数已经能用,调用自身计算上 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ 一、读文件 要把大象装冰箱,需要分几步?对于读写文件也是这样简单的流程,打开文件、读取文件和关闭文件。 描述符:文件所有操作涉及到描述符,描述符就是一个光标,读取数据可以从光标开始向后依次读,等等。 1、打开文件 open(p 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ 概念:装饰器是一个闭包,把一个函数当做参数返回一个替代版的函数,本质上就是一个返回函数的函数 装饰器就是在我们需要的一个函数外面包装一个外壳,当我们希望这个函数更漂亮时,可以通过改变这个包装的样子即可,而不需要更改原函数,也可 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ 1、可迭代对象 在介绍迭代器之前呢,我们先聊一下可迭代对象(Iterable),可迭代对象就是可以直接作用于for循环的对象。 那么什么是可以直接用于for循环的呢? 可以直接用于for的数据类型一般分为两种: 1、集合数据类 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ 首先,简单介绍一下set,set就是我们中学时所学的集合,当时集合的性质就包括一点,集合里不能有重复的数字。我们现在所用到的集合更为广泛,里面可以存放字符等等。 set:类似于dict,是一组key的集合,不存储value 本 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ Seaborn是对matplotlib的extend,是一个数据可视化库,提供更高级的API封装,在应用中更加的方便灵活。下面我简单介绍一下他的用法,实际应用的时候,可以直接从文档中查找这个库,这时候使用就很快捷了。 提要:1 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ Matplotlib 是一个 Python 的 2D绘图库,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。当然他也是可以画出3D图形的,这时就需要安装更多的扩展 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ 1 import numpy as np 2 import pandas as pd 3 from pandas import Series,DataFrame 4 5 #Series 6 s1 = Series([1,2,3 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ numpy和pandas是python进行数据分析的非常简洁方便的工具,话不多说,下面先简单介绍一些关于他们入门的一些知识。下面我尽量通过一些简单的代码来解释一下他们该怎么使用。以下内容并不是系统的知识体系,我只是尽可能把最基 阅读全文
摘要:
博主地址:http://www.cnblogs.com/yudanqu/ turtle:海龟(海龟库) Turtle库是Python语言中一个很流行的绘制图像的函数库 使用之前需要导入库:import turtle • turtle.setup(width,height,startx,starty) 阅读全文
摘要:
博客地址:http://www.cnblogs.com/yudanqu/ 查询部分 1> 查询数据中所有数据:select * from 表名 2> 查询数据中某项的数据:eg:select id,name from students; 3> 消除重复行:eg:select distinct gen 阅读全文
摘要:
本人初入博客园,第一次写博客,在今后的时间里会一点点的提高自己博客的水平,以及博客的排版等。 在今天,我学习了一下MySQL数据库的基本知识,相信关于MySQL的资料网上会有很多,所以我就不在这里复制粘贴了,在这里留下一些本人在初学MySQL时的一些笔记,以供有需要的同学来参考。以下内容绝无复制,仅 阅读全文