摘要: 基本Get请求: #-*- coding:utf-8 -*- import requests url = 'http://www.baidu.com' r = requests.get(url) print r.text 带参数Get请求: #-*- coding:utf-8 -*- import 阅读全文
posted @ 2017-08-16 22:36 玲珑醉 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 1.爬虫的工作原理 网络爬虫,即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页, 阅读全文
posted @ 2017-08-16 14:02 玲珑醉 阅读(2604) 评论(0) 推荐(0) 编辑
摘要: 一、进程 程序并不能单独和运行只有将程序装载到内存中,系统为他分配资源才能运行,而这种执行的程序就称之为进程。程序和进程的区别在于:程序是指令的集合,它是进程的静态描述文本;进程是程序的一次执行活动,属于动态概念。 例如我们写一个hello程序,当这个程序再操作系统上运行的时候,操作系统会给我们一种 阅读全文
posted @ 2017-08-16 14:01 玲珑醉 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 从GitHub中整理出的15个最受欢迎的Python开源框架。这些框架包括事件I/O,OLAP,Web开发,高性能网络通信,测试,爬虫等。Django: Python Web应用开发框架 Django 应该是最出名的Python框架,GAE甚至Erlang都有框架受它影响。Django是走大而全的方 阅读全文
posted @ 2017-08-16 13:26 玲珑醉 阅读(19687) 评论(0) 推荐(2) 编辑
摘要: >>> import __builtin__>>> dir(__builtin__)['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException', 'BufferError', 'BytesWarning', 'Dep 阅读全文
posted @ 2017-08-16 13:20 玲珑醉 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 标准库Python拥有一个强大的标准库。Python语言的核心只包含数字、字符串、列表、字典、文件等常见类型和函数,而由Python标准库提供了系统管理、网络通信、文本处理、数据库接口、图形系统、XML处理等额外的功能。Python标准库的主要功能有:1.文本处理,包含文本格式化、正则表达式匹配、文 阅读全文
posted @ 2017-08-16 13:18 玲珑醉 阅读(30434) 评论(0) 推荐(0) 编辑
摘要: 1. Scikit-learn Scikit-learn 是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。而且也设计出了Python n 阅读全文
posted @ 2017-08-16 12:52 玲珑醉 阅读(3833) 评论(2) 推荐(0) 编辑