路线框架
路线框架
https://www.zhihu.com/question/29138020
https://docs.python.org/zh-cn/3/
https://www.liaoxuefeng.com/wiki/1016959663602400
https://www.runoob.com/python3/python3-tutorial.html
http://www.pythontutor.com/visualize.html#mode=edit
链接:https://www.zhihu.com/question/29138020/answer/778840509
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
给初学者的几个建议:
- Make English as your working language.
- Practice makes perfect.
- All experience comes from mistakes.
- Don't be one of the leeches.
- Either stand out or kicked out.
先附上github地址:
下面是这个一百天计划里面的学习框架,我在这里放上来。
Day01~15 - Python语言基础
Day01 - 初识Python
Python简介 - Python的历史 / Python的优缺点 / Python的应用领域
搭建编程环境 - Windows环境 / Linux环境 / MacOS环境
从终端运行Python程序 - Hello, world / print函数 / 运行程序
使用IDLE - 交互式环境(REPL) / 编写多行代码 / 运行程序 / 退出IDLE
注释 - 注释的作用 / 单行注释 / 多行注释
Day02 - 语言元素
程序和进制 - 指令和程序 / 冯诺依曼机 / 二进制和十进制 / 八进制和十六进制
变量和类型 - 变量的命名 / 变量的使用 / input函数 / 检查变量类型 / 类型转换
数字和字符串 - 整数 / 浮点数 / 复数 / 字符串 / 字符串基本操作 / 字符编码
运算符 - 数学运算符 / 赋值运算符 / 比较运算符 / 逻辑运算符 / 身份运算符 / 运算符的优先级
应用案例 - 华氏温度转换成摄氏温度 / 输入圆的半径计算周长和面积 / 输入年份判断是否是闰年
Day03 - 分支结构
分支结构的应用场景 - 条件 / 缩进 / 代码块 / 流程图
if语句 - 简单的if / if-else结构 / if-elif-else结构 / 嵌套的if
应用案例 - 用户身份验证 / 英制单位与公制单位互换 / 掷骰子决定做什么 / 百分制成绩转等级制 / 分段函数求值 / 输入三条边的长度如果能构成三角形就计算周长和面积
Day04 - 循环结构
循环结构的应用场景 - 条件 / 缩进 / 代码块 / 流程图
while循环 - 基本结构 / break语句 / continue语句
for循环 - 基本结构 / range类型 / 循环中的分支结构 / 嵌套的循环 / 提前结束程序
应用案例 - 1~100求和 / 判断素数 / 猜数字游戏 / 打印九九表 / 打印三角形图案 / 猴子吃桃 / 百钱百鸡
Day05 - 构造程序逻辑
基础练习 - 水仙花数 / 完美数 / 五人分鱼 / Fibonacci数列 / 回文素数
综合练习 - Craps赌博游戏
Day06 - 函数和模块的使用
函数的作用 - 代码的坏味道 / 用函数封装功能模块
定义函数 - def语句 / 函数名 / 参数列表 / return语句 / 调用自定义函数
调用函数 - Python内置函数 / 导入模块和函数
函数的参数 - 默认参数 / 可变参数 / 关键字参数 / 命名关键字参数
函数的返回值 - 没有返回值 / 返回单个值 / 返回多个值
作用域问题 - 局部作用域 / 嵌套作用域 / 全局作用域 / 内置作用域 / 和作用域相关的关键字
用模块管理函数 - 模块的概念 / 用自定义模块管理函数 / 命名冲突的时候会怎样(同一个模块和不同的模块)
Day07 - 字符串和常用数据结构
字符串的使用 - 计算长度 / 下标运算 / 切片 / 常用方法
列表基本用法 - 定义列表 / 用下表访问元素 / 下标越界 / 添加元素 / 删除元素 / 修改元素 / 切片 / 循环遍历
列表常用操作 - 连接 / 复制(复制元素和复制数组) / 长度 / 排序 / 倒转 / 查找
生成列表 - 使用range创建数字列表 / 生成表达式 / 生成器
元组的使用 - 定义元组 / 使用元组中的值 / 修改元组变量 / 元组和列表转换
集合基本用法 - 集合和列表的区别 / 创建集合 / 添加元素 / 删除元素 / 清空
集合常用操作 - 交集 / 并集 / 差集 / 对称差 / 子集 / 超集
字典的基本用法 - 字典的特点 / 创建字典 / 添加元素 / 删除元素 / 取值 / 清空
字典常用操作 - keys()方法 / values()方法 / items()方法 / setdefault()方法
基础练习 - 跑马灯效果 / 列表找最大元素 / 统计考试成绩的平均分 / Fibonacci数列 / 杨辉三角
综合案例 - 双色球选号 / 井字棋
Day08 - 面向对象编程基础
类和对象 - 什么是类 / 什么是对象 / 面向对象其他相关概念
定义类 - 基本结构 / 属性和方法 / 构造器 / 析构器 / __str__方法
使用对象 - 创建对象 / 给对象发消息
面向对象的四大支柱 - 抽象 / 封装 / 继承 / 多态
基础练习 - 定义学生类 / 定义时钟类 / 定义图形类 / 定义汽车类
Day09 - 面向对象进阶
属性 - 类属性 / 实例属性 / 属性访问器 / 属性修改器 / 属性删除器 / 使用__slots__
类中的方法 - 实例方法 / 类方法 / 静态方法
运算符重载 - __add__ / __sub__ / __or__ /__getitem__ / __setitem__ / __len__ / __repr__ / __gt__ / __lt__ / __le__ / __ge__ / __eq__ / __ne__ / __contains__
类(的对象)之间的关系 - 关联 / 继承 / 依赖
继承和多态 - 什么是继承 / 继承的语法 / 调用父类方法 / 方法重写 / 类型判定 / 多重继承 / 菱形继承(钻石继承)和C3算法
综合案例 - 工资结算系统 / 图书自动折扣系统 / 自定义分数类
Day10 - 图形用户界面和游戏开发
使用tkinter开发GUI
使用pygame三方库开发游戏应用
“大球吃小球”游戏
Day11 - 文件和异常
- 读文件 - 读取整个文件 / 逐行读取 / 文件路径
- 写文件 - 覆盖写入 / 追加写入 / 文本文件 / 二进制文件
- 异常处理 - 异常机制的重要性 / try-except代码块 / else代码块 / finally代码块 / 内置异常类型 / 异常栈 / raise语句
- 数据持久化 - CSV文件概述 / csv模块的应用 / JSON数据格式 / json模块的应用
Day12 - 字符串和正则表达式
- 字符串高级操作 - 转义字符 / 原始字符串 / 多行字符串 / in和 not in运算符 / is开头的方法 / join和split方法 / strip相关方法 / pyperclip模块 / 不变字符串和可变字符串 / StringIO的使用
- 正则表达式入门 - 正则表达式的作用 / 元字符 / 转义 / 量词 / 分组 / 零宽断言 /贪婪匹配与惰性匹配懒惰 / 使用re模块实现正则表达式操作(匹配、搜索、替换、捕获)
- 使用正则表达式 - re模块 / compile函数 / group和groups方法 / match方法 / search方法 / findall和finditer方法 / sub和subn方法 / split方法
- 应用案例 - 使用正则表达式验证输入的字符串
Day13 - 进程和线程
- 进程和线程的概念 - 什么是进程 / 什么是线程 / 多线程的应用场景
- 使用进程 - fork函数 / multiprocessing模块 / 进程池 / 进程间通信
- 使用线程 - thread模块 / threading模块 / Thread类 / Lock类 / Condition类 / 线程池
Day14 - 网络编程入门和网络应用开发
- 计算机网络基础 - 计算机网络发展史 / “TCP-IP”模型 / IP地址 / 端口 / 协议 / 其他相关概念
- 网络应用模式 - “客户端-服务器”模式 / “浏览器-服务器”模式
- 基于HTTP协议访问网络资源 - 网络API概述 / 访问URL / requests模块 / 解析JSON格式数据
- Python网络编程 - 套接字的概念 / socket模块 / socket函数 / 创建TCP服务器 / 创建TCP客户端 / 创建UDP服务器 / 创建UDP客户端 / SocketServer模块
- 电子邮件 - SMTP协议 / POP3协议 / IMAP协议 / smtplib模块 / poplib模块 / imaplib模块
- 短信服务 - 调用短信服务网关
Day15 - 图像和文档处理
- 用Pillow处理图片 - 图片读写 / 图片合成 / 几何变换 / 色彩转换 / 滤镜效果
- 读写Word文档 - 文本内容的处理 / 段落 / 页眉和页脚 / 样式的处理
- 读写Excel文件 - xlrd模块 / xlwt模块
- 生成PDF文件 - pypdf2模块 / reportlab模块
Day16~Day20 - Python语言进阶
- 常用数据结构
- 函数的高级用法 - “一等公民” / 高阶函数 / Lambda函数 / 作用域和闭包 / 装饰器
- 面向对象高级知识 - “三大支柱” / 类与类之间的关系 / 垃圾回收 / 魔术属性和方法 / 混入 / 元类 / 面向对象设计原则 / GoF设计模式
- 迭代器和生成器 - 相关魔术方法 / 创建生成器的两种方式 /
- 并发和异步编程 - 多线程 / 多进程 / 异步IO / async和await
Day21~30 - Web前端入门
- 用HTML标签承载页面内容
- 用CSS渲染页面
- 用JavaScript处理交互式行为
- jQuery入门和提高
- Vue.js入门
- Element的使用
- Bootstrap的使用
Day31~35 - 玩转Linux操作系统
- 操作系统发展史和Linux概述
- Linux基础命令
- Linux中的实用程序
- Linux的文件系统
- Vim编辑器的应用
- 环境变量和Shell编程
- 软件的安装和服务的配置
- 网络访问和管理
- 其他相关内容
Day36~40 - 数据库基础和进阶
- 关系型数据库MySQL
- 关系型数据库概述
- MySQL的安装和使用
- SQL的使用
- DDL - 数据定义语言 - create / drop / alter
- DML - 数据操作语言 - insert / delete / update / select
- DCL - 数据控制语言 - grant / revoke
- 相关知识
- 范式理论 - 设计二维表的指导思想
- 数据完整性
- 数据一致性
- 在Python中操作MySQL
- NoSQL入门
- NoSQL概述
- Redis概述
- Mongo概述
Day41~55 - 实战Django
Day41 - 快速上手
- Web应用工作原理和HTTP协议
- Django框架概述
- 5分钟快速上手
- 使用视图模板
Day42 - 深入模型
- 关系型数据库配置
- 管理后台的使用
- 使用ORM完成对模型的CRUD操作
- Django模型最佳实践
- 模型定义参考
Day43 - 静态资源和Ajax请求
- 加载静态资源
- 用Ajax请求获取数据
Day44 - 表单的应用
- 表单和表单控件
- 跨站请求伪造和CSRF令牌
- Form和ModelForm
- 表单验证
Day45 - Cookie和Session
- 实现用户跟踪
- cookie和session的关系
- Django框架对session的支持
- 视图函数中的cookie读写操作
Day46 - 报表和日志
- 通过HttpResponse修改响应头
- 使用StreamingHttpResponse处理大文件
- 使用xlwt生成Excel报表
- 使用reportlab生成PDF报表
- 使用ECharts生成前端图表
- 配置日志和Django-Debug-Toolbar
Day47 - 中间件的应用
- 什么是中间件
- Django框架内置的中间件
- 自定义中间件及其应用场景
Day48 - 前后端分离开发入门
- 返回JSON格式的数据
- 用Vue.js渲染页面
Day49 - RESTful架构和DRF入门
Day50 - RESTful架构和DRF进阶
Day51 - 使用缓存
- 网站优化第一定律
- 在Django项目中使用Redis提供缓存服务
- 在视图函数中读写缓存
- 使用装饰器实现页面缓存
- 为数据接口提供缓存服务
Day52 - 文件上传和富文本编辑
- 文件上传表单控件和图片文件预览
- 服务器端如何处理上传的文件
- 富文本编辑器概述
- wangEditor的使用
Day53 - 短信和邮件
- 常用短信网关平台介绍
- 使用螺丝帽发送短信
- Django框架对邮件服务的支持
Day54 - 异步任务和定时任务
- 网站优化第二定律
- 配置消息队列服务
- 在项目中使用celery实现任务异步化
- 在项目中使用celery实现定时任务
Day55 - 单元测试和项目上线
- Python中的单元测试
- Django框架对单元测试的支持
- 使用版本控制系统
- 配置和使用uWSGI
- 动静分离和Nginx配置
- 配置HTTPS
Day56~60 - 实战Flask
Day56 - Flask入门
Day57 - 模板的使用
Day58 - 表单的处理
Day59 - 数据库操作
Day60 - 项目实战
Day61~65 - 实战Tornado
Day61 - 预备知识
- 并发编程
- I/O模式和事件驱动
Day62 - Tornado入门
- Tornado概述
- 5分钟上手Tornado
- 路由解析
- 请求处理器
Day63 - 异步化
- aiomysql和aioredis的使用
Day64 - WebSocket的应用
- WebSocket简介
- WebSocket服务器端编程
- WebSocket客户端编程
- 项目:Web聊天室
Day65 - 项目实战
- 前后端分离开发和接口文档的撰写
- 使用Vue.js实现前端渲染
- 使用ECharts实现报表功能
- 使用WebSocket实现推送服务
Day66~75 - 爬虫开发
Day66 - 网络爬虫和相关工具
- 网络爬虫的概念及其应用领域
- 网络爬虫的合法性探讨
- 开发网络爬虫的相关工具
- 一个爬虫程序的构成
Day67 - 数据采集和解析
- 数据采集的标准和三方库
- 页面解析的三种方式:正则表达式解析 / XPath解析 / CSS选择器解析
Day68 - 存储数据
- 如何存储海量数据
- 实现数据的缓存
Day69 - 并发下载
- 多线程和多进程
- 异步I/O和协程
- async和await关键字的使用
- 三方库aiohttp的应用
Day70 - 解析动态内容
- JavaScript逆向工程
- 使用Selenium获取动态内容
Day71 - 表单交互和验证码处理
- 自动提交表单
- Cookie池的应用
- 验证码处理
Day72 - Scrapy入门
- Scrapy爬虫框架概述
- 安装和使用Scrapy
Day73 - Scrapy高级应用
- Spider的用法
- 中间件的应用:下载中间件 / 蜘蛛中间件
- Scrapy对接Selenium抓取动态内容
- Scrapy部署到Docker
Day74 - Scrapy分布式实现
- 分布式爬虫的原理
- Scrapy分布式实现
- 使用Scrapyd实现分布式部署
Day75 - 爬虫项目实战
- 爬取招聘网站数据
- 爬取房地产行业数据
- 爬取二手车交易平台数据
Day76~90 - 数据处理和机器学习
Day76 - 机器学习基础
Day77 - Pandas的应用
Day78 - NumPy和SciPy的应用
Day79 - Matplotlib和数据可视化
Day80 - k最近邻(KNN)分类
Day81 - 决策树
Day82 - 贝叶斯分类
Day83 - 支持向量机(SVM)
Day84 - K-均值聚类
Day85 - 回归分析
Day86 - 大数据分析入门
Day87 - 大数据分析进阶
Day88 - Tensorflow入门
Day89 - Tensorflow实战
Day90 - 推荐系统
Day91~100 - 团队项目开发
第91天:团队项目开发准备
- 软件过程模型
- 经典过程模型(瀑布模型)
- 可行性分析(研究做还是不做),输出《可行性分析报告》。
- 需求分析(研究做什么),输出《需求规格说明书》和产品界面原型图。
- 概要设计和详细设计,输出概念模型图、物理模型图、类图、时序图等。
- 编码 / 测试。
- 上线 / 维护。
- 敏捷开发(Scrum)- 产品所有者、Scrum Master、研发人员 - Sprint
- 产品的Backlog(用户故事、产品原型)。
- 计划会议(评估和预算)。
- 日常开发(站立会议、番茄工作法、结对编程、测试先行、代码重构……)。
- 修复bug(问题描述、重现步骤、测试人员、被指派人)。
- 评审会议(Showcase)。
- 回顾会议(当前周期做得好和不好的地方)。
补充:敏捷软件开发宣言
- 个体和互动 高于 流程和工具
- 工作的软件 高于 详尽的文档
- 客户合作 高于 合同谈判
- 响应变化 高于 遵循计划

角色:产品所有者(决定做什么,能对需求拍板的人)、团队负责人(解决各种问题,专注如何更好的工作,屏蔽外部对开发团队的影响)、开发团队(项目执行人员,具体指开发人员和测试人员)。
准备工作:商业案例和资金、合同、憧憬、初始产品需求、初始发布计划、入股、组建团队。
敏捷团队通常人数为8-10人。
工作量估算:将开发任务量化,包括原型、Logo设计、UI设计、前端开发等,尽量把每个工作分解到最小任务量,最小任务量标准为工作时间不能超过两天,然后估算总体项目时间。把每个任务都贴在白板上面,白板上分三部分:to do(待完成)、in progress(进行中)和done(已完成)。
- 项目团队组建
- 团队的构成和角色
说明:谢谢付祥英女士绘制了下面这张精美的公司组织架构图。

- 编程规范和代码审查(flake8、pylint)

- Python中的一些“惯例”(请参考《Python惯例-如何编写Pythonic的代码》)
- 影响代码可读性的原因:
- 代码注释太少或者没有注释
- 代码破坏了语言的最佳实践
- 反模式编程(意大利面代码、复制-黏贴编程、自负编程、……)
- 团队开发工具介绍
请参考《团队项目开发》。
项目选题和理解业务
- 选题范围设定
- CMS(用户端):新闻聚合网站、问答/分享社区、影评/书评网站等。
- MIS(用户端+管理端):KMS、KPI考核系统、HRS、CRM系统、供应链系统、仓储管理系统等。
- App后台(管理端+数据接口):二手交易类、报刊杂志类、小众电商类、新闻资讯类、旅游类、社交类、阅读类等。
- 其他类型:自身行业背景和工作经验、业务容易理解和把控。
- 需求理解、模块划分和任务分配
- 需求理解:头脑风暴和竞品分析。
- 模块划分:画思维导图(XMind),每个模块是一个枝节点,每个具体的功能是一个叶节点(用动词表述),需要确保每个叶节点无法再生出新节点,确定每个叶子节点的重要性、优先级和工作量。
- 任务分配:由项目负责人根据上面的指标为每个团队成员分配任务。

- 制定项目进度表(每日更新)
第92天:Docker的使用
第93天:数据库设计和OOAD
概念模型和正向工程
- UML(统一建模语言)的类图

- 通过模型创建表(正向工程)
python manage.py makemigrations app python manage.py migrate
物理模型和反向工程
- PowerDesigner

2.通过数据表创建模型(反向工程)
python manage.py inspectdb > app/models.py
第94天:网络API接口设计
第95天:使用Django开发项目
项目开发中的公共问题
- 数据库的配置(多数据库、主从复制、数据库路由)
- 缓存的配置(分区缓存、键设置、超时设置、主从复制、故障恢复(哨兵))
- 日志的配置
- 分析和调试(Django-Debug-ToolBar)
- 好用的Python模块(日期计算、图像处理、数据加密、三方API)
REST API设计
- RESTful架构
- API接口文档的撰写
项目中的重点难点剖析
- 使用缓存缓解数据库压力 - Redis
- 使用消息队列做解耦合和削峰 - Celery + RabbitMQ
第96天:软件测试和自动化测试
单元测试
- 测试的种类
- 编写单元测试(unittest、pytest、nose2、tox、ddt、……)
- 测试覆盖率(coverage)
项目部署
- 部署前的准备工作
- 关键设置(SECRET_KEY / DEBUG / ALLOWED_HOSTS / 缓存 / 数据库)
- HTTPS / CSRF_COOKIE_SECUR / SESSION_COOKIE_SECURE
- 日志相关配置
- Linux常用命令回顾
- Linux常用服务的安装和配置
- uWSGI/Gunicorn和Nginx的使用
- Gunicorn和uWSGI的比较
- 对于不需要大量定制化的简单应用程序,Gunicorn是一个不错的选择,uWSGI的学习曲线比Gunicorn要陡峭得多,Gunicorn的默认参数就已经能够适应大多数应用程序。
- uWSGI支持异构部署。
- 由于Nginx本身支持uWSGI,在线上一般都将Nginx和uWSGI捆绑在一起部署,而且uWSGI属于功能齐全且高度定制的WSGI中间件。
- 在性能上,Gunicorn和uWSGI其实表现相当。
- 虚拟化技术(Docker)
性能测试
- AB的使用
- SQLslap的使用
- sysbench的使用
自动化测试
- 使用Shell和Python进行自动化测试
- 使用Selenium实现自动化测试
- Selenium IDE
- Selenium WebDriver
- Selenium Remote Control
- 测试工具Robot Framework介绍
第97天:电商网站技术要点剖析
第98天:项目部署上线和性能调优
- MySQL数据库调优
- Web服务器性能优化
3.代码性能调优
- 多线程
- 异步化
4.静态资源访问优化
- 云存储
- CDN
第99天:面试中的公共问题
第100天:英语面试
作者:骆昊 (jackfrued)
====================
笔记链接(基于Python 2.7):
- Github:lijin-THU/notes-python
- Nbviewer:Jupyter Notebook Viewer
- 网页:lijin-thu.github.io
笔记目录:
- 01. Python 工具
- 02. Python 基础
- 02.01 Python 入门演示
- 02.02 Python 数据类型
- 02.03 数字
- 02.04 字符串
- 02.05 索引和分片
- 02.06 列表
- 02.07 可变和不可变类型
- 02.08 元组
- 02.09 列表与元组的速度比较
- 02.10 字典
- 02.11 集合
- 02.12 不可变集合
- 02.13 Python 赋值机制
- 02.14 判断语句
- 02.15 循环
- 02.16 列表推导式
- 02.17 函数
- 02.18 模块和包
- 02.19 异常
- 02.20 警告
- 02.21 文件读写
- 03. Numpy
- 03.01 Numpy 简介
- 03.02 Matplotlib 基础
- 03.03 Numpy 数组及其索引
- 03.04 数组类型
- 03.05 数组方法
- 03.06 数组排序
- 03.07 数组形状
- 03.08 对角线
- 03.09 数组与字符串的转换
- 03.10 数组属性方法总结
- 03.11 生成数组的函数
- 03.12 矩阵
- 03.13 一般函数
- 03.14 向量化函数
- 03.15 二元运算
- 03.16 ufunc 对象
- 03.17 choose 函数实现条件筛选
- 03.18 数组广播机制
- 03.19 数组读写
- 03.20 结构化数组
- 03.21 记录数组
- 03.22 内存映射
- 03.23 从 Matlab 到 Numpy
- 04. Scipy
- 04.01 SCIentific PYthon 简介
- 04.02 插值
- 04.03 概率统计方法
- 04.04 曲线拟合
- 04.05 最小化函数
- 04.06 积分
- 04.07 解微分方程
- 04.08 稀疏矩阵
- 04.09 线性代数
- 04.10 稀疏矩阵的线性代数
- 05. Python 进阶
- 05.01 sys 模块简介
- 05.02 与操作系统进行交互:os 模块
- 05.03 CSV 文件和 csv 模块
- 05.04 正则表达式和 re 模块
- 05.05 datetime 模块
- 05.06 SQL 数据库
- 05.07 对象关系映射
- 05.08 函数进阶:参数传递,高阶函数,lambda 匿名函数,global 变量,递归
- 05.09 迭代器
- 05.10 生成器
- 05.11 with 语句和上下文管理器
- 05.12 修饰符
- 05.13 修饰符的使用
- 05.14 operator, functools, itertools, toolz, fn, funcy 模块
- 05.15 作用域
- 05.16 动态编译
- 06. Matplotlib
- 06.01 Pyplot 教程
- 06.02 使用 style 来配置 pyplot 风格
- 06.03 处理文本(基础)
- 06.04 处理文本(数学表达式)
- 06.05 图像基础
- 06.06 注释
- 06.07 标签
- 06.08 figures, subplots, axes 和 ticks 对象
- 06.09 不要迷信默认设置
- 06.10 各种绘图实例
- 07. 使用其他语言进行扩展
- 07.01 简介
- 07.02 Python 扩展模块
- 07.03 Cython:Cython 基础,将源代码转换成扩展模块
- 07.04 Cython:Cython 语法,调用其他C库
- 07.05 Cython:class 和 cdef class,使用 C++
- 07.06 Cython:Typed memoryviews
- 07.07 生成编译注释
- 07.08 ctypes
- 08. 面向对象编程
- 08.01 简介
- 08.02 使用 OOP 对森林火灾建模
- 08.03 什么是对象?
- 08.04 定义 class
- 08.05 特殊方法
- 08.06 属性
- 08.07 森林火灾模拟
- 08.08 继承
- 08.09 super() 函数
- 08.10 重定义森林火灾模拟
- 08.11 接口
- 08.12 共有,私有和特殊方法和属性
- 08.13 多重继承
- 09. Theano 基础
- 09.01 Theano 简介及其安装
- 09.02 Theano 基础
- 09.03 Theano 在 Windows 上的配置
- 09.04 Theano 符号图结构
- 09.05 Theano 配置和编译模式
- 09.06 Theano 条件语句
- 09.07 Theano 循环:scan(详解)
- 09.08 Theano 实例:线性回归
- 09.09 Theano 实例:Logistic 回归
- 09.10 Theano 实例:Softmax 回归
- 09.11 Theano 实例:人工神经网络
- 09.12 Theano 随机数流变量
- 09.13 Theano 实例:更复杂的网络
- 09.14 Theano 实例:卷积神经网络
- 09.15 Theano tensor 模块:基础
- 09.16 Theano tensor 模块:索引
- 09.17 Theano tensor 模块:操作符和逐元素操作
- 09.18 Theano tensor 模块:nnet 子模块
- 09.19 Theano tensor 模块:conv 子模块
- 10. 有趣的第三方模块
- 11. 有用的工具
- 11.01 pprint 模块:打印 Python 对象
- 11.02 pickle, cPickle 模块:序列化 Python 对象
- 11.03 json 模块:处理 JSON 数据
- 11.04 glob 模块:文件模式匹配
- 11.05 shutil 模块:高级文件操作
- 11.06 gzip, zipfile, tarfile 模块:处理压缩文件
- 11.07 logging 模块:记录日志
- 11.08 string 模块:字符串处理
- 11.09 collections 模块:更多数据结构
- 11.10 requests 模块:HTTP for Human
- 12. Pandas
=================
链接:https://www.zhihu.com/question/29138020/answer/72193349
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
力。
Python 的设计哲学之一就是简单易学,体现在两个方面:- 语法简洁明了:相对 Ruby 和 Perl,它的语法特性不多不少,大多数都很简单直接,不玩儿玄学。
- 切入点很多:Python 可以让你可以做很多事情,科学计算和数据分析、爬虫、Web 网站、游戏、命令行实用工具等等等等,总有一个是你感兴趣并且愿意投入时间的。
废话不多说,学会一门语言的捷径只有一个: Getting Started
¶ 起步阶段
任何一种编程语言都包含两个部分:硬知识和软知识,起步阶段的主要任务是掌握硬知识。
°1 硬知识
“硬知识”指的是编程语言的语法、算法和数据结构、编程范式等,例如:变量和类型、循环语句、分支、函数、类。这部分知识也是具有普适性的,看上去是掌握了一种语法,实际是建立了一种思维。例如:让一个 Java 程序员去学习 Python,他可以很快的将 Java 中的学到的面向对象的知识 map 到 Python 中来,因此能够快速掌握 Python 中面向对象的特性。
如果你是刚开始学习编程的新手,一本可靠的语法书是非常重要的。它看上去可能非常枯燥乏味,但对于建立稳固的编程思维是必不可少。
下面列出了一些适合初学者入门的教学材料:
❖「笨方法学 Python」:http://learnpythonthehardway.org/book/
这本书在讲解 Python 的语法成分时,还附带大量可实践的例子,非常适合快速起步。
❖「廖雪峰的 Python 2.7 教程」:Home - 廖雪峰的官方网站
Python 中文教程的翘楚,专为刚刚步入程序世界的小白打造。
❖「The Hitchhiker’s Guide to Python!」:The Hitchhiker’s Guide to Python!
这本指南着重于 Python 的最佳实践,不管你是 Python 专家还是新手,都能获得极大的帮助。
❖「Python 官方文档」:Our Documentation
实践中大部分问题,都可以在官方文档中找到答案。
❖ 辅助工具:Python Tutor
一个 Python 对象可视化的项目,用图形辅助你理解 Python 中的各种概念。
用一种方法,最好是只有一种方法来做一件事。
学习也是一样,虽然推荐了多种学习资料,但实际学习的时候,最好只选择其中的一个,坚持看完。
必要的时候,可能需要阅读讲解数据结构和算法的书,这些知识对于理解和使用 Python 中的对象模型有着很大的帮助。
°2 软知识
“软知识”则是特定语言环境下的语法技巧、类库的使用、IDE的选择等等。这一部分,即使完全不了解不会使用,也不会妨碍你去编程,只不过写出的程序,看上去显得“傻”了些。
对这些知识的学习,取决于你尝试解决的问题的领域和深度。对初学者而言,起步阶段极易走火,或者在选择 Python 版本时徘徊不决,一会儿看 2.7 一会儿又转到 3.0,或者徜徉在类库的大海中无法自拔,Scrapy,Numpy,Django 什么都要试试,或者参与编辑器圣战、大括号缩进探究、操作系统辩论赛等无意义活动,或者整天跪舔语法糖,老想着怎么一行代码把所有的事情做完,或者去构想圣洁的性能安全通用性健壮性全部满分的解决方案。
很多“大牛”都会告诫初学者,用这个用那个,少走弯路,这样反而把初学者推向了真正的弯路。
还不如告诉初学者,学习本来就是个需要你去走弯路出 Bug,只能脚踏实地,没有奇迹只有狗屎的过程。
选择一个方向先走下去,哪怕脏丑差,走不动了再看看有没有更好的解决途径。
自己走了弯路,你才知道这么做的好处,才能理解为什么人们可以手写状态机去匹配却偏要发明正则表达式,为什么面向过程可以解决却偏要面向对象,为什么我可以操纵每一根指针却偏要自动管理内存,为什么我可以嵌套回调却偏要用 Promise...
更重要的时,你会明白,高层次的解决方法都是对低层次的封装,并不是任何情况下都是最有效最合适的。
技术涌进就像波浪一样,那些陈旧的封存已久的技术,消退了迟早还会涌回的。就像现在移动端应用、手游和 HTML5 的火热,某些方面不正在重演过去 PC 的那些历史么?
因此,不要担心自己走错路误了终身,坚持并保持进步才是正道。
起步阶段的核心任务是掌握硬知识,软知识做适当了解,有了稳固的根,粗壮的枝干,才能长出浓密的叶子,结出甜美的果实。
¶ 发展阶段
完成了基础知识的学习,必定会感到一阵空虚,怀疑这些语法知识是不是真的有用。
没错,你的怀疑是非常正确的。要让 Python 发挥出它的价值,当然不能停留在语法层面。
发展阶段的核心任务,就是“跳出 Python,拥抱世界”。
在你面前会有多个分支:科学计算和数据分析、爬虫、Web 网站、游戏、命令行实用工具等等等等,这些都不是仅仅知道 Python 语法就能解决的问题。
拿爬虫举例,如果你对计算机网络,HTTP协议,HTML,文本编码,JSON一无所知,你能做好这部分的工作么?而你在起步阶段的基础知识也同样重要,如果你连循环递归怎么写都还要查文档,连 BFS 都不知道怎么实现,这就像工匠做石凳每次起锤都要思考锤子怎么使用一样,非常低效。
在这个阶段,不可避免要接触大量类库,阅读大量书籍的。
°1 类库方面
「Awesome Python 项目」:vinta/awesome-python · GitHub
这里列出了你在尝试解决各种实际问题时,Python 社区已有的工具型类库,如下图所示:

你可以按照实际需求,寻找你需要的类库。
至于相关类库如何使用,必须掌握的技能便是阅读文档。由于开源社区大多数文档都是英文写成的,所以,英语不好的同学,需要恶补下。
°2 书籍方面:
这里我只列出一些我觉得比较有一些帮助的书籍,详细的请看豆瓣的书评:
科学和数据分析:
❖「集体智慧编程」:集体智慧编程 (豆瓣)
❖「数学之美」:数学之美 (豆瓣)
❖「统计学习方法」:统计学习方法 (豆瓣)
❖「Pattern Recognition And Machine Learning」:Pattern Recognition And Machine Learning (豆瓣)
❖「数据科学实战」:数据科学实战 (豆瓣)
❖「数据检索导论」:信息检索导论 (豆瓣)
爬虫:
❖「HTTP 权威指南」:HTTP权威指南 (豆瓣)
Web 网站:
❖「HTML & CSS 设计与构建网站」:HTML & CSS设计与构建网站 (豆瓣)
...
列到这里已经不需要继续了。
聪明的你一定会发现上面的大部分书籍,并不是讲 Python 的书,而更多的是专业知识。
事实上,这里所谓“跳出 Python,拥抱世界”,其实是发现 Python 和专业知识相结合,能够解决很多实际问题。这个阶段能走到什么程度,更多的取决于自己的专业知识。
¶ 深入阶段
这个阶段的你,对 Python 几乎了如指掌,那么你一定知道 Python 是用 C 语言实现的。
可是 Python 对象的“动态特征”是怎么用相对底层,连自动内存管理都没有的C语言实现的呢?这时候就不能停留在表面了,勇敢的拆开 Python 的黑盒子,深入到语言的内部,去看它的历史,读它的源码,才能真正理解它的设计思路。
这里推荐一本书:
「Python 源码剖析」:Python源码剖析 (豆瓣)
这本书把 Python 源码中最核心的部分,给出了详细的阐释,不过阅读此书需要对 C 语言内存模型和指针有着很好的理解。
另外,Python 本身是一门杂糅多种范式的动态语言,也就是说,相对于 C 的过程式、 Haskell 等的函数式、Java 基于类的面向对象而言,它都不够纯粹。换而言之,编程语言的“道学”,在 Python 中只能有限的体悟。学习某种编程范式时,从那些面向这种范式更加纯粹的语言出发,才能有更深刻的理解,也能了解到 Python 语言的根源。
这里推荐一门公开课
「编程范式」:斯坦福大学公开课:编程范式
讲师高屋建瓴,从各种编程范式的代表语言出发,给出了每种编程范式最核心的思想。
值得一提的是,这门课程对C语言有非常深入的讲解,例如C语言的范型和内存管理。这些知识,对阅读 Python 源码也有大有帮助。
Python 的许多最佳实践都隐藏在那些众所周知的框架和类库中,例如 Django、Tornado 等等。在它们的源代码中淘金,也是个不错的选择。
¶ 最后的话
每个人学编程的道路都是不一样的,其实大都殊途同归,没有迷路的人只有不能坚持的人。虽然听上去有点鸡汤,但是这是事实。
链接:https://www.zhihu.com/question/29138020/answer/394020225
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
1.第一 python入门基础:这些都是基础,基本概念必须清楚!
学习Python需要掌握如下基础知识以及相关技能。
1.Python基础知识(变量、语句、数据类型、数值类型、字符串、布尔类型、列表、字典、元组、条件语句、循环语句、函数、装饰器、面向对象、网络socket、爬虫)
2.Python基础库(模块、包、系统模块、三方模块)
3.python文件处理(读、写、执行、)
4.python字符统计
5.python数据排序
2.学习方法:万虐终成神!敲代码,解决BUG才是学习,无数次的看视频不是学习,至少不会学好。
只记Python基础语法,却没什么鸟用。就像幼儿园,老师在黑板上写的‘肉’字,记住这个字咋写,一笔一划的记住,只需要半天,但是把这个词和你平时吃的东西绑定,以至于后面你想到这个字,就流口水,需要日常的重复训练。
同理:无方向的看书,看视频也没什么用,其实可以通过直接实战来上手,比如:
文件操作
字符排序
网络编程
错误的学习方法:
很多人在学习Python的时候常常会犯下面一种情况:
买一本厚厚的编程指南,逼自己看完,记住每个语法,闭门看书三个月,吃透一本书,最后一行代码也写不出来。
正确的学习方法:
编程就像骑自行车,买一本<<骑自行车大全>>是没有什么用的。
正确姿势:掌握最基础的姿势,就可以骑上车出发了,实际联系几天,摔几跤,基本就学会了。
3.自我进行测评:基础门槛,不过需要找原因并解决。
很多朋友反馈:Python基础语法都学会了,但不知如何写项目进阶?
1.List,Dict特性倒背如流,就是无法写出实际的项目。
2.各种书籍也看,写不出东西。
3.各种视频也看,写不出东西。
4.各种大会也去,名词高大上,但是没学到具体的技能。
对自我进行检测:
1.给你一个字符串“come baby,python rocks!” 如何统计里面字母o出现的次数!
思路:遍历字符串,定义一个变量,每次o出现,都+1
2.给你一个字符串“come baby,python rocks!” 如何统计这里面所有字母出现的次数!(普通变量肯定无法完成。)
思路:需要使用字典这类复杂的数据结构处理,字母当key,出现的次数当value,每个key出现,对应的value+1
3.给你一个字符串“come baby,python rocks!” 如何统计这里面字母出现次数的前三名!
思路:排序,取出前三
后续扩展练习:
1.给你一个字符串“come baby,python rocks!” 怎么统计出现次数前三的字母。
2.一个nginx日志文件,怎么统计IP出现次数前三的url。
3.一个nginx日志文件,统计IP出现前三后,如何存入MySQL数据库。
4.存入MySQL中的日志文件,如何输出给浏览器端显示。
5.如何美化前端表格等等。
4.重要学习部分:python库怎么学
模块
将多个代码块(按功能)定义到同一个文件中。别的文件中使用时则先导入模块,在调用模块内变量或函数。
模块命名要符合python变量的命名规范
1.建议全小写英文字母和数字
2.避免与常用模块或第三方模块名称冲突
控制模块内代码在使用python mod.py时执行,在导入时不执行
1.通过Global内变量__name__进行判断
2.当以python mod.py运行脚本时__name__变量为__main__字符串
3.当以模块导入时__name__为模块名称字符串
包
将不同模块文件放在不同文件夹内,包文件夹下面需要有__init__.py文件用以声明该文件为Python包。
使用时需要从包内导入模块后调用模块中变量和函数。
常用系统模块:
os,sys,time,datetime,urllib,xml,json,email,csv,collections,math,zipfile,trafile,hashlib
常用三方模块:
requests,pyquery,django,flask,mysqlclient,paramiko,redis,lxml,dateutils,ipaddr,netaddr
模块学习方法:
1.先知道有没有
2.用的时候在查
内置工具:dir、help
搜索引擎:google、百度
5.再说一个python目前一个热点:python Web应用(python全栈)
1.Python基础入门(入门、数据类型、条件表达、循环语句)
2.Python基础进阶(文件操作、函数、装饰器、模块、面向对象、网络编程)
3.Python前端知识(Html、Css、Js、Jquery、Bootstrap、)
4.Python高级用法(Django、Flask、数据库操作、MVC、ORM、Admin、template)
5.Python项目实战(电商项目、爬虫项目、常用组件、运维项目、代码调优)
6.Python高级进阶(数据算法、代码规范、面试技巧)
重要:多抄、多写、多想、多问、多看、多听、多说
1.学习编程就是为了解决实际的问题,把自己在工作或学习中的重复工作程序化
2.谷歌和度娘
3.加入开源社区(多看、多分享、多交流)
4.参加培训辅导(仔细听课、跟上课堂学习,有问题做记录,课后查阅资料或请求他人)
5.善于记录笔记,不断总结,查漏补缺。
6.python前景之一:大数据分析
1.python基础入门(入门、数据类型、条件表达、循环语句)
2.python基础进阶(文件操作、函数、装饰器、模块、面向对象、网络编程)
3.python数据采集:(外部数据源导入分析&爬虫自己采集数据源分析)
4.数据分析:(各种库,如Pandas库,Numpy库必备数据库)
5.数据可视化:(matplotlib库)
重要:实用即可,最具价值,切莫花哨不适用
7.python前景之二:机器学习
- 直接看应用吧:看起来是个云端的概念
1.计算机视觉
典型的应用包括:人脸识别、车牌识别、扫描文字识别、图片内容识别、图片搜索等等。
2.自然语言处理
典型的应用包括:搜索引擎智能匹配、文本内容理解、文本情绪判断,语音识别、输入法、机器翻译等等。
3.社会网络分析
典型的应用包括:用户画像、网络关联分析、欺诈作弊发现、热点发现等等。
4.推荐
典型的应用包括:虾米音乐的“歌曲推荐”,某宝的“猜你喜欢”等等。
- 学习路线:
- 数学基础:微积分、线性代数、概率与统计、典型算法
2.编程语言、工具和环境:python
python有着全品类的数据科学工具,从数据获取、数据清洗到整合各种算法都做得非常全面。
- 网页爬虫: scrapy
- 数据挖掘:
- pandas:模拟R,进行数据浏览与预处理。
- numpy:数组运算。
- scipy:高效的科学计算。
- matplotlib:非常方便的数据可视化工具。
- 机器学习:
- scikit-learn:远近闻名的机器学习package。未必是最高效的,但是接口真心封装得好,几乎所有的机器学习算法输入输出部分格式都一致。而它的支持文档甚至可以直接当做教程来学习,非常用心。对于不是非常高纬度、高量级的数据,scikit-learn胜任得非常好(有兴趣可以看看sklearn的源码,也很有意思)。
- libsvm:高效率的svm模型实现(了解一下很有好处,libsvm的系数数据输入格式,在各处都非常常见)
- keras/TensorFlow:对深度学习感兴趣的同学,也能很方便地搭建自己的神经网络了。
- 自然语言处理:
- nltk:自然语言处理的相关功能做得非常全面,有典型语料库,而且上手也非常容易。
- 交互式环境:
- ipython notebook:能直接打通数据到结果的通道,方便至极。强力推荐。
3.编程语言、工具和环境:R
R最大的优势是开源社区,聚集了非常多功能强大可直接使用的包,绝大多数的机器学习算法在R中都有完善的包可直接使用,同时文档也非常齐全。常见的package包括:RGtk2, pmml, colorspace, ada, amap, arules, biclust, cba, descr, doBy, e1071, ellipse等等。另外,值得一提的是R的可视化效果做得非常不错,而这对于机器学习是非常有帮助的。
4.其他语言
相应资深程序员GG的要求,再补充一下Java和C++相关机器学习package。
- Java系列
- WEKA Machine Learning Workbench 相当于java中的scikit-learn
- 其他的工具如 Massive Online Analysis(MOA)、MEKA 、 Mallet等也非常有名。
- C++系列
- mlpack,高效同时可扩充性非常好的机器学习库。
- Shark:文档齐全的老牌C++机器学习库。
链接:https://www.zhihu.com/question/29138020/answer/394020225
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
环境管理
管理 Python 版本和环境的工具
- p:非常简单的交互式 python 版本管理工具。官网
- pyenv:简单的 Python 版本管理工具。官网
- Vex:可以在虚拟环境中执行命令。官网
- virtualenv:创建独立 Python 环境的工具。官网
- virtualenvwrapper:virtualenv 的一组扩展。官网
包管理
管理包和依赖的工具。
- pip:Python 包和依赖关系管理工具。官网
- pip-tools:保证 Python 包依赖关系更新的一组工具。官网
- conda:跨平台,Python 二进制包管理工具。官网
- Curdling:管理 Python 包的命令行工具。官网
- wheel:Python 分发的新标准,意在取代 eggs。官网
包仓库
本地 PyPI 仓库服务和代理。
- warehouse:下一代 PyPI。官网
- Warehouse:PyPA 提供的 PyPI 镜像工具。官网 bandersnatch
分发
打包为可执行文件以便分发。
- PyInstaller:将 Python 程序转换成独立的执行文件(跨平台)。官网
- dh-virtualenv:构建并将 virtualenv 虚拟环境作为一个 Debian 包来发布。官网
- Nuitka:将脚本、模块、包编译成可执行文件或扩展模块。官网
- py2app:将 Python 脚本变为独立软件包(Mac OS X)。官网
- py2exe:将 Python 脚本变为独立软件包(Windows)。官网
- pynsist:一个用来创建 Windows 安装程序的工具,可以在安装程序中打包 Python本身。官网
构建工具
将源码编译成软件。
- buildout:一个构建系统,从多个组件来创建,组装和部署应用。官网
- BitBake:针对嵌入式 Linux 的类似 make 的构建工具。官网
- fabricate:对任何语言自动找到依赖关系的构建工具。官网
- PlatformIO:多平台命令行构建工具。官网
- PyBuilder:纯 Python 实现的持续化构建工具。官网
- SCons:软件构建工具。官网
交互式解析器
交互式 Python 解析器。
- IPython:功能丰富的工具,非常有效的使用交互式 Python。官网
- bpython:界面丰富的 Python 解析器。官网
- ptpython:高级交互式Python解析器, 构建于python-prompt-toolkit 之上。官网
文件
文件管理和 MIME(多用途的网际邮件扩充协议)类型检测。
============ End
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南