实用数据挖掘与人工智能一月特训班(万门大学678课程130小时)
实用数据挖掘与人工智能一月特训班(万门大学678课程130小时)
课程名称 | 内容 | Notes |
---|---|---|
1、课程:熟悉Jupter Notebook | 1.创建新的Python环境 2.Python环境与版本 3.安装决策树可视化工具Graphviz 4.几个重要的工具包介绍 5.安装TensorFlow与Keras 6.Jupyter Notebook的基本使用技巧 7.Markdown的基本技巧 |
|
2、课程:文献与代码管理工具及统计基础 | 1. 学习方法总结 2. Mendeley介绍及安装(一) 3. Mendeley介绍及安装(二) 4. Github介绍及安装 5. Github远端连接操作 6. 答疑 7. 统计基础概述 |
|
3、课程:Python基本数据类型 | 1. 课程概述 2. 计算机语言与程序概述 3. 为什么需要编程语言 4. Python能做什么? 6. 课间答疑 7. Python2和Python3的区别 8. 编程语言的元素 9. 致敬Hello World 10. Python基本数据类型 |
|
4、课程:函数与Python基本数据结构 | 1. 函数 2. Python编码结构 3. Python模块和程序包 4. Python基本数据结构 |
|
5、课程:Numpy的基本操作 | 1. Introduction to Numpy 2. Create Arrats 3. Basic Operations of Arrays 4. Indexing, Sliciing and lterating 5. Matrix Operations 6. Array processing 7. Save and Load Array |
|
6、课程:Pandas的基本操作 | 1. Series 2. DataFrame + Titanic Example 3. Index Objects 4. Reindex 5. Drop Data 6. Slice Data 7. Data Alignment 8. Rank and Sortb |
|
7、课程:Matplotlib的基本操作 | 1. Matplotlib 2. Aggregation |
|
8、课程:什么是好的模型结果-cost function | 1. 如何定义一个模型的好坏? 2. 连续变量的模型,如何来衡量模型结果 3. 二分类问题-假设检验,p-value 4. 二分类问题-ROC&AUC 5. 什么是好的分类 6. 二分类问题-召回率,准确率 7. 二分类问题-F1-score 8. 分类模型,如何衡量模型结果? 9. imbalanced问题 |
|
9、课程:线性回归 | 1. 知识回顾 2. 为什么要使用线性回归 3. 如何计算线性回归? 4. 问题解答 5. 由最小二乘法选出的直线有没有用? 6. 线性回归参数估计的含义 7. 线性回归对数据的解释 8. 线性回归对样本及误差的要求和假设前提 9. 预测的confidence interval和prediction interval 10. imbalance问题 |
|
10、课程:逻辑回归及应用 | 1. 逻辑回归与线性回归 2. 如何计算信用分数 3. 商家如何查看芝麻信用值? 4. 寻找最合理的参数-1设计Cost Function 5. 寻找最合理的参数-2疑题解答 6. 寻找最合理的参数-3计算最优参数 7. 更进一步:从逻辑回归到SoftMax |
|
11、课程:拟合与过拟合的定义 | 1. 拟合与过拟合 2. 对抗过拟合 3. Python实现 4. 正则化Regularization 5. Ridge 6. 方差的分解 7. Bias与Variance的分解 |
|
12、课程:决策树模型 | 1. 什么是决策树 2. 游戏中的决策树分析 3. 哪个问题分的最好? 4. Decision Tree_example1 |
|
13、课程:Pandas数据操作与Ensemble Method集成算法 | 1. Combining dataframes 2. Mapping 3. Binning 4. GruopBy on Dict and Series 5. Merge 6. Outliers 7. Pivoting 8. Replace 9. Bagging(Bootstrap aggregating) 10. Boosting and Ada Boosting 11. Gradient Boosting |
|
14、课程:Airbnb数据分析 | 1. Airbnb介绍 2. Train and Test用户本身数据和营销渠道数据 3. Airbnb_DataExploration 4. Airbnb_FeatureEngineering 5. Modeling |
|
15、课程:支持向量机(SVM) | 1. 支持向量机简介与历史 2. 支持向量机分类与回归 3. 对偶问题 4. 支持向量 5. 核函数 6. 正则化与软间隔 7. 支持向量机算法总结 8. 代码实战 |
|
16、课程:自然语言处理与NLP-代码实战 | 1. 历史 2. 语言模型 3. 语言模型评价 4. 隐马尔可夫模型 5. 深度学习 6. 语言模型实战 |
|
17、课程:文字处理与Amazon评论NLP分析案例 | 1. Python文字处理基本操作回顾 2. ASCII,unicode解码与编码,utf-8 3. NLTK工具包与特朗普的任职演讲 4. 计算词频 5. 读取文字 6. 整理标签 7. 清理文字并建语料库 8. 建模 9. 调用具体模型 |
|
18、课程:网络基础概述 | 1. 网络基础概述 2. 数据和数据库 3. 计算机网络知识普及 4. 什么是网站 5. 静态网站和动态网站 6. 简单的网站服务程序 7. 什么是API 8. 如何找到API 9. 网络产品和现在网络程序 10. 答疑 |
|
19、课程:网络爬虫入门 | 1. 网络爬虫概述 2. 复习HTML 3. 强大的工具-Requests 4. 强大的工具-Beautifulsoup 5. Charity Watch 6. 弹幕爬虫 |
|
20、课程:爬虫进阶 | 1. Write Binary File 2. Read Binaty File 3. 静态文件获取 4. 认证授权 5. 爬虫进阶扩展 |
|
21、课程:正则表达式 | 1. 常见代码 2. 基本语句 3. 字符匹配和分枝条件 4. 分组 5. 后向引用和零宽断言 6. 案例分析(一) 7. 案例分析(二) |
|
22、课程:贝叶斯统计 | 1. 联合概率 2. 边缘概率 3. 条件概率 4. 贝叶斯公式 5. 流感案例 6. 图形化理解 7. 案例分析 8. 贝叶斯公式垃圾短信识别程序 9. 脑筋急转弯: 三门问题 |
|
23、课程:搜集用户信息与数据整合 | 1. 搜集用户发贴Comment Id 2. 正向编码方法 3. 如何逆向解码 4. 整理用户mid ID 5. 爬取用户信息 6. RandomForeset重新采样 |
|
24、课程:贝叶斯思维 | 1. 贝叶斯统计 2. 贝叶斯公式 3. 证明正态分布的后验分布依然是正态分布 4. 美国海岸救援案例 |
|
25、课程:BiliBili火爆剧集与观众分析 | 1. jieba分词原理 2. jieba分词使用 3. 去除NaN、分词 4. 去停用词、整理词频 5. 生成词云 6. 沿时间的动态变化: 频率与高频词 7. 二十四小时的弹幕频率分布 8. 年内的弹幕频率分布 9. 观众信息 10. 脑筋急转弯 |
|
26、课程:聚类与代码实战 | 1. 课程概要 2. 机器学习与聚类简介 3. 聚类的定义以及和分类的区别 4. 聚类相似度度量:几何距离 5. 划分聚类 6. 划分聚类—K均值算法 7. 层次聚类 8. Agglomerative clustering算法 9. 密度聚类 10. DBSCAN 11. 聚类算法总结 12. 代码实战 |
|
27、课程:商业社交媒体舆情分析 | 1. 脑筋急转弯 2. 社媒舆情分析的目的 3. 作用价值一:获取市场的必要信息 4. 如何通过舆情分析掌握时长状况 5. 作用价值二:提升决策敏感性 6. 有趣的营销发现 7. 作用价值三:寻找接触点 8. 总结:营销领域的舆情分析应用 9. 答疑 |
|
28、课程:近期推荐系统概述 | 1. 推荐系统应用场景 2. CF+矩阵分析 3. 基于图像的推荐 4. 评估推荐系统结果 |
|
29、课程:人工智能的江湖 | 1. 达特茅斯会议与第一次AI大发展 2. 第一次AI寒冬 3. 复苏与第二次AI寒冬 4. 再次复苏与神经网络翻身 5. 瞻仰大神 6. 今天的应用与影响 |
|
30、课程:机器学习在图像识别中的应用 | 1. 图像处理和机器学习有什么关系 2. 什么是机器学习? 3. 什么是图像识别? 4. 图像识别的困难在哪里 5. 图像识别的发展历史 6. 机器学习对比深度学习 7. 机器学习的工作方式 8. 机器学习的算法 9. 机器学习总结 |
|
31、课程:Pygame | 1. 学习框架梳理 2. 剩余课程安排 3. Flappy bird基本背景图像 4. 键盘操作-小鸟左右移动 5. 扑腾扑腾翅膀 6. 柱子的移动 7. 生成一系列的柱子 8. 让小鸟飞起来 9. 假如小鸟很聪明 10. 给小鸟计分 |
|
32、课程:Python控制系统 | 1. The basic self-driving loop 2. 不同的数据存储和类型 3. 安装OpenCV练习 4. 数据库基础review 5. MYSQL的简单介绍 6. 激光雷达 7. Ctypes basic |
|
33、课程:图像识别处理基础-OpenCV | 1. 读取图片 2. 读取视频 3. 绘图函数 4. OpenCV图像的基本操作 5. 颜色空间转换 6. 几何变换 7. 图像平滑 8. 形态学变换 |
|
34、课程:从游戏数据中提取feature | 1. 收集GTA5游戏数据 2. Check Data和OpenCV 3. 模型加载插件 4. C++ review 5. 模型案例分析+OpenCV process |
|
35、课程:GTA5自动驾驶项目 | 1. 作业布置 2. GTA5自动驾驶分解问题 3. GTA5游戏AI识别车道分割线 |
|
36、课程:TensorFlow的基本操作 | 1. TensorFlow的基本概念 2. TensorFlow的具体使用 3. Tensor Shapes 4. Tensor Operations 5. Tensor Slicing 6. Tensor Sequences 7. Graph 8. Session和Constant 9. Variables和Placeholders 10. Example |
|
37、课程:神经网络 | 1. 神经网络 2. 深度神经网络 3. 反向传播算法 4. 激活函数 5. 优化算法 6. 正规化 7. 神经网络代码实战 |
|
38、课程:卷积神经网络 | 1. 卷积和卷积核 2. 填充和池化 3. 深度卷积神经网络:LeNet-5 4. 深度卷积神经网络:AlexNet 5. 深度卷积神经网络:ZF-net 6. 深度卷积神经网络:VGG-16 7. 深度卷积神经网络:Inception Network 8. Residual Network 9. DenseNet |
|
39、课程:卷积神经网络的应用 | 1. 卷积神经网络应用概述 2. 物体检测:RCNN和SPP-Net 3. 物体检测:Fast R-CNN 4. 物体检测:YOLO和SSD 5. 文档的归类 6. 代码实战 |
|
40、课程:深度学习框架剖析 | 1. 深度学习系统的目标定位 2. 典型深度学习系统框架 3. 命令式编程与声明式编程等概念讲解 4. 图优化、执行引擎 5. 编程接口、分布式并行计算 6. TF多卡训练 7. 主流开源深度学习平台简析 8. 答疑 9. TensorFlow tutorial example 10. 模型训练Tricks分享 11. DL优化方法分析以及相关TF API说明 12. TensorFlow detection models 13. 实际模型项目介绍 |
|
41、课程:递归神经网络 | 1. 递归神经网络-序列问题 2. 为什么递归? 3. 递归神经网络 4. 双向递归神经网络 5. 沿时间反向传播 6. 梯度消失 |
|
42、课程:长短记忆网络与递归神经网络代码操作 | 1. 长短记忆网络 2. 伪装曹雪芹 3. 图像识别 |
|
43、课程:线性代数与数值分析 | 1. 线性代数与数值分析概述 2. 线性代数的基础定义 3. 矩阵乘积和转置 4. 矩阵性质 5. 矩阵行列式 6. 矩阵的迹和秩 7. 范数 8. 矩阵的特征值和特征向量 9. 矩阵分解 10. 矩阵微积分 11. 矩阵计算 12. 范数、向量之间的夹角 13. 对角矩阵、单位矩阵、转置矩阵和reshape 14. 行列式、秩、迹以及SVD奇异值分解 |
|
44、课程:词嵌入表示 | 1. N-元模型回顾 2. 神经语言模型 3. 递归神经网络语言模型 4. 词嵌入 5. 哈夫曼树 6. 连续词袋模型——分层Softmax 7. Skip-gram:分层Softmax 8. 连续词袋模型——负采样 9. 词向量:可视化 |
|
45、课程:递归神经网络的应用 | 1. 文本生成和情绪分析 2. 语音识别 3. 机器翻译 4. 视觉注意力机制 5. 词嵌入表示——Word2Vec 6. 词嵌入表示——RNN语言模型 7. 词嵌入表示——RNN for POS tagging |
|
46、课程:强化学习系列课程基本概念与方法总览 | 1. 复习监督学习 2. 强化学习基本概念 3. 策略与总价值 4. 强化学习系列方法总览 |
|
47、课程:马尔可夫决策过程 | 1. 马尔可夫决策过程:Markov状态转移矩阵 2. Markov Rewards Process 3. 状态价值state value 4. Bellman方程 5. 状态价值函数v.s 动作价值函数 6. 最优总价值与最优动作价值 7. Flappy bird的简单解决方法 |
|
48、课程:强化学习 | 1. 动态规划 2. 迭代法 3. 复习+Jacob方法 4. Gauss-Seidel迭代法 5. 迭代法求策略估值 6. 迭代法更新最佳策略 7. 斐波拉契数列 8. 最长递增数列 |
|
49、课程:简单的蒙特卡洛 | 1. 蒙特卡洛模拟方法介绍 2. 训练flappy bird模型 3. 整理碰壁函数与reward函数 4. 离散化环境状态 5. 由状态环境选择飞行动作 6. 处理碰壁函数与reward函数 7. 队列存飞行路径 8. 答疑 |
|
50、课程:云,计算,数据 | 1. 云计算的定义 2. NIST、云计算市场的发展条件 3. 芯片设计的取舍、并行化 4. WSC(新型数据中心)的形成、概念、优点 5. 虚拟化 6. 云计算的商业模式 7. 层级分类 8. 阿里云介绍 9. 实例创建 10. Logging模块的简单应用 |
|
51、课程:机器学习(上) | 1. 时间差分法公式 2. 蒙特卡洛法 3. TD(时间差分)的特点 4. 课件答疑 5. MC与TD对比 6. 无偏估计 7. 收敛性质 8. MC与TD收敛差异 9. Model-Free Control |
|
52、课程:机器学习(下) | 1. 函数的近似方法 2. DQN 3. Flappy bird |
|
53、课程:软件工程师、数据工程师和数据科学家职业介绍 | 1. 自我介绍及课程介绍 2. Career Path Insight 3. 软件工程师之基础课程 4. 软件工程师之面试准备与技巧 5. 大数据之协同合作 6. 数据工程师和数据科学家 7. 答疑 |
|
54、课程:金融科技-数据科学在金融业的应用和前景 | 1. 金融行业不同岗位对人才的需求 2. 金融科技用到的数据科学 3. 职位和机会 4. 数字化财富管理行业 5. 智能投顾创业公司的数据分析 6. 答疑 |
|
55、课程:深度学习经典网络分析基础 | 1. 课程安排 2. 深度学习的两大基本问题 3. 反向传播算法简介 4. 深度学习网络模型回顾 5. CNN架构发展简要流程 6. LeNet 7. 答疑——人脸识别 8. 答疑——通用检测 9. 答疑——语音识别 10. AlexNet 11. VGG 12. GoogleNet 13. ResNet 14. 经典网络简单比较、网络设计考虑 15. 答疑 |
Talk is cheap. Show me the code