1月份主要学习
0、学习记录
争取放假前把统计学习方法和西瓜书看完,年后主攻ESL\PRML和深度学习
百面适合当作知识点索引,不适合做为学习材料
分一部分时间给java的学习,开始用github,开始看论文
2月份主要学习的几本书:数学之美+ESL、花书+深度学习私房菜、Java
| 日期| 统计学习方法 | 西瓜书 | Java学习|经典论文和深度学习算法复现|其他事情
| :---- | :----| :----|:----|:----|:----|:----|
|2020/01/31 |第二天ESL | | ||初七在家窝着;每天起床的第一件事情就是看疫情看新闻
|2020/01/30 |开始看ESL | | ||初六在家窝着
|2020/01/29 | | | ||初五在家窝着;虽然疫情比较严重,有些人还是放鞭炮迎财神
|2020/01/28 | | | ||初四将路上的衣服洗了,到外面买了菜和一些生活用品;没有口罩
|2020/01/27 | | | ||初三一家人全副武装,带两个小孩,两个行李箱,两个包,回上海了;路上6个小时,已知带口罩,还得看着两个小孩的口罩有没有带好,太难熬了;上海也比较安静
|2020/01/26 | | | ||初二去超市买了一包尿不湿,将初四的火车票改签到了初三,买了点火车上给吃的东西;药房已经买不到口罩了
|2020/01/25 | | | ||初一回家给几个亲戚拜了年,赶紧回家自我隔离了;晚上跟同学的聚会取消了
|2020/01/24 | | | ||腊月30;回家上坟,看了奶奶,贴对联;晚上新闻“钟南山”通知疫情传播情况;大家开始重视疫情;晚上看了会儿晚会就睡觉了
|2020/01/23 | | | ||腊月29;在家陪刘依依玩;开始关注疫情
|2020/01/22 | | | ||回老家买了些鞭炮给刘依依完
|2020/01/21 | | | ||给小小宝办事,只通知了亲戚;没有跟同学说
|2020/01/20 | | | ||开始休假,回石家庄;5个小时的路程,带两个小孩,比较累
|2020/01/19 | | |异常与异常处理 ||今年最后一天上班,晚上回合肥;学习要继续,不要急躁
|2020/01/18 |监督/无监督学习方法总结 | |多态 ||本年度最后一个休息天;主成份和无监督的整理不记笔记;等下一轮复习的时候再补上
|2020/01/17 |主成份分析 |强化学习|继承| |强化学习暂停
|2020/01/16 |MCMC |规则学习 |封装 ||规则学习需要学习离散数学
|2020/01/15 |MCMC |规则学习 |类和对象 ||周三
|2020/01/14 |MCMC |概率图模型(学习与推断)|数组;方法 ||重点学习精确推断的2种方法,其他方法都在<统计学习方法>中有扩充
|2020/01/13 |MCMC |概率图模型(学习与推断) |常用的运算符;流程控制语句 ||早晨状态不佳
|2020/01/12 |潜在狄利克雷分布
pagerank算法 |概率图模型 | ||LDA的变分推断EM算法比较复杂,流程弄明白了,推导需要后续再仔细看一遍
|2020/01/11 |潜在狄利克雷分布 |概率图模型(D) | ||保养车;剪头发
|2020/01/10 |潜在狄利克雷分布 |强化学习(D) | ||周五
|2020/01/09 |潜在狄利克雷分布 |半监督学习(D) |Java安装;变量和常量 ||周四
|2020/01/08 |概率潜在语义分析 |半监督学习(D) | ||送老婆孩子回合肥
|2020/01/07 |潜在语义分析 |半监督学习(D) | |3.13~3.16|8号上午请假,晚上可以多看会儿书
|2020/01/06 |奇异值分解 | | |动手学3.8~3.11|晚上公司年会
|2020/01/05 |主成份分析(D) | | ||周末看书(D)
|2020/01/04 |主成份分析(D) | | ||周六看书(D)
|2020/01/03 |奇异值分解 | | ||周五晚上看完
|2020/01/02 | 聚类 | | |动手学3.4~3.7|周四
|2020/01/01 | | | |动手学3.1~3.3|周三
清华姚班主要课程:
高等数学
线性代数
计算机专业导论
Python语言编程
计算机思维导论
计算机科学与Python编程导论
计算机科学中的数学
C语言程序设计
概率论与数理统计
离散数学
抽象代数
C++语言程序设计
数据结构
计算机系统基础
数值分析
计算机组成原理
算法分析与设计
理论计算机科学基础
密码学原理
信息安全概论
网络与市场中的计算思维
博弈论
计算思维与数据科学导论
编译原理
数据库系统概论
Java程序设计
人工智能原理
计算机网络
大数据算法
操作系统
软件工程
机器学习
大数据技术原理与应用
计算机图形学
信息论与编码理论
区块连技术与应用
计算机入门
计算机应用数学
程序设计与算法基础
算法设计
计算理论
网络科学
密码学基础
博弈论
计算机安全的理论与实践
量子信息
机器学习
高等计算机图形学
操作系统
分布式计算
机器学习与模式识别
信息论与网络编码
计算生物学
专题训练实践
计算机科学研究实践
人类和机器的语音交流
1、经典算法梳理和学习
1.1 统计学习方法(完成)
1.2 西瓜书 (剩余强化学习)
1.3 深水区攻坚
1.4 Andrew NG 机器学习课程
1.5 Andrew NG 深度学习系列课程
1.6 Sequence learning
2、自然语言和推荐系统
2.1 数学之美(进行中)
2.2 统计自然语言处理
2.3 这就是推荐引擎系统
2.4 谷歌搜索引擎
2.5 推荐系统汇总资料:https://www.cnblogs.com/DjangoBlog/p/11474477.html
3、深度学习基础内容
3.1 花书(2019/11/19重新开始)
3.2 花书配套的实战书
3.3 经典论文
3.4 李弘毅深度学习课程(暂停)
3.5 https://blog.csdn.net/abc13526222160/article/details/84099863
4、Java实现Lightgbm、线上代码梳理、其他实时算法(10/8~11/31)
5、机器学习内容查全补漏
5.1 Leetcode(进行中,重点)
5.2 百面机器学习(暂停)
5.3 刘建平博客(12月2号完成,剩余强化学习章节19/135)
5.4 https://www.cnblogs.com/DjangoBlog/p/9131224.html 博客
5.5 机器学习AI算法工程
5.6 遗留问题:
RNN在BP过程中梯度消失的原因,链式求导过程
end-to-end-learning
Batch Normalization
AutoEncoder
Denoising AutoEncoder:在训练数据中加入噪声,需学习去除这种噪声
Sparse Coding 系数编码
FFM 和 DeepFFM的代码
GBDT + LR代码
不同分布函数参数的估计(有偏和无偏估计)
变分推断
估计量的一致性
线性回归 最大似然
频率派和贝叶斯派在参数估计上的差异
贝叶斯参数优化
贝叶斯线性回归
正则化与MAP贝叶斯推断(L2相当于权重是高斯先验的MAP贝叶斯推断;L1与通过AMP贝叶斯推断最大化的对数先验项是等价的)
基于RBM的推荐系统(流行于2016年左右)
系统的看一遍别人写的推荐系统都使用了哪些具体算法以及推荐系统的发展现状
用PMML实现机器学习模型的跨平台上线:https://www.cnblogs.com/pinard/p/9220199.html(等有一定的java基础后再去实践)
tensorflow机器学习模型的跨平台上线:https://www.cnblogs.com/pinard/p/9251296.html (等有一定的java基础后再去实践)
小小挖掘机:https://cloud.tencent.com/developer/column/2381
算法channel:https://cloud.tencent.com/developer/user/1478933
迹函数
贝叶斯的条件概率估计:频率主义学派、贝叶斯学派
L2和L1正则化的异同
胶囊神经网络
6、11/1~12/31数学基础
6.1 高等数学
6.2 离散数学
6.3 概率论与数理统计:陈希儒
6.4 抽象数学
6.5 矩阵论
6.6 运筹学
6.7 线性代数(完成)
6.8 统计学
6.9 图论
6.10 矩阵分析与应用: 张贤达
6.11 信息论基础
6.12 凸优化: 鲍信
6.13 数理统计学讲义(北京大学)
7、11/1~12/31计算机类课程
7.1 数据结构
7.2 Java
7.3 虽然用了挺长时间的Python,但是并未完整的学过某种编程算法,代码写起来还是比较吃力,坚持写一段时间的代码,多看看多写写
8、是时候准备开始健身了,保持一个良好的形态(预计2020年1月1号开始)
动手学深度学习:计算机科学是动手的学科,没有足够的动手能力难以取得很好的成果。如果算法能力应对一台及其的内存大小,动手能力则是及其的CPU的频率。内存决定了能跑多么复杂的程序,CPU则决定了你能多块的完成它,两者都不能缺。