立flag
从今天起要好好复习,准备找工作。
这周六做简历。
复习内容包括:
- 常用学习算法
- 统计学习方法(共十一章)主要是监督学习
- 机器学习西瓜书(1-8章为监督学习,主要可关注下第9章及以后的章节)
- xgboost?
- lstm?
- lda?
- 搜索排序的算法:pageRank, pairwise,
- 自然语言处理方面的入门方法:
- 程序+算法(数据结构)
- 线性表(数组、链表、栈、队列)
- 遍历、访问元素、
- 树
- 二叉树遍历等
- 堆
- 散列表
- 图
- 线性表(数组、链表、栈、队列)
- hadoop&spark
- map reduce原理
- spark原理?
- 二者的区别
- 项目
- 数据抓取与清洗:python爬虫抓取数据、规则过滤、建立品牌名、品牌官网、品牌相关词
- 核心词提取
- 意图提取