摘要: 一、数据结构 常见的面试题都是围绕数组、字符串、链表、树、栈及队列这几种常见的数据结构展开,需熟练掌握,数组和字符串是两种最基本的数据结构,他们用连续内存分别存储数字和字符。链表和树是面试中出现频率最高的数据结构,栈是一个与递归紧密相关的数据结构,同样队列与广度优先遍历算法紧密相关,需深刻理解 1、 阅读全文
posted @ 2018-03-07 19:39 lxwlxw 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 1、LDA在自然语言处理中的应用 2、七月在线机器学习项目 3、吴恩达机器学习 4、吴恩达深度学习笔记 5、spark入门指南(w3school) 03.28 原版 6、统计学习方法李航 7、微平台推荐系统介绍(基于java) 看到文档,系统架构有了解,具体的java代码还需要后续的继续看;03.2 阅读全文
posted @ 2018-03-07 18:07 lxwlxw 阅读(95) 评论(0) 推荐(0) 编辑
摘要: 深度学习(deeplearing)(5月) 第一部分 应用数学与机器学习基础(5.1-5.10) 简介:机器学习模型在数学就是解决代价函数的最优化问题 学习笔记一 线性代数与概率论 学习笔记二 数值计算 学习笔记三 机器学习基础 第二部分 深层网络:现代实践 简介:现代深度学习为监督学习提供了一个强 阅读全文
posted @ 2017-05-01 23:42 lxwlxw 阅读(188) 评论(0) 推荐(0) 编辑
摘要: 关键点: mnt model crf 词性识别 knowledge db 跨平台实现安卓和ios版本 MQTT协议的自建消息推送框架 阅读全文
posted @ 2018-04-12 16:04 lxwlxw 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 参考码农场对斯坦福cs224n的笔记总结: 链接: 阅读全文
posted @ 2018-04-12 15:52 lxwlxw 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 一、深度学习引言 二、神经网络的编程基础 三、浅层神经网络 四、深层神经网络 阅读全文
posted @ 2018-04-10 15:24 lxwlxw 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 一、HMM隐马尔可夫模型分词、词性标注、命名实体识别 HMM是用来描述隐含未知参数的统计模型,经典的例子:一个东京的朋友每天根据天气{下雨、晴天}决定当天的活动{公园散步、购物、清理房间}中的一种,我每天只能在twitter上看到她发的“今前天去公园散步了、昨天购物、今天清理房间了!”,那么我可以根 阅读全文
posted @ 2018-04-02 19:27 lxwlxw 阅读(682) 评论(0) 推荐(0) 编辑
摘要: 一、java 二、c++ 三、系统框架、分布式系统框架 四、数据库 阅读全文
posted @ 2018-03-30 01:22 lxwlxw 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 三、平衡二叉树 阅读全文
posted @ 2018-03-29 23:58 lxwlxw 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 三、Spark RDDS 可以把RDDs看做特殊得待处理数据集,可以并行被处理,操作这个数据集的包括两个方法,一个是转换(transformations)不计算结果,一个是active(动作),计算出结果 1、弹性分布式数据集(RDDs) spark核心的概念是RDD:一个可并行操作的 阅读全文
posted @ 2018-03-28 22:23 lxwlxw 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 1、推荐系统整体框架 2、推荐系统所用算法及所需数据 基于协同过滤的推荐 基于内容的推荐 基于内容推荐的原理: 01、如何定义内容相似度,新闻作为文本类的数据,本身可以从文本特征几个方面去提取它的特征信息,进而将不同的新闻间的特征信息进行比较 常见的特征信息有:新闻文本长度、新闻所属话题类型(社会、 阅读全文
posted @ 2018-03-28 14:55 lxwlxw 阅读(1634) 评论(0) 推荐(0) 编辑
摘要: 简历的目的是拿到面试机会,所以要 1、简历项目 一、投资人用户画像,给新的项目推荐投资机构,文本的处理,文本相似问题,用tfidf和浅语义模型解决,文本检索技术,可以归类为文本检索的问题 文本预处理:中文分词,然后去除停用词、删除低频词、进行word ->id转换 可选的优化:比如用TF-IDF为词 阅读全文
posted @ 2018-03-27 17:20 lxwlxw 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 零、常见的建模策略: Linear Regression 线性回归 Logistic Regression 逻辑回归 Ensemble Learning 集成学习(特征工程决定了机器学习的上限,集成学习决定了这个上限的逼近程度) bagging:多个分类器结果平均或者投票,rf Boosting:A 阅读全文
posted @ 2018-03-27 11:23 lxwlxw 阅读(265) 评论(0) 推荐(0) 编辑