摘要:
上个月对一个小项目的效果进行改进,时间紧,只有不到一周的时间,所以思考了一下就用了最简单的方法来做,效果针对上一版提升了5%左右,跟大家分享一下(项目场景用的类似的场景) 项目场景:分析一个产品的竞品,譬如app的竞品、网站的竞品等等 项目分析:简单来说就是竞品分析,竞品分析有很多比较成熟的方法,但 阅读全文
摘要:
今天刚从医院复查回来,有时间更一下博客,就趁这个时候总结一下坑爹的2016吧 这个博客是去年年底的时候建的,但是今年3月才开始正式写,但是7月份开始又没有写了,原因很简单,因为我换工作了。7月底开始有换工作的想法,8月中旬开始面试,9月初入职,可惜新公司的部门技术氛围与我想想的差别有点大,做的业务也 阅读全文
摘要:
前几天用CNN识别手写数字集,后来看到kaggle上有一个比赛是识别手写数字集的,已经进行了一年多了,目前有1179个有效提交,最高的是100%,我做了一下,用keras做的,一开始用最简单的MLP,准确率只有98.19%,然后不断改进,现在是99.78%,然而我看到排名第一是100%,心碎 = = 阅读全文
摘要:
#————————————————————————本文禁止转载,禁止用于各类讲座及ppt中,违者必究————————————————————————# 前几天看到一个有意思的分享,大意是讲如何用Tensorflow教神经网络自动创造音乐。听起来好好玩有木有!作为一个Coldplay死忠粉,第一想法就 阅读全文
摘要:
写在前面:本来这篇应该是上周四更新,但是上周四写了一篇深度学习的反向传播法的过程,就推迟更新了。本来想参考PRML来写,但是发现里面涉及到比较多的数学知识,写出来可能不好理解,我决定还是用最通俗的方法解释PCA,并举一个实例一步步计算,然后再进行数学推导,最后再介绍一些变种以及相应的程序。(数学推导 阅读全文
摘要:
最近在看深度学习的东西,一开始看的吴恩达的UFLDL教程,有中文版就直接看了,后来发现有些地方总是不是很明确,又去看英文版,然后又找了些资料看,才发现,中文版的译者在翻译的时候会对省略的公式推导过程进行补充,但是补充的又是错的,难怪觉得有问题。反向传播法其实是神经网络的基础了,但是很多人在学的时候总 阅读全文
摘要:
本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢! 系列目录: 1 第一部分 模型的评估与数据处理 2 3 机器学习基础与实践(一) 数据清洗 4 5 机器学习基础与实践(二) 数据转换 6 7 机器学习基础与实践(三) 数据降维 8 9 10 11 阅读全文
摘要:
本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢! 想写这个系列很久了,最近刚好项目结束了闲下来有点时间,于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书,每本书都各有侧重点,机器学习实战和集体智慧编程更偏向与实战,侧重于对每个算法的实 阅读全文
摘要:
写这个系列是因为最近公司在搞技术分享,学习Spark,我的任务是讲PySpark的应用,因为我主要用Python,结合Spark,就讲PySpark了。然而我在学习的过程中发现,PySpark很鸡肋(至少现在我觉得我不会拿PySpark做开发)。为什么呢?原因如下: 1.PySpark支持的算法太少 阅读全文
摘要:
本来这篇是准备5.15更的,但是上周一直在忙签证和工作的事,没时间就推迟了,现在终于有时间来写写Learning Spark最后一部分内容了。 第10-11 章主要讲的是Spark Streaming 和MLlib方面的内容。我们知道Spark在离线处理数据上的性能很好,那么它在实时数据上的表现怎么 阅读全文
摘要:
昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machine Learning (by Hastie, Tibshirani, and Friedman's ) 2.Eleme 阅读全文
摘要:
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books Courses Video and Lectures Papers Tutorials WebSites Datasets Frameworks Miscellaneous Github 几 阅读全文
摘要:
为了方便大家阅读,我把博文目录梳理了一下,里面会有已完成和计划写的博文,希望大家多多交流,有错误的地方请随时指正^_^ 深度学习入门系列 (每周三发一篇,计划11月~6月更完) 三个月教你从零入门深度学习 (10.26更新) 【深度学习系列】手写数字识别实战(10.23更新) 【深度学习系列】卷积神 阅读全文
摘要:
为了记录自己度过的书,写个帖子总结一下,不定时更新。以前度过的书有些不记得了,就先记录一下我记得的吧:) PS:现在读过的书(2016.4月以后),我会做读书总结。以前看的书,会再抽时间回顾一下,做个简单的总结。跟数据挖掘相关的书我另写了一个帖子,可以参考这个: 【原】数据分析/数据挖掘/机器学习 阅读全文
摘要:
周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =。这三章主要讲Spark的运行过程(本地+集群),性能调优以及Spark SQL相关的知识,如果对Spark不熟的同学可以先看看之前总结的两篇文章: 【原】Learning 阅读全文