摘要:
在机器学习领域,有一个很有名气的西瓜--周志华老师的《机器学习》,很多同学选择这本书入门,都曾有被西瓜支配的恐惧。我写文章的时候也特别喜欢用西瓜数据集,以它为例手算+可视化讲解过XGBoost,自认非常通俗易懂。 最近我介绍了决策树的可视化,还有可以快速实现机器学习web应用的神器——streaml 阅读全文
摘要:
彻底干掉了Windows的cmd,一个字:爽! 先说一句:Windows下的 cmd 就是垃圾! 习惯了Ubuntu和Mac的Terminal,再去用Windows的 cmd 简直难以忍受。 今天就向同学们介绍一下这款Windows神级命令行工具—-Cmder Cmder Cmder是一款windo 阅读全文
摘要:
最近在玩streamlit Streamlit 是第一个专门针对机器学习的应用开发框架,是开发自定义机器学习工具最快的方法,它的目标是取代Flask在机器学习项目中的地位。 在Streamlit官方网站,有很多开源的应用,涉及NLP、数据可视化、音频处理、机器学习建模及训练等等 今天向大家介绍2个我 阅读全文
摘要:
简介 manim是斯坦福大学数学系小哥Grant Sanderson开源的数学仿真模拟python库,并用于YouTube 频道3Blue1Brown,来解说高等数学。 manim是一个非常优秀的数学动画制作引擎,先来两个GIF感受一下 manim 的魅力: 很多同学应该在 B 站看过3b1b的视频 阅读全文
摘要:
pathlib 学习 Python 时,尤其是在进行文件操作和数据处理时,经常会处理路径问题。最常用和常见的是 os.path 模块,它将路径当做字符串进行处理,如果使用不当可能导致难以察觉的错误,而且代码很难跨平台复用。pathlib 就是一个非常棒的Python标准库,超级好用。 pathlib 阅读全文
摘要:
问题 如果有一组数据,如何确定他们来自哪个统计分布? 从数据分析的角度,我们并不想要通过严格的统计方法去找到这个分布,Python中有一个可以自动拟合数据分析的库 —— distfit 。这是一个python包,用于通过残差平方和(RSS)和拟合优度检验(GOF)对89个单变量分布进行概率密度拟合, 阅读全文
摘要:
全球最大同性交友网站 GitHub 是所有程序员的最爱,但是国内开发者访问Github 很不稳定,克隆开源项目也慢的离谱,常常clone失败。 之前大家或绕道码云(GitLab)或修改host文件,但这样就太麻烦了。今天向大家推荐一个我在用的Chrome插件,速度嗖嗖的,用了很久,非常稳定。 这个插 阅读全文
摘要:
人人都知道学习很重要,学习究竟是为了什么呢?根本目的只有一个,学以致用! 机器学习,大家都学了很多算法,搞了很多模型,但是极少拿来解决实际问题。 毕竟开发一个机器学习应用需要的技术栈不是每个人都能掌握,今天就向同学们介绍一个绝佳解决方法————streamlit 它可以让你用Python用极短的时间 阅读全文
摘要:
众所周知 Python 有一个致命的缺点:速度比 C、C ++ 等语言慢很多。PyPy 恰好可以解决这一问题,它能够让 Python 代码运行得比 C 还快。 比如: import time from termcolor import colored start = time.time() numb 阅读全文
摘要:
目前无论是机器学习竞赛还是工业界,最流行、应用最广泛的xgboost其实是优化后的GBDT(LightGBM里面的boosting比较经典稳定的也是GBDT哦!),而GBDT的基分类器最常用的就是CART决策树!掌握决策树,对理解之后的GBDT、LightGBM都有大有裨益。 可视化的方式理解决策树 阅读全文