摘要: Background 这篇blog的起源是,在四刷西瓜书时,遇到了许多熟悉但又似乎陌生的数学概念,尤其集中在线代/微积分/概率论以及最优化之中。想当年我的概率论分数还挺高的,咋遇到这些问题依然百思不得其解捏?其一是基础其实并不扎实,只是知道公式、会计算而已;其二是学了这么多theory之后,更关注这 阅读全文
posted @ 2020-07-13 16:28 ZinYY 阅读(415) 评论(1) 推荐(0) 编辑
摘要: 暑假一个人在寝室,闲来无事。 某天,辅导员恰好发了学年查分的链接,一看,发现是易查分平台,再加上手头的数据,有搞头啊,遂开始设计爬虫。易查分这网站很怪,PC版需要输入验证码,手机版就不需要了。为了方便爬取,果断选择手机版。(本来还想训练个自动填充验证码的神经网络的,可难度有些大,有空了以后补上吧) 阅读全文
posted @ 2018-09-05 00:15 ZinYY 阅读(2604) 评论(0) 推荐(0) 编辑
摘要: 今天了解到sklearn这个库,简直太酷炫,一行代码完成机器学习。 贴一个自动生成数据,SVR进行数据拟合的代码,附带网格搜索(GridSearch, 帮助你选择合适的参数)以及模型保存、读取以及结果绘制。 阅读全文
posted @ 2018-08-25 19:25 ZinYY 阅读(16053) 评论(0) 推荐(0) 编辑
摘要: 虽然已经学习了许多机器学习的方法,可只有我们必须知道何时何处使用哪种方法,才能将他们正确运用起来。 那不妨使用经验最小化ERM方法来估计 。 首先: 其中, δ代表训练出错的概率 k代表假设类的个数 m代表样本(数据集)个数 γ代表误差阈值 于是我们可以得到: 但我们的假设都是建立在k有限的条件上, 阅读全文
posted @ 2018-07-31 19:55 ZinYY 阅读(564) 评论(0) 推荐(0) 编辑
摘要: 周大爷在比赛中搜到的黑科技二分图模版,复杂度为m√(n): 注意:点的序号要从0开始! 需要把nx,ny都赋值为n(点数) 调用: 阅读全文
posted @ 2018-07-29 15:00 ZinYY 阅读(1848) 评论(0) 推荐(0) 编辑
摘要: 虽然已经学习了神经网络和深度学习并在几个项目之中加以运用了,但在斯坦福公开课上听吴恩达老师说他(在当时)更喜欢使用SVM,而很少使用神经网络来解决问题,因此来学习一下SVM的种种。 先解释一些概念吧: 矩阵二范数: ||w|| = sqrt(w'w) 跟室友探讨了一下,觉得对于n维列向量来说,二范数 阅读全文
posted @ 2018-07-24 21:07 ZinYY 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 使用matlab完成高维数据的聚类与可视化 最终效果: 阅读全文
posted @ 2018-07-18 23:37 ZinYY 阅读(14300) 评论(0) 推荐(2) 编辑
摘要: 题目: 给定n(1≤n≤24)个物品,重量分别为wi,装进一些容量为S(S<1e8)的背包,最少需要多少个背包? 阅读全文
posted @ 2018-07-18 20:33 ZinYY 阅读(1405) 评论(0) 推荐(0) 编辑
摘要: 准备系统地学习一波CDQ分治,持续更新中... 首先,CDQ分治也还是分治的一种,只不过普通分治是独立的解决两个子问题,而CDQ分治还要计算第一个子问题对于第二个的影响。 CDQ分治几乎都是用来解决多维偏序对的问题。 使用CDQ分治的前提条件: 修改操作对询问的贡献独立,修改操作互不影响效果 题目允 阅读全文
posted @ 2018-07-18 20:31 ZinYY 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 把上次建模校赛一个根据三围将女性分为四类(苹果型、梨形、报纸型、沙漏)的问题用逻辑回归实现了,包括从excel读取数据等一系列操作。 Excel的格式如下:假设有r列,则前r-1列为数据,最后一列为类别,类别需要从1开始,1~k类, 如上表所示,前10列是身高、胸围、臀围等数据(以及胸围和腰围、胸围 阅读全文
posted @ 2018-06-16 10:30 ZinYY 阅读(1243) 评论(0) 推荐(0) 编辑