上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 50 下一页
  2020年4月17日
摘要: 题目:给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?请你找出所有满足条件且不重复的三元组。 注意:答案中不可以包含重复的三元组。 思路:可以参考两个数求和的思路,但是需要考虑结果重复的情况。 代码1:使用两个数求和思路 阅读全文
posted @ 2020-04-17 17:16 桌子哥 阅读(2112) 评论(0) 推荐(0) 编辑
摘要: 题目:给你 n 个非负整数 a1,a2,...,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。 说明:你不能倾斜容器,且 n 的值至少为 阅读全文
posted @ 2020-04-17 14:38 桌子哥 阅读(1052) 评论(0) 推荐(0) 编辑
摘要: 题目:给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。 请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。 你可以假设 nums1 和 nums2 不会同时为空 思路:看到要求的时间复杂度为O(log(m + n)),想到了二分搜索,使用二分 阅读全文
posted @ 2020-04-17 13:36 桌子哥 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 题目:给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。 思路:本题较为简单,一个元素不能使用两遍,因此只能用一次循环,在一次循环里解决所有问题。 cl 阅读全文
posted @ 2020-04-17 10:25 桌子哥 阅读(733) 评论(0) 推荐(0) 编辑
  2020年4月9日
摘要: 情况一:二元分类 这部分使用的数据集是判断网页是暂时的还是长青的。因为涉及到了文本的信息,所以需要进行文本的数字化和向量化。 在这部分中,机器学习分为三个部分,第一部分是建立机器学习流程pipeline,第二部分是训练,第三部分是预测。 在建立机器学习流程pipeline中包含4个阶段,如下所示: 阅读全文
posted @ 2020-04-09 17:05 桌子哥 阅读(906) 评论(0) 推荐(0) 编辑
  2020年4月7日
摘要: 在Spark中可以使用RDD API、DataFrame API和Spark API这三个接口来进行数据的相关操作。且这三者也互相有联系,RDD没有定义框架,DataFrame在创建时必须定义Schema,而Spark SQL是由DataFrame派生出来的,此外Spark API适用于只有SQL操 阅读全文
posted @ 2020-04-07 17:36 桌子哥 阅读(438) 评论(0) 推荐(0) 编辑
  2020年4月6日
摘要: 机器学习领域中分类方法和回归方法是相对的,大多数的方法可以相互转换,即一般的机器学习方法如果可以分类的话,也会可以做回归预测。在本例的回归方法中,使用的评价指标是RMSE。 第一步:导入数据库 import sysfrom time import timeimport pandas as pdimp 阅读全文
posted @ 2020-04-06 15:30 桌子哥 阅读(408) 评论(0) 推荐(0) 编辑
  2020年4月5日
摘要: 二分类分类器大多可以用来进行开展多分类的问题,这篇以决策树为例来介绍Spark里MLlib的多分类问题实例,在这一篇中使用的评价指标是Accuracy。 第一步:导入库函数 import sysfrom time import timeimport pandas as pdimport matplo 阅读全文
posted @ 2020-04-05 23:30 桌子哥 阅读(404) 评论(0) 推荐(0) 编辑
  2020年4月3日
摘要: 朴素贝叶斯是一种经典的分类方法,其原理在高中或大学的概率论部分学习了很多了,下面开始介绍在Spark环境下使用MLlib来使用Naive Bayes来对网站性质进行分类判断。 第一步:导入库函数 import sysfrom time import timeimport pandas as pdim 阅读全文
posted @ 2020-04-03 22:57 桌子哥 阅读(277) 评论(0) 推荐(0) 编辑
摘要: 支持向量机是一个应用很广的机器学习模型,利用核空间变换可以将数据从一个空间变换到另外一个空间当中,从而使得数据呈现出更清晰的分布。支持向量机不论是在工业界还是在学界都有举足亲重的意义,在学界,基于支持向量机的改进方法有很多,通过算法层面的改进可以得到一种针对特定数据情况的优质算法,从而能更好的解决实 阅读全文
posted @ 2020-04-03 17:16 桌子哥 阅读(580) 评论(0) 推荐(0) 编辑
上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 50 下一页