……

上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 36 下一页
2020年6月17日
摘要: 算法原理 朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。 该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。 但由于该算法以自变量之间的独立(条件特征独立)性和连续变 阅读全文
posted @ 2020-06-17 18:44 大码王 阅读(687) 评论(0) 推荐(0) 编辑
摘要: 主要思想 根据现有数据对分类边界线建立回归公式,以此进行分类,其核心是通过最优化算法寻找最佳回归系数(权重系数),主要应用于二分类。 算法原理 二分类的特点是非此即彼,其数学特性符合单位阶跃函数,在某一点会发生突变。这也符合我们现实当中的一些应用场景(比如分数从0 到 60会很容易,越往上你所花的时 阅读全文
posted @ 2020-06-17 18:41 大码王 阅读(475) 评论(0) 推荐(0) 编辑
摘要: KNN算法是一种基于实例的学习,或者是局部近似和将所有计算推迟到分类之后的惰性学习。用最近的邻居(k)来预测未知数据点。k 值是预测精度的一个关键因素,无论是分类还是回归,衡量邻居的权重都非常有用,较近邻居的权重比较远邻居的权重大。 KNN 算法的缺点是对数据的局部结构非常敏感。计算量大,需要对数据 阅读全文
posted @ 2020-06-17 18:15 大码王 阅读(562) 评论(0) 推荐(0) 编辑
摘要: 1. 解决什么问题? 最基本的应用是数据分类,特别是对于非线性不可分数据集。支持向量机不仅能对非线性可分数据集进行分类,对于非线性不可分数据集的也可以分类 (我认为这才是支持向量机的真正魅力所在,因为现实场景中,样本数据往往是非线性不可分的)。 现实场景一 :样本数据大部分是线性可分的,但是只是在样 阅读全文
posted @ 2020-06-17 18:13 大码王 阅读(1387) 评论(0) 推荐(0) 编辑
摘要: 回归分析(Regression Analysis)是统计学的数据分析方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测其它变量的变化情况。 线性回归算法(Linear Regression)的建模过程就是使用数据点来寻找最佳拟合线。公式,y = mx + 阅读全文
posted @ 2020-06-17 18:09 大码王 阅读(382) 评论(0) 推荐(0) 编辑
摘要: 1.KNN 分类算法 由于knn算法涉及到距离的概念,KNN 算法需要先进行归一化处理 1.1 归一化处理 scaler from sklearn.preprocessing import StandardScaler standardScaler =StandardScaler() standar 阅读全文
posted @ 2020-06-17 17:57 大码王 阅读(1510) 评论(0) 推荐(0) 编辑
摘要: 深度神经网络算法,是基于神经网络算法的一种拓展,其层数更深,达到多层,本文以简单神经网络为例,利用梯度下降算法进行反向更新来训练神经网络权重和偏向参数,文章最后,基于Python 库实现了一个简单神经网络算法程序,并对异或运算和0-9字符集进行预测。 一、问题引入 利用如下图像结构,通过训练集对其参 阅读全文
posted @ 2020-06-17 16:23 大码王 阅读(370) 评论(0) 推荐(0) 编辑
2020年6月16日
摘要: 代码实现: import numpy as np def compute_error_for_line_given_points(b, w, points): totalError = 0 for i in range(0, len(points)): x = points[i, 0] y = po 阅读全文
posted @ 2020-06-16 16:01 大码王 阅读(381) 评论(0) 推荐(0) 编辑
摘要: 代码实现: import tensorflow as tf assert tf.__version__.startswith('2.') a=tf.constant(2.) b=tf.constant(4.) print(f'{a}+{b}={a+b}') 执行结果: 阅读全文
posted @ 2020-06-16 15:51 大码王 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 代码实现: import tensorflow.compat.v1 as tf tf.disable_v2_behavior() # 使用静态图模式运行以下代码 assert tf.__version__.startswith('2.') # 1.创建计算图阶段 # 创建2个输入端子,指定类型和名字 阅读全文
posted @ 2020-06-16 15:47 大码王 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 代码实现: import numpy as np import matplotlib from matplotlib import pyplot as plt # Default parameters for plots matplotlib.rcParams['font.size'] = 20 m 阅读全文
posted @ 2020-06-16 15:41 大码王 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 代码实现: import tensorflow as tf # 创建4个张量 a=tf.constant(1.) b=tf.constant(2.) c=tf.constant(3.) w=tf.constant(4.) with tf.GradientTape() as tape: tape.wa 阅读全文
posted @ 2020-06-16 15:18 大码王 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 子曰:“工欲善其事,必先利其器。”学习Python就需要有编译Python程序的软件,一般情况下,我们选择在Python官网下载对应版本的Python然后用记事本编写,再在终端进行编译运行即可,但是对于我这样懒的小白,我喜欢装一些方便的软件来辅助我编写程序。在学习Java时,正常情况选择安装JDK然 阅读全文
posted @ 2020-06-16 10:59 大码王 阅读(879) 评论(0) 推荐(0) 编辑
2020年6月15日
摘要: 1.下载Anaconda 1.下载最新版的Anoconda,可百度搜索“Anaconda 清华镜像”,下载对应系统机器位数的安装文件,我下载的windows-64bit。 网址如下:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 我是wi 阅读全文
posted @ 2020-06-15 18:06 大码王 阅读(3186) 评论(1) 推荐(0) 编辑
摘要: import MySQLdb #查询数量 def Count(cur): count=cur.execute('select * from Student') print ('there has %s rows record' % count) #插入 def Insert(cur): sql = 阅读全文
posted @ 2020-06-15 17:13 大码王 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 代码实现: import turtle turtle.goto(0,0) turtle.color("blue") turtle.pensize(5) turtle.circle(50) turtle.penup() turtle.goto(100,0) turtle.color("green") 阅读全文
posted @ 2020-06-15 16:44 大码王 阅读(754) 评论(0) 推荐(0) 编辑
摘要: 代码实现: #绘制彩色螺旋线 import turtle import time turtle.pensize(2) turtle.bgcolor("black") colors = ["red","yellow","purple","blue"] turtle.tracer(False) for 阅读全文
posted @ 2020-06-15 16:41 大码王 阅读(4576) 评论(0) 推荐(0) 编辑
摘要: 操纵海龟绘图有着许多的命令,这些命令可以划分为两种:一种为运动命令,一种为画笔控制命令1. 运动命令:forward(degree) #向前移动距离degree代表距离backward(degree) #向后移动距离degree代表距离right(degree) #向右移动多少度left(degre 阅读全文
posted @ 2020-06-15 16:32 大码王 阅读(2473) 评论(0) 推荐(0) 编辑
摘要: 本文讲Spark Streamming使用Direct方式读取Kafka,并在输出(存储)操作之后提交offset到Kafka里实现程序读写操作有且仅有一次,即程序重启之后之前消费并且输出过的数据不再重复消费,接着上次消费的位置继续消费Kafka里的数据。Spark Streamming+Kafka 阅读全文
posted @ 2020-06-15 16:26 大码王 阅读(919) 评论(1) 推荐(0) 编辑
摘要: 1、需求背景 通过Spark将关系型数据库(以Oracle为例)的表同步的Hive,这里讲的只是同步历史数据,不包括同步增量数据。 2、Oracle和Hive的字段类型对应 利用Spark的字段类型自动匹配,本来以为Spark匹配的不是很好,只是简单的判断一下是否为数字、字符串,结果经验证,Spar 阅读全文
posted @ 2020-06-15 16:24 大码王 阅读(968) 评论(0) 推荐(0) 编辑
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 36 下一页
复制代码