2020年6月17日

摘要：算法原理朴素贝叶斯是经典的机器学习算法之一，也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单，也很容易实现，多用于文本分类，比如垃圾邮件过滤。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立（条件特征独立）性和连续变阅读全文

posted @ 2020-06-17 18:44 大码王阅读(802) 评论(0) 推荐(0) 编辑

Python机器学习（十四）Logistic回归算法原理与代码实现

摘要：主要思想根据现有数据对分类边界线建立回归公式，以此进行分类，其核心是通过最优化算法寻找最佳回归系数（权重系数），主要应用于二分类。算法原理二分类的特点是非此即彼，其数学特性符合单位阶跃函数，在某一点会发生突变。这也符合我们现实当中的一些应用场景（比如分数从0 到 60会很容易，越往上你所花的时阅读全文

posted @ 2020-06-17 18:41 大码王阅读(487) 评论(0) 推荐(0) 编辑

Python机器学习（十三）最近邻居/k-近邻算法

摘要： KNN算法是一种基于实例的学习，或者是局部近似和将所有计算推迟到分类之后的惰性学习。用最近的邻居（k）来预测未知数据点。k 值是预测精度的一个关键因素，无论是分类还是回归，衡量邻居的权重都非常有用，较近邻居的权重比较远邻居的权重大。 KNN 算法的缺点是对数据的局部结构非常敏感。计算量大，需要对数据阅读全文

posted @ 2020-06-17 18:15 大码王阅读(569) 评论(0) 推荐(0) 编辑

Python机器学习（十二）支持向量机算法

摘要： 1. 解决什么问题？最基本的应用是数据分类，特别是对于非线性不可分数据集。支持向量机不仅能对非线性可分数据集进行分类，对于非线性不可分数据集的也可以分类（我认为这才是支持向量机的真正魅力所在，因为现实场景中，样本数据往往是非线性不可分的）。现实场景一：样本数据大部分是线性可分的，但是只是在样阅读全文

posted @ 2020-06-17 18:13 大码王阅读(1400) 评论(0) 推荐(0) 编辑

Python机器学习（十一）线性回归算法

摘要：回归分析（Regression Analysis）是统计学的数据分析方法，目的在于了解两个或多个变量间是否相关、相关方向与强度，并建立数学模型以便观察特定变量来预测其它变量的变化情况。线性回归算法（Linear Regression）的建模过程就是使用数据点来寻找最佳拟合线。公式，y = mx + 阅读全文

posted @ 2020-06-17 18:09 大码王阅读(386) 评论(0) 推荐(0) 编辑

Python机器学习（十）经典算法大全

摘要： 1.KNN 分类算法由于knn算法涉及到距离的概念，KNN 算法需要先进行归一化处理 1.1 归一化处理 scaler from sklearn.preprocessing import StandardScaler standardScaler =StandardScaler() standar 阅读全文

posted @ 2020-06-17 17:57 大码王阅读(1529) 评论(0) 推荐(0) 编辑

Python机器学习（九）简单神经网络

摘要：深度神经网络算法，是基于神经网络算法的一种拓展，其层数更深，达到多层，本文以简单神经网络为例，利用梯度下降算法进行反向更新来训练神经网络权重和偏向参数，文章最后，基于Python 库实现了一个简单神经网络算法程序，并对异或运算和0-9字符集进行预测。一、问题引入利用如下图像结构，通过训练集对其参阅读全文

posted @ 2020-06-17 16:23 大码王阅读(390) 评论(0) 推荐(0) 编辑

2020年6月16日

人工智能深度学习入门练习之（7）线性回归

摘要：代码实现： import numpy as np def compute_error_for_line_given_points(b, w, points): totalError = 0 for i in range(0, len(points)): x = points[i, 0] y = po 阅读全文

posted @ 2020-06-16 16:01 大码王阅读(384) 评论(0) 推荐(0) 编辑

人工智能深度学习入门练习之（6）求和方法2

摘要：代码实现： import tensorflow as tf assert tf.__version__.startswith('2.') a=tf.constant(2.) b=tf.constant(4.) print(f'{a}+{b}={a+b}') 执行结果：阅读全文

posted @ 2020-06-16 15:51 大码王阅读(214) 评论(0) 推荐(0) 编辑

人工智能深度学习入门练习之（5）求和

摘要：代码实现： import tensorflow.compat.v1 as tf tf.disable_v2_behavior() # 使用静态图模式运行以下代码 assert tf.__version__.startswith('2.') # 1.创建计算图阶段 # 创建2个输入端子，指定类型和名字阅读全文

posted @ 2020-06-16 15:47 大码王阅读(253) 评论(0) 推荐(0) 编辑

人工智能深度学习入门练习之（4）矩阵实现

摘要：代码实现： import numpy as np import matplotlib from matplotlib import pyplot as plt # Default parameters for plots matplotlib.rcParams['font.size'] = 20 m 阅读全文

posted @ 2020-06-16 15:41 大码王阅读(290) 评论(0) 推荐(0) 编辑

人工智能深度学习入门练习之（3）求导

摘要：代码实现： import tensorflow as tf # 创建4个张量 a=tf.constant(1.) b=tf.constant(2.) c=tf.constant(3.) w=tf.constant(4.) with tf.GradientTape() as tape: tape.wa 阅读全文

posted @ 2020-06-16 15:18 大码王阅读(301) 评论(0) 推荐(0) 编辑

人工智能深度学习入门练习之（2）Anaconda和Pycharm的安装和配置

摘要：子曰：“工欲善其事，必先利其器。”学习Python就需要有编译Python程序的软件，一般情况下，我们选择在Python官网下载对应版本的Python然后用记事本编写，再在终端进行编译运行即可，但是对于我这样懒的小白，我喜欢装一些方便的软件来辅助我编写程序。在学习Java时，正常情况选择安装JDK然阅读全文

posted @ 2020-06-16 10:59 大码王阅读(880) 评论(0) 推荐(0) 编辑

2020年6月15日

人工智能深度学习入门练习之（1）Tensorflow2.2.0-cpu安装教程

摘要： 1.下载Anaconda 1.下载最新版的Anoconda，可百度搜索“Anaconda 清华镜像”，下载对应系统机器位数的安装文件，我下载的windows-64bit。网址如下：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 我是wi 阅读全文

posted @ 2020-06-15 18:06 大码王阅读(3189) 评论(1) 推荐(0) 编辑

python之（9）Python操作MySQL

摘要： import MySQLdb #查询数量 def Count(cur): count=cur.execute('select * from Student') print （'there has %s rows record' % count） #插入 def Insert(cur): sql = 阅读全文

posted @ 2020-06-15 17:13 大码王阅读(241) 评论(0) 推荐(0) 编辑

Python绘图之（7）turtle画五环

摘要：代码实现： import turtle turtle.goto(0,0) turtle.color("blue") turtle.pensize(5) turtle.circle(50) turtle.penup() turtle.goto(100,0) turtle.color("green") 阅读全文

posted @ 2020-06-15 16:44 大码王阅读(758) 评论(0) 推荐(0) 编辑

Python绘图之（6）turtle绘制彩色螺旋线

摘要：代码实现： #绘制彩色螺旋线 import turtle import time turtle.pensize(2) turtle.bgcolor("black") colors = ["red","yellow","purple","blue"] turtle.tracer(False) for 阅读全文

posted @ 2020-06-15 16:41 大码王阅读(4651) 评论(0) 推荐(0) 编辑

Python绘图之（5）turtle 画一朵花

摘要：操纵海龟绘图有着许多的命令,这些命令可以划分为两种:一种为运动命令，一种为画笔控制命令1. 运动命令:forward(degree) #向前移动距离degree代表距离backward(degree) #向后移动距离degree代表距离right(degree) #向右移动多少度left(degre 阅读全文

posted @ 2020-06-15 16:32 大码王阅读(2492) 评论(0) 推荐(0) 编辑

SparkStreaming入门到实战之(15)--Spark Streaming+Kafka提交offset实现有且仅有一次(exactly-once)

摘要：本文讲Spark Streamming使用Direct方式读取Kafka，并在输出（存储）操作之后提交offset到Kafka里实现程序读写操作有且仅有一次，即程序重启之后之前消费并且输出过的数据不再重复消费，接着上次消费的位置继续消费Kafka里的数据。Spark Streamming+Kafka 阅读全文

posted @ 2020-06-15 16:26 大码王阅读(924) 评论(1) 推荐(0) 编辑

SparkStreaming入门到实战之(14)--利用Spark实现Oracle到Hive的历史数据同步

摘要： 1、需求背景通过Spark将关系型数据库（以Oracle为例）的表同步的Hive，这里讲的只是同步历史数据，不包括同步增量数据。 2、Oracle和Hive的字段类型对应利用Spark的字段类型自动匹配，本来以为Spark匹配的不是很好，只是简单的判断一下是否为数字、字符串，结果经验证，Spar 阅读全文

posted @ 2020-06-15 16:24 大码王阅读(975) 评论(0) 推荐(0) 编辑

公告