博客园  :: 首页  :: 新随笔  :: 管理

2020年8月7日

摘要: #基于概率论的分类方法:朴素贝叶斯 ''' 优点:在数据较少的情况下任然有效,可以处理多类别问题。 缺点:对于输入数据的准备方式较为敏感。 适用数据类型:标称型数据 贝叶斯概率引入先验知识和逻辑推理来处理不确定命题。 朴素贝叶斯的一般过程: 1.收集数据:可以使用任何方法。本章使用RSS源。 2.准 阅读全文

posted @ 2020-08-07 15:43 wsg_blog 阅读(318) 评论(0) 推荐(0) 编辑

2020年8月5日

摘要: 本系列博客为学习《机器学习实战》学习笔记与代码实现 目录: k-近邻算法实现“电影、约会网站、手写数字识别”分类 决策树原理及分类实战 基于概率论的分类方法:朴素贝叶斯 logistic逻辑回归、最优化算法 支持向量机(SVM) 二分K-均值聚类算法 使用Apriori算法进行关联分析 主成成分分析 阅读全文

posted @ 2020-08-05 14:32 wsg_blog 阅读(172) 评论(0) 推荐(0) 编辑

摘要: #决策树#环境:Linux、python3.7.5 ''' 决策树的一个重要任务是为了了解数据结构中所蕴含的知识信息,因此决策树可以使用不熟悉的数据集合,并从中提取出一系列规则, 这些机器根据数据集创建规则的过程,就是机器学习的过程。专家系统中经常使用决策树,而且决策树给出结果往往可以匹敌在当前 领 阅读全文

posted @ 2020-08-05 14:26 wsg_blog 阅读(621) 评论(0) 推荐(0) 编辑

2020年8月2日

摘要: 环境:Linux、python3.7.5 需要的数据集:链接: https://pan.baidu.com/s/1KdH1DgErvgu4GC8MrwY-FA 提取码: wb3h 代码如下 #k-近邻算法概述 ''' 简单的说k-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异 阅读全文

posted @ 2020-08-02 14:57 wsg_blog 阅读(517) 评论(0) 推荐(0) 编辑

2020年7月3日

摘要: index 数据结构与算法 二叉树 ####二叉树具有五种基本形态: 空二叉树、只有一个根节点、根结点只有左子树、根结点只有右子树、根节点既有左子树又有右子树 ####特殊二叉树: 斜树 斜树一定要是斜的,但是往哪斜还是有讲究。所有结点都只有左子树的二叉树叫左斜树;所有结点都只有右子树的二叉树叫右斜 阅读全文

posted @ 2020-07-03 19:42 wsg_blog 阅读(159) 评论(0) 推荐(0) 编辑

2020年6月29日

摘要: index 数据结构与算法 ##KMP模式匹配算法 KMP就解决的经典问题是文本串中是否出现过模式串,文本串:aabaabaaf,模式串:aabaaf;暴力匹配算法为两层for循环,时间复杂度O(m*n) ###KMP理论原理 ####前缀表 前缀表即prifix或next数组,是用模式串aabaa 阅读全文

posted @ 2020-06-29 15:34 wsg_blog 阅读(226) 评论(0) 推荐(0) 编辑

2020年6月26日

摘要: index 数据结构与算法 ##栈(stack) 栈是一种先进后出的数据结构,浏览器的“后退,前进”键就是通过栈的结构来实现的,深度优先遍历(dfs、递归)的也会用到栈,栈(Stack)是限定仅在表尾进行插入和删除的线性表 ###顺序存储结构 typedef int SElemType; typed 阅读全文

posted @ 2020-06-26 14:17 wsg_blog 阅读(277) 评论(0) 推荐(0) 编辑

2020年6月10日

摘要: index 数据结构与算法 作者:invalid s 链接:https://www.zhihu.com/question/20066988/answer/26968999 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 一般来说,数据结构和算法这本书上提到的任何算法 阅读全文

posted @ 2020-06-10 18:12 wsg_blog 阅读(148) 评论(0) 推荐(0) 编辑

摘要: index 数据结构与算法 ##ADT(array data table)线性表 Data 线性表的数据对象集合为{$a_1,a_2,a_3...a_n$},每个元素的类型均为DataType。其中,除第一个元素$a_1$外,每一个元素有且只有一个直接前驱元素,除了最后一个元素$a_n$外,每一个元 阅读全文

posted @ 2020-06-10 18:02 wsg_blog 阅读(229) 评论(0) 推荐(0) 编辑

2020年6月3日

摘要: 数据结构与算法 程序设计的实质是对确定的问题选择一种好的结构,加上设计一种好的算法;程序设计=数据结构+算法。 随着你对编程进一步的探索,你会发现很多 高性能的库、框架 的底层实现都用到了数据结构的思想,20220525re-edit. 只知道用一样东西,不明白他的道理,实在不高明 ,所以说数据结构 阅读全文

posted @ 2020-06-03 15:26 wsg_blog 阅读(195) 评论(0) 推荐(0) 编辑

2020年4月29日

摘要: 开发三件套:MobaXterm(putty)、WinSCP、VSCode.zip 文档三件套:nodepad++(工作计划、看数据)、Typora(说明文档)、XMind(流程图) Markdown官方文档,墙裂推荐-十五分钟让你快速学习MarkDown语法到精通排版实战备忘 pdf阅读器:suma 阅读全文

posted @ 2020-04-29 18:55 wsg_blog 阅读(203) 评论(0) 推荐(0) 编辑

2020年4月26日

摘要: 想成为一名优秀的编码砖家,要掌握的知识其实是很多的,操作系统底原理、编译原理、计算机网络、设计模式、高性能、高并发分布式、架构设计等等,其实精通其中的一个方向,就足够让你走的很远。 计算机科普:软件篇、硬件篇、电路篇 小试牛刀:牛客网HOT101、跟着carl学算法、王争算法 c、c++、go、ja 阅读全文

posted @ 2020-04-26 00:10 wsg_blog 阅读(273) 评论(1) 推荐(0) 编辑

2020年4月7日

摘要: 首先看一张图,这是来自炼数成金的讲师Ben关于深度学习框架tensorflow课程中的一张图,textcnn(paper),一般理解了这张图就基本理解了cnn文本分类的基本方法; 简单总结一下: 首先我对这些矩阵数据从0-17做了标号,方便后续的说明; 其中0为输入数据“I like this mo 阅读全文

posted @ 2020-04-07 00:09 wsg_blog 阅读(5269) 评论(0) 推荐(0) 编辑

2020年4月6日

摘要: 此代码为Google tensorflow例子代码,可在github找到 (word2vec_basic.py) 关于word2vec的介绍,之前也整理了一篇文章,感兴趣的朋友可以去看下,示例代码是skip-gram的训练方式,这里简单概括一下训练的数据怎么来的:比如,有这么一句话“喜欢写博客”,经 阅读全文

posted @ 2020-04-06 00:03 wsg_blog 阅读(4397) 评论(0) 推荐(0) 编辑

2020年4月4日

摘要: 上一篇博客介绍了怎么获取inception v3模型数据,现在我们用下载好的模型进行简单的图片分类实验。 import tensorflow as tf import os import numpy as np import re from PIL import Image import matpl 阅读全文

posted @ 2020-04-04 23:22 wsg_blog 阅读(1846) 评论(0) 推荐(0) 编辑

摘要: import tensorflow as tf import os import tarfile import requests #模型下载地址 inception_pretrain_model_url='http://download.tensorflow.org/models/image/ima 阅读全文

posted @ 2020-04-04 18:06 wsg_blog 阅读(1314) 评论(7) 推荐(0) 编辑

2020年3月22日

摘要: 我们先定义一个简单的神经网络,用来训练模型,然后将模型保存下来,最后加载保存下来的模型进行检测,查看输出结果。 #模型训练和保存 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #载 阅读全文

posted @ 2020-03-22 16:34 wsg_blog 阅读(1057) 评论(0) 推荐(0) 编辑

摘要: import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #载入数据集 mnist = input_data.read_data_sets("MNIST_data/",one_hot=True 阅读全文

posted @ 2020-03-22 00:29 wsg_blog 阅读(2133) 评论(0) 推荐(0) 编辑

2020年3月15日

摘要: 通俗理解rnn和lstm区别 RNN 循环神经网络主要适合处理有连续特征的数据(序列数据),比如语音、文本等 对于自然语言处理来讲,通常我们会首先对一段话进行分词,将分好后的词$X_0,X_1,X_2...X_t$依次输入其中,前面的每个词经过rnn中的A(类似于bp神经网络结构)后,都会对A产生影 阅读全文

posted @ 2020-03-15 17:39 wsg_blog 阅读(1196) 评论(0) 推荐(0) 编辑

摘要: 卷积和池化在深度学习中的作用是对图像和文本信息提取特征的常用方式,特别是在分类领域 卷积:通过不同的卷积核与图像或文本数据矩阵 进行矩阵相乘,得到不同特征的若干组训练特征数据 池化:池化通常有两种最大池化(max-pooling)和平均池化,最大池化就是在一块矩阵区域(比如2X2,4个像素点),取最 阅读全文

posted @ 2020-03-15 01:51 wsg_blog 阅读(1480) 评论(4) 推荐(0) 编辑

2020年3月9日

摘要: putty工具是开源免费的远程ssh工具,界面整洁,小巧好用,配合同样小巧整洁且免费的WinSCP的sftp功能,绝对是linux后端开发的利器 说下解决putty中文显示乱码的问题 1.更改linux系统的语言环境 vim ~/.bash_profile 在最后添加一行 LANG="zh_CN.U 阅读全文

posted @ 2020-03-09 20:06 wsg_blog 阅读(7990) 评论(0) 推荐(0) 编辑

2020年2月24日

摘要: tensorflow中的优化器有很多种,也有很多类似的博客,当然最常用的是AdamOptimizer,我们这里就通过adam和衰减的学习率加上之前学的多层结构,使手写数字模型准确率达到98%以上 import tensorflow as tf from tensorflow.examples.tut 阅读全文

posted @ 2020-02-24 22:35 wsg_blog 阅读(1045) 评论(0) 推荐(0) 编辑

2020年2月23日

摘要: 减小过拟合的几种方法: 我们建一个三层的网络,并给他加上dropout 测试一下训练20次的准确率 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #载入数据集 mnist=inpu 阅读全文

posted @ 2020-02-23 23:56 wsg_blog 阅读(863) 评论(0) 推荐(0) 编辑

摘要: 二次代价函数 $C = \frac{1} {2n} \sum_{x_1,...x_n} \|y(x)-a^L(x) \|^2$ 其中,C表示代价函数,x表示样本,y表示实际值,a表示输出值,n表示样本的总数;整个的意思就是把n个y-a的平方累加起来,再除以2n求一下均值。 为简单起见,先看下 一个样 阅读全文

posted @ 2020-02-23 00:53 wsg_blog 阅读(3561) 评论(0) 推荐(0) 编辑

2020年2月15日

摘要: simple版本nn模型 训练手写数字处理 MNIST_data数据 百度网盘链接:https://pan.baidu.com/s/19lhmrts-vz0-w5wv2A97gg 提取码:cgnx import tensorflow as tf from tensorflow.examples.tu 阅读全文

posted @ 2020-02-15 01:16 wsg_blog 阅读(1338) 评论(0) 推荐(0) 编辑

2020年2月14日

摘要: 这个程序为简单的三层结构组成:输入层、中间层、输出层 运行环境为 ubuntu 要理清各层间变量个数 import numpy as np import matplotlib.pyplot as plt import tensorflow as tf #使用numpy生成200个随机点 x_data 阅读全文

posted @ 2020-02-14 00:51 wsg_blog 阅读(905) 评论(0) 推荐(0) 编辑

2020年2月13日

摘要: 给不明白深度学习能干什么的同学,感受下深度学习的power import tensorflow as tf import numpy as np #使用numpy生成100个随机点 x_data=np.random.rand(100) y_data=x_data*0.1+0.2 #这里我们设定已知直 阅读全文

posted @ 2020-02-13 02:27 wsg_blog 阅读(786) 评论(0) 推荐(0) 编辑

摘要: import tensorflow as tf #Fetch概念 在session中同时运行多个op input1=tf.constant(3.0) #constant()是常量不用进行init初始化 input2=tf.constant(2.0) input3=tf.constant(5.0) a 阅读全文

posted @ 2020-02-13 01:47 wsg_blog 阅读(714) 评论(0) 推荐(0) 编辑

摘要: Index C++ c++中的Exceptions异常处理 Exceptions用于处理Run-time Error; //文件读取的异常捕获伪代码 try{ open the file; determine its size; allocate that much memory; read the 阅读全文

posted @ 2020-02-13 01:00 wsg_blog 阅读(460) 评论(0) 推荐(0) 编辑

摘要: import tensorflow as tf x=tf.Variable([1,2]) a=tf.constant([3,3]) sub=tf.subtract(x,a) #增加一个减法op add=tf.add(x,sub) #增加一个加法op #注意变量再使用之前要再sess中做初始化,但是下 阅读全文

posted @ 2020-02-13 00:58 wsg_blog 阅读(884) 评论(0) 推荐(0) 编辑