2019 年 10月 19 日随笔档案 - 心平万物顺

2019年10月19日

摘要：人脸识别，基于人脸部特征信息识别身份的生物识别技术。摄像机、摄像头采集人脸图像或视频流，自动检测、跟踪图像中人脸，做脸部相关技术处理，人脸检测、人脸关键点检测、人脸验证等。《麻省理工科技评论》(MIT Technology Review)，2017年全球十大突破性技术榜单，支付宝“刷脸支付”(Pay 阅读全文

posted @ 2019-10-19 20:58 心平万物顺阅读(442) 评论(0) 推荐(0) 编辑

垃圾邮件分类

摘要：简介：朴素贝叶斯垃圾邮件分类器是在对邮件关键字进行统计分析到基础上利用贝叶斯公式进行分类到方法。相比其他模型，朴素贝叶斯模型到搭建比较简单，并且具有良好到分类效果。朴素真贝叶斯分类器通过对邮件关键字进行统计，然后使用贝叶斯推理来计算一封电子邮件是或不是垃圾邮件的概率。贝叶斯定理：表示事件B 阅读全文

posted @ 2019-10-19 20:56 心平万物顺阅读(1382) 评论(0) 推荐(0) 编辑

网站验证码自动识别

摘要： 0x001 深度学习基础由于本文只是简单做一下验证码的介绍并不会过多深入讲述深度学习。只是简单概括一下深度学习需要做的事情。总体来讲，深度学习的4个步骤采样，制作样本文件根据样本文件类型创建识别模型对样本文件分为训练样本和测试样本来训练识别模型保存识别模型和验证下面按照上面四个历程来阅读全文

posted @ 2019-10-19 20:55 心平万物顺阅读(543) 评论(0) 推荐(0) 编辑

波士顿房价预测

摘要：波士顿房屋数据集：可视化数据集的重要特征：探索性数据分析（Exploratory Data Analysis，EDA）是机器学习模型训练之前的一个重要步骤。在本节的后续内容中，借助EDA图形工具箱中那些简单且有效的技术，可以帮助我们直观地发现数据中的异常情况、数据的分布情况，以及特征间的相互关阅读全文

posted @ 2019-10-19 20:54 心平万物顺阅读(1495) 评论(0) 推荐(0) 编辑

泰坦尼克获救预测

摘要：数据中标签的含义： PassengerId => 乘客ID Pclass => 乘客等级(1/2/3等舱位) Name => 乘客姓名 Sex => 性别 Age => 年龄 SibSp => 堂兄弟/妹个数 Parch => 父母与小孩个数 Ticket => 船票信息 Fare => 票价 Ca 阅读全文

posted @ 2019-10-19 20:53 心平万物顺阅读(744) 评论(0) 推荐(0) 编辑

利用sklearn库预测科比生涯数据

摘要：先来看看这份科比生涯的数据集：数据集下载这个表格记录了科比30000多个镜头的详细数据，共有25个标签。具体的设计思路是将这25个标签代表的数据进行分析，找出对科比投篮结果有影响的标签，利用机器学习中随机森林的算法训练出可以预测科比是否能够投篮命中的模型。先来看看这25个标签具体代表什么(自己阅读全文

posted @ 2019-10-19 20:51 心平万物顺阅读(1028) 评论(0) 推荐(0) 编辑

python实现逻辑回归

摘要： import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom numpy.random import seedclass Ada 阅读全文

posted @ 2019-10-19 20:47 心平万物顺阅读(478) 评论(0) 推荐(0) 编辑

神经网络、BP算法、深度学习

摘要：众所周知，深度学习正逐渐获得越来越多的关注，并且毫无疑问成为机器学习领域最热门的话题。深度学习可以被看作是一组算法的集合，这些算法能够高效地进行多层人工神经网络训练。在本章，读者将学习人工神经网络的基本概念，并且接触到新近基于Python开发的深度学习库，从而更进一步去探索机器学习研究领域中这一阅读全文

posted @ 2019-10-19 20:45 心平万物顺阅读(669) 评论(0) 推荐(0) 编辑

剖析分类、聚类、决策树、回归以及神经网络

摘要：在大数据时代，数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程，也是一种决策支持过程。其主要基于人工智能，机器学习，模式学习，统计学等。通过对大数据高度自动化地分析，做出归纳性的推理，从中挖掘出潜在的模式，阅读全文

posted @ 2019-10-19 20:43 心平万物顺阅读(2073) 评论(0) 推荐(1) 编辑

词向量模型word2vec

摘要： Word2vec 是一种计算效率特别高的预测模型，用于学习原始文本中的字词嵌入。它分为两种类型：连续词袋模型 (CBOW) 和 Skip-Gram 模型。从算法上看，这些模型比较相似，只是 CBOW 从源上下文字词（“the cat sits on the”）中预测目标字词（例如“mat”），阅读全文

posted @ 2019-10-19 20:41 心平万物顺阅读(718) 评论(0) 推荐(0) 编辑

自然语言识别、分析原理

摘要：大多数自然语言处理应用都是（至少部分）基于RNN的，诸如机器翻译、自动总结、语法分析、观点分析等。在本章的最后部分，我们将要看看机器翻译模型是如何工作的。TensorFlow的Word2Vec和Seq2Seq教程详细地介绍了这部分内容，你应该认真学习一下。单词嵌入：在开始之前，我们需要选择一个阅读全文

posted @ 2019-10-19 20:40 心平万物顺阅读(977) 评论(0) 推荐(0) 编辑

性能评价

摘要：模型评估与参数调优实战：通过对算法进行调优来构建性能良好的机器学习模型，并对模型的性能进行评估。基于流水线的工作流：在使用训练数据对模型进行拟合时就得到了一些参数，但将模型用于新数据时需重设这些参数。 scikit-learn中的Pipline类可以拟合出包含任意多个处理步骤的模型，并将模型用阅读全文

posted @ 2019-10-19 00:12 心平万物顺阅读(404) 评论(0) 推荐(0) 编辑

朴素贝叶斯

posted @ 2019-10-19 00:10 心平万物顺阅读(151) 评论(0) 推荐(0) 编辑

随机森林与集成算法

摘要：决策树：使用决策树算法，我们从树根开始，基于可获得最大信息增益（information gain，IG）的特征来对数据进行划分，我们将在下一节详细介绍信息增益的概念。通过迭代处理，在每个子节点上重复此划分过程，直到叶子节点。这意味着在每一个节点处，所有的样本都属于同一类别。在实际应用中，这可能阅读全文

posted @ 2019-10-19 00:08 心平万物顺阅读(1211) 评论(0) 推荐(0) 编辑

公告