常给自己加个油

2021年7月22日

摘要：如何使用python查看不同格式文件的内容，涉及到的格式有plk, npy, mat, tif，excel,csv,图片，视频等。一、.plk格式文件python中经常见到.plk格式的文件，如何读取并查看其内容呢？ import pickle data_path = 'D:\\outputs.pk 阅读全文

posted @ 2021-07-22 23:03 常给自己加个油阅读(1116) 评论(0) 推荐(0) 编辑

kmeans中的k的含义_机器学习 | KMeans聚类分析详解

摘要：大量数据中具有"相似"特征的数据点或样本划分为一个类别。聚类分析提供了样本集在非监督模式下的类别划分。聚类的基本思想是"物以类聚、人以群分"，将大量数据集中相似的数据样本区分出来，并发现不同类的特征。聚类模型可以建立在无类标记的数据上，是一种非监督的学习算法。尽管全球每日新增数据量以PB或EB级别阅读全文

posted @ 2021-07-22 15:26 常给自己加个油阅读(1451) 评论(0) 推荐(0) 编辑

2021年7月21日

机器学习系列(11)_Python中Gradient Boosting Machine(GBM）调参方法详解

摘要：机器学习系列(11)_Python中Gradient Boosting Machine(GBM）调参方法详解原文链接：http://blog.csdn.net/han_xiaoyang/article/details/52663170 原创 2016年09月25日 17:33:34 标签： pyt 阅读全文

posted @ 2021-07-21 11:12 常给自己加个油阅读(111) 评论(0) 推荐(0) 编辑

2021年7月15日

深度神经网络——从单隐层神经网络到深度神经网络各个超参数介绍和案例（找出可能流失的客户）

摘要：深度神经网络——从单隐层神经网络到深度神经网络各个超参数介绍和案例（找出可能流失的客户）_sjjsaaaa的博客-CSDN博客深度神经网络一、神经网络原理1.传统机器学习算法的局限性越简单的关系越容易过拟合。对于特征的变换、升阶，以及多个特征相互组合形成新特征的过程，就是机器学习过程中既耗时又耗力阅读全文

posted @ 2021-07-15 09:00 常给自己加个油阅读(1024) 评论(0) 推荐(0) 编辑

2021年7月14日

基于PYTHON SKLEARN应用逻辑回归对泰坦尼克乘客存活做预测（一）

摘要： Python 的sklearn库包含许多可用于机器学习的工具，本文以经典的泰坦尼克号问题为例，来说明在Python中使用sklearn做机器学习的一般流程。由于本人对机器学习了解还不深，对于本文内容如有任何建议或意见，欢迎提出！闲话少说，咱们立即进入主题。 1. 读取并查看数据泰坦尼克号问题，Ka 阅读全文

posted @ 2021-07-14 12:26 常给自己加个油阅读(616) 评论(0) 推荐(1) 编辑

2021年7月11日

tensorflow2.0学习记录-模型训练（keras版本模型训练）-各种回调函数的介绍

摘要：本章总览模型验证：model.evaluate()这个函数封装的比较low，建议大家自己写，虽然我现在先不会，但是思路是这样的。模型预测：model.predict()虽然也是封装好的，但是我们一样可以自己写。回调函数回调函数就是keras在模型训练时，需要调用多个函数。调用会根据这些函数进行保阅读全文

posted @ 2021-07-11 21:27 常给自己加个油阅读(766) 评论(0) 推荐(0) 编辑

Python中.npz文件的读取

摘要：有时候从网上下载的数据集扩展名（后缀名）是npz，我们需要对数据进行加载（读取）：例如：识别猫狗图片的二分类，下的数据集分别为cat.npz和dog.npz import numpy as npcat_data = np.load('cat.npz')dog_data = np.load('dog. 阅读全文

posted @ 2021-07-11 19:15 常给自己加个油阅读(4966) 评论(0) 推荐(1) 编辑

2021年7月10日

深度学习——优化器算法Optimizer详解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

摘要：在机器学习、深度学习中使用的优化算法除了常见的梯度下降，还有 Adadelta，Adagrad，RMSProp 等几种优化器，都是什么呢，又该怎么选择呢？在 Sebastian Ruder 的这篇论文中给出了常用优化器的比较，今天来学习一下：https://arxiv.org/pdf/1609.0 阅读全文

posted @ 2021-07-10 22:54 常给自己加个油阅读(935) 评论(0) 推荐(0) 编辑

2021年6月19日

详细讲解word embedding

摘要：机器经过阅读大量的words，将每个单词用vector表示，vector的dimension表达着这个单词的属性，意思相近单词，dimension就会呈现出来。vector就是word embedding。为了表示每个单词之间有联系，用二维vector来表示单词。可以更直观的看出每个单词的所属的类阅读全文

posted @ 2021-06-19 09:55 常给自己加个油阅读(2423) 评论(0) 推荐(0) 编辑

50个史上最佳机器学习公共数据集

摘要：寻找数据集の奥义根据CMU的说法，寻找一个好用的数据集需要注意一下几点：数据集不混乱，否则要花费大量时间来清理数据。数据集不应包含太多行或列，否则会难以使用。数据越干净越好，清理大型数据集可能非常耗时。应该预设一个有趣的问题，而这个问题又可以用数据来回答。去哪里找数据集 Kaggle：爱竞赛的阅读全文

posted @ 2021-06-19 09:36 常给自己加个油阅读(158) 评论(0) 推荐(0) 编辑

常给自己加个油

公告