上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 29 下一页
摘要: 如何使用python查看不同格式文件的内容,涉及到的格式有plk, npy, mat, tif,excel,csv,图片,视频等。一、.plk格式文件python中经常见到.plk格式的文件,如何读取并查看其内容呢? import pickle data_path = 'D:\\outputs.pk 阅读全文
posted @ 2021-07-22 23:03 常给自己加个油 阅读(1000) 评论(0) 推荐(0) 编辑
摘要: 大量数据中具有"相似"特征的数据点或样本划分为一个类别。聚类分析提供了样本集在非监督模式下的类别划分。聚类的基本思想是"物以类聚、人以群分",将大量数据集中相似的数据样本区分出来,并发现不同类的特征。 聚类模型可以建立在无类标记的数据上,是一种非监督的学习算法。尽管全球每日新增数据量以PB或EB级别 阅读全文
posted @ 2021-07-22 15:26 常给自己加个油 阅读(1336) 评论(0) 推荐(0) 编辑
摘要: 机器学习系列(11)_Python中Gradient Boosting Machine(GBM)调参方法详解 原文链接:http://blog.csdn.net/han_xiaoyang/article/details/52663170 原创 2016年09月25日 17:33:34 标签: pyt 阅读全文
posted @ 2021-07-21 11:12 常给自己加个油 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 深度神经网络——从单隐层神经网络到深度神经网络各个超参数介绍和案例(找出可能流失的客户)_sjjsaaaa的博客-CSDN博客 深度神经网络一、神经网络原理1.传统机器学习算法的局限性越简单的关系越容易过拟合。对于特征的变换、升阶,以及多个特征相互组合形成新特征的过程,就是机器学习过程中既耗时又耗力 阅读全文
posted @ 2021-07-15 09:00 常给自己加个油 阅读(939) 评论(0) 推荐(0) 编辑
摘要: Python 的sklearn库包含许多可用于机器学习的工具,本文以经典的泰坦尼克号问题为例,来说明在Python中使用sklearn做机器学习的一般流程。由于本人对机器学习了解还不深,对于本文内容如有任何建议或意见,欢迎提出!闲话少说,咱们立即进入主题。 1. 读取并查看数据 泰坦尼克号问题,Ka 阅读全文
posted @ 2021-07-14 12:26 常给自己加个油 阅读(543) 评论(0) 推荐(1) 编辑
摘要: 本章总览 模型验证:model.evaluate()这个函数封装的比较low,建议大家自己写,虽然我现在先不会,但是思路是这样的。模型预测:model.predict()虽然也是封装好的,但是我们一样可以自己写。 回调函数回调函数就是keras在模型训练时,需要调用多个函数。调用会根据这些函数进行保 阅读全文
posted @ 2021-07-11 21:27 常给自己加个油 阅读(711) 评论(0) 推荐(0) 编辑
摘要: 有时候从网上下载的数据集扩展名(后缀名)是npz,我们需要对数据进行加载(读取):例如:识别猫狗图片的二分类,下的数据集分别为cat.npz和dog.npz import numpy as npcat_data = np.load('cat.npz')dog_data = np.load('dog. 阅读全文
posted @ 2021-07-11 19:15 常给自己加个油 阅读(4856) 评论(0) 推荐(1) 编辑
摘要: 在机器学习、深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论文中给出了常用优化器的比较,今天来学习一下:https://arxiv.org/pdf/1609.0 阅读全文
posted @ 2021-07-10 22:54 常给自己加个油 阅读(842) 评论(0) 推荐(0) 编辑
摘要: 机器经过阅读大量的words,将每个单词用vector表示,vector的dimension表达着这个单词的属性,意思相近单词,dimension就会呈现出来。vector就是word embedding。 为了表示每个单词之间有联系,用二维vector来表示单词。可以更直观的看出每个单词的所属的类 阅读全文
posted @ 2021-06-19 09:55 常给自己加个油 阅读(2384) 评论(0) 推荐(0) 编辑
摘要: 寻找数据集の奥义 根据CMU的说法,寻找一个好用的数据集需要注意一下几点: 数据集不混乱,否则要花费大量时间来清理数据。数据集不应包含太多行或列,否则会难以使用。数据越干净越好,清理大型数据集可能非常耗时。应该预设一个有趣的问题,而这个问题又可以用数据来回答。 去哪里找数据集 Kaggle:爱竞赛的 阅读全文
posted @ 2021-06-19 09:36 常给自己加个油 阅读(149) 评论(0) 推荐(0) 编辑
上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 29 下一页