11 2020 档案
摘要:作者|Rashida Nasrin Sucky 编译|VK 来源|Towards Data Science Python是开源的。对于使用python的数据科学家来说,Numpy这个库是必不可少的。其他一些基本的库,如Pandas,Scipy是建立在Numpy的基础上。所以我决定做一份备忘录。这里我
阅读全文
摘要:作者|Behic Guven 编译|VK 来源|Towards Data Science 在这篇文章中,我将向你介绍一种称为监督学习的机器学习方法。我将向你展示如何使用Scikit-learn构建kNN分类器模型。 这将是一个实践演练,我们将能够在实践知识的同时学习。作为我们的分类器模型,我们将使用
阅读全文
摘要:作者|Anders Ohrn 编译|VK 来源|Towards Data Science 利用深度卷积神经网络(DCNN)进行监督图像分类是一个成熟的过程。通过预训练模板模型加上微调优化,可以在许多有意义的应用中获得非常高的准确率——比如最近在医学图像上的这项研究,在日常物体图像上预训练的模板Inc
阅读全文
摘要:作者|Billy Fetzner 编译|VK 来源|Towards Data Science 我认为,既然你点开了这个页面,你可能有大量的数据需要分析,你可能正在想最好和最有效的方法来解决你数据的一些问题。你问题的答案可以通过Pandas解决。 如何接触Pandas 由于Pandas的流行,它有自己
阅读全文
摘要:作者|Soner Yıldırım 编译|VK 来源|Towards Data Science 数据结构是任何编程语言的关键部分。为了创建健壮且性能良好的产品,必须非常了解数据结构。 在这篇文章中,我们将研究Python编程语言的一个重要数据结构,即字典。 字典是键值对的无序集合。每个项都有一个键和
阅读全文
摘要:作者|Marco Santos 编译|Flin 来源|towardsdatascience 在无休止地浏览成百上千个交友档案,却没有一个与之匹配之后,人们可能会开始怀疑这些档案是如何在手机上出现的。所有这些配置文件都不是他们要找的类型。他们已经刷了好几个小时甚至几天,都没有发现任何成功。他们可能会问
阅读全文
摘要:作者|Abhishek 编译|Flin 来源|analyticsvidhya 第1部分 从在自定义数据集中训练检测器到使用TensorFlow 1.15在Jetson纳米板或云上进行推理的详细步骤 完整代码可在GitHub上获得 TensorFlow对象检测API V2的教程可作为jupyter n
阅读全文
摘要:作者|Khuyen Tran 编译|VK 来源|Towards Data Science 动机 Sklearn是一个很好的库,有各种机器学习模型,可以用来训练数据。但是如果你的数据很大,你可能需要很长时间来训练你的数据,特别是当你用不同的超参数来寻找最佳模型时。 有没有一种方法可以使机器学习模型的训
阅读全文
摘要:作者|Soner Yıldırım 编译|VK 来源|Towards Data Science SQL是一种编程语言,大多数关系数据库管理系统(RDBMS)都使用它来管理以表格形式(即表)存储的数据。 SQL是数据科学家所期望的一项基本技能。你可能会说,这是一个数据工程师的工作,但数据科学家的角色往
阅读全文
摘要:作者|Moez Ali 编译|VK 来源|Towards Data Science PyCaret PyCaret是Python中的一个开源、低代码的机器学习库,它自动化了机器学习工作流。它是一个端到端的机器学习和模型管理工具,可以加快机器学习实验的周期,并使你更有效率。 与其他开放源代码机器学习库
阅读全文
摘要:作者|Rashida Nasrin Sucky 编译|VK 来源|Towards Data Science 我们使用python的pandas库主要用于数据分析中的数据操作,但我们也可以使用Pandas进行数据可视化。你甚至不需要为此导入Matplotlib库。 Pandas本身可以在后端使用Mat
阅读全文
摘要:作者|Kenichi Nakanishi 编译|VK 来源|Towards Data Science 我有一个爱买植物的未婚妻,还有一只爱啃植物的猫——我想,有什么比把一个能告诉我植物是否安全的分类器更好呢! 需要注意的一点是,这里所做的所有工作都是在google colabs上完成的,使用的not
阅读全文
摘要:作者|Louis Teo 编译|VK 来源|Towards Data Science 你有没有读过很多的报告,而你只想对每个报告做一个快速的总结摘要?你是否曾经遇到过这样的情况? 摘要已成为21世纪解决数据问题的一种非常有帮助的方法。在本篇文章中,我将向你展示如何使用Python中的自然语言处理(N
阅读全文
摘要:作者|Louis Chan 编译|VK 来源|Towards Data Science Python可以说是当今最酷的编程语言(多亏了机器学习和数据科学),但与最好的编程语言之一C相比,它的效率并不是很高。 在开发机器学习模型时,很常见的情况是,我们需要根据从统计分析或上一次迭代的结果导出的硬编码规
阅读全文
摘要:作者|Vishal Mishra 编译|VK 来源|Towards Data Science 欢迎阅读Python教程。在本章中,我们将学习文件、异常处理和其他一些概念。我们开始吧。 __name__ == '__main__'是什么意思? 通常,在每个Python项目中,我们都会看到上面的语句。所
阅读全文
摘要:作者|VETRIVEL_PS 编译|Flin 来源|analyticsvidhya 总览 本文是我的第一篇Analytics Vidhya的博客文章的第二部分,该文章是进入机器学习黑客马拉松的前10%的终极入门者指南。 如果你遵循本文列出的这些简单步骤,那么赢得黑客马拉松的分类问题就比较简单 始终保
阅读全文
摘要:作者|Adam Geitgey 编译|Flin 来源|medium 新的Nvidia Jetson Nano 2GB开发板(今天宣布!)是一款单板机,售价59美元,运行带有GPU加速的人工智能软件。 到2020年,你可以从一台售价59美元的单板计算机中获得令人惊叹的性能。让我们用它来创建一个门铃摄像
阅读全文
摘要:作者|Stan Kriventsov 编译|Flin 来源|medium 在这篇博文中,我想在不作太多技术细节的情况下,解释其作者提交给2021 ICLR会议的新论文“一张图等于16x16个字:用于大规模图像识别的变压器”的意义(目前为止匿名)。 另一篇文章中,我提供了一个示例,该示例将这种新模型(
阅读全文
摘要:作者|Samarendra Chandan Bindu Dash 编译|Flin 来源|analyticsvidhya 介绍 在本文中,我们将深入研究一种有趣的算法,称为“接缝雕刻”。调整图像的大小而不裁剪或扭曲其内容似乎是不可能完成的任务。我们将逐步构建,从头开始实现接缝雕刻算法,同时查看其背后的
阅读全文
摘要:作者|Lamothe Thibaud 编译|Flin 来源|towardsdatascience 使用曲率积分和动态时间规整,让我们深入研究抹香鲸识别! 前言 最近,我们尝试了Capgemini的全球数据科学挑战赛。我与Acores鲸鱼研究中心合作,挑战的目的是确定抹香鲸,用人工智能帮助拯救抹香鲸的
阅读全文
摘要:作者|ISHA5 编译|Flin 来源|analyticsvidhya 介绍 从开始从事数据可视化工作的那一天起,我就爱上它了。我总是喜欢从数据中获得有用的见解。 在此之前,我只了解基本图表,例如条形图,散点图,直方图等,这些基本图表内置在tableau中,而Power BI则用于数据可视化。通过每
阅读全文
摘要:作者|KRRAI77@GMAIL.COM 编译|Flin 来源|analyticsvidhya 介绍 Fastai是一个流行的开源库,用于学习和练习机器学习以及深度学习。杰里米·霍华德(Jeremy Howard)和蕾切尔·托马斯(Rachel Thomas)创立了 fast.ai, 其目标是使深度
阅读全文
摘要:作者|THILAKADIBOINA 编译|Flin 来源|analyticsvidhya 介绍 本文介绍了生成性对抗网络(Generative attersarial Networks,GAN)的使用,这是一种对真实的Covid-19数据进行过采样的技术,用于预测死亡率。这个故事让我们更好地理解数据
阅读全文
摘要:作者|Trung Anh Dang 编译|Flin 来源|towardsdatascience 多亏了计算机科学和电子技术的迅速发展,如今,就市场份额而言,面部识别正成为仅次于指纹的全球第二大生物特征认证方法。 每天,越来越多的制造商在他们的产品中加入面部识别功能,例如苹果公司采用了人脸识别技术,银
阅读全文
摘要:作者|Abhishek Annamraju 编译|Flin 来源|medium 计算机视觉是一个快速发展的领域,每天都有大量的新技术和算法出现在不同的会议和期刊上。说到目标检测,理论上你会学到很多算法,比如Faster-rcnn、Mask rcnn、Yolo、SSD、Retinenet、级联rcnn
阅读全文
摘要:作者|dhwani mehta 编译|Flin 来源|medium 图像风格化是近几十年来研究的一种图像处理技术,本文旨在展示一种高效新颖的风格注意力网络(SANet)方法,在平衡全局和局部风格模式的同时,保留内容结构,合成高质量的风格化图像。 风格迁移机制概述 有没有想象过如果由杰出的艺术家来制作
阅读全文
摘要:作者|KHYATI MAHENDRU 编译|VK 来源|Analytics Vidhya 介绍 你终于做到了!你得到了一个数据科学职位的面试机会。现在,在面试前一天,你不知道该学什么。日子快到了,但还有很多事情要做! 面试可能会让人望而生畏,再加上数据科学,你就得到了一杯令人头疼的鸡尾酒。数据科学专
阅读全文
摘要:作者|PADHMA 编译|VK 来源|Analytics Vidhya 介绍 正如著名作家韦恩•W•戴尔所说, 改变你看待事物的方式 你所看待的事物也会改变 当Python的新版本问世时,许多人担心向后兼容性问题和其他问题。但是如果你喜欢Python,你一定会对新更新中发布的特性感到兴奋。 Pyth
阅读全文
摘要:作者|GUEST BLOG 编译|VK 来源|Analytics Vidhya 介绍 在机器学习项目中,你需要遵循一系列步骤,直到你达到你的目标,你必须执行的步骤之一就是对你选择的模型进行超参数优化。此任务总是在模型选择过程之后完成(选择性能优于其他模型的最佳模型)。 什么是超参数优化? 在定义超参
阅读全文
摘要:梯度下降算法在机器学习中的工作原理 作者|NIKIL_REDDY 编译|VK 来源|Analytics Vidhya 介绍 梯度下降算法是工业中最常用的机器学习算法之一。但这让很多新人感到困惑。 如果你刚刚接触机器学习,梯度下降背后的数学并不容易。在本文中,我的目的是帮助你了解梯度下降背后的直觉。
阅读全文
摘要:作者|MUSKAN097 编译|VK 来源|Analytics Vidhya 简介 你已经成功地构建了分类模型。你现在该怎么办?你如何评估模型的性能,也就是模型在预测结果方面的表现。为了回答这些问题,让我们通过一个简单的案例研究了解在评估分类模型时使用的度量。 让我们通过案例研究深入了解概念 在这个
阅读全文
摘要:作者|PROCRASTINATOR 编译|VK 来源|Analytics Vidhya 概述 了解类权重优化是如何工作的,以及如何在logistic回归或任何其他算法中使用sklearn实现相同的方法 了解如何在不使用任何采样方法的情况下,通过修改类权重可以克服类不平衡数据的问题 介绍 机器学习中的
阅读全文
摘要:作者|Travis Tang (Voon Hao) 编译|VK 来源|Towards Data Science 在这一点上,任何人都认为机器学习在医学领域的潜力是老生常谈的。有太多的例子支持这一说法-其中之一就是微软利用医学影像数据帮助临床医生和放射科医生做出准确的癌症诊断。同时,先进的人工智能算法
阅读全文
摘要:作者|Vagif Aliyev 编译|VK 来源|Towards Data Science 线性回归可能是最常见的算法之一,线性回归是机器学习实践者必须知道的。这通常是初学者第一次接触的机器学习算法,了解它的操作方式对于更好地理解它至关重要。 所以,简单地说,让我们来分解一下真正的问题:什么是线性回
阅读全文
摘要:作者|David Woroniuk 编译|VK 来源|Towards Data Science 什么是异常 异常,通常称为异常值,是指数据中不符合数据系列总体行为的数据点、数据序列或模式。因此,异常检测就是检测不符合更广泛数据中的模式的数据点或序列的任务。 对异常数据的有效检测和删除对于许多业务功能
阅读全文
摘要:作者|TIMOTHY102 编译|VK 来源|Analytics Vidhya 介绍 Airbnb是一个在线市场,允许人们将自己的房产或空余房间出租给客人。每预订3位客人,收取12%和6%的佣金。 该公司自2009年成立以来,已从每年帮助2.1万名客人找到住处,发展到每年帮助600万人度假,目前在9
阅读全文
摘要:作者|Ruben Winastwan 编译|VK 来源|Towards Data Science 当你学习数据科学和机器学习时,线性回归可能是你遇到的第一个统计方法。我猜这不是你们第一次使用线性回归了。因此,在本文中,我想讨论概率线性回归,而不是典型的/确定性线性回归。 但在此之前,让我们简要讨论一
阅读全文
摘要:作者|Mahbubul Alam 编译|VK 来源|Towards Data Science 单类支持向量机简介 作为机器学习方面的专家或新手,你可能听说过支持向量机(SVM)——一种经常被引用和用于分类问题的有监督的机器学习算法。 支持向量机使用多维空间中的超平面来分离一类观测值和另一类观测值。当
阅读全文
摘要:作者|PHANI8 编译|VK 来源|Analytics Vidhya 介绍 在这篇文章中,我们将了解什么是真正的梯度下降,为什么它变得流行,为什么AI和ML中的大多数算法都遵循这种技术。 在开始之前,梯度下降实际上意味着什么?听起来很奇怪对吧! 柯西是1847年第一个提出梯度下降的人 嗯,梯度这个
阅读全文
摘要:作者|Khuyen Tran 编译|VK 来源|Towards Data Science 动机 将代码投入生产时,你很可能需要处理代码文件的组织。读取、创建和运行许多数据文件非常耗时。本文将向你展示如何自动 循环访问目录中的文件 如果不存在嵌套文件,创建它们 使用bash for loop运行一个具
阅读全文
摘要:作者|Shraddha Anala 编译|VK 来源|Towards Data Science 无论我们是谁,阅读、理解、交流并最终产生新的内容是我们在职业生活中都要做的事情。 当涉及到从给定的文本体中提取有用的特征时,所涉及的过程与连续整数向量(词袋)相比是根本不同的。这是因为句子或文本中的信息是
阅读全文
摘要:作者|Nikhil Adithyan 编译|VK 来源|Towards Data Science 决策树 决策树是当今最强大的监督学习方法的组成部分。决策树基本上是一个二叉树的流程图,其中每个节点根据某个特征变量将一组观测值拆分。 决策树的目标是将数据分成多个组,这样一个组中的每个元素都属于同一个类
阅读全文
摘要:作者|James Loy 编译|VK 来源|Towards Data Science 传统的推荐系统基于聚类、最近邻和矩阵分解等方法。然而,近年来,深度学习在从图像识别到自然语言处理等多个领域取得了巨大的成功。推荐系统也得益于深度学习的成功。事实上,如今最先进的推荐系统,比如Youtube和Amaz
阅读全文