摘要: 作者|PURVA HUILGOL 编译|VK 来源|Analytics Vidhya 机器理解文本的挑战 “语言是一种极好的交流媒介” 你和我很快就会明白那句话。但机器根本无法处理原始形式的文本数据。他们需要我们将文本分解成一种易于机器阅读的数字格式(自然语言处理背后的理念!)。 这就引入“词袋”( 阅读全文
posted @ 2020-09-17 23:42 人工智能遇见磐创 阅读(960) 评论(0) 推荐(0) 编辑
摘要: 作者|LAKSHAY ARORA 编译|VK 来源|Analytics Vidhya 概述 流数据是机器学习领域的一个新兴概念 学习如何使用机器学习模型(如logistic回归)使用PySpark对流数据进行预测 我们将介绍流数据和Spark流的基础知识,然后深入到实现部分 介绍 想象一下,每秒有超 阅读全文
posted @ 2020-09-17 23:35 人工智能遇见磐创 阅读(1199) 评论(0) 推荐(0) 编辑
摘要: 作者|Conor O'Sullivan 编译|VK 来源|Towards Data Science 主成分分析(PCA)是一个很好的工具,可以用来降低特征空间的维数。PCA的显著优点是它能产生不相关的特征,并能提高模型的性能。 它可以帮助你深入了解数据的分类能力。在本文中,我将带你了解如何使用PCA 阅读全文
posted @ 2020-09-17 23:34 人工智能遇见磐创 阅读(1514) 评论(0) 推荐(0) 编辑
摘要: 作者|Félix Revert 编译|VK 来源|Towards Data Science 介绍 我翻阅了CatBoost的文档之后,我被这个强大的框架震惊了。CatBoost不仅在你提供给它的任何数据集上构建了一个最精确的模型,其中只需要最少的数据准备。它还提供了迄今为止最好的开源解释工具,以及快 阅读全文
posted @ 2020-09-17 23:23 人工智能遇见磐创 阅读(1774) 评论(0) 推荐(0) 编辑