摘要: How-models-work 我们将从机器学习模型如何工作以及如何使用的概述开始。如果您之前已经进行过统计建模或机器学习,则这可能很基础。不用担心,我们将尽快建立强大的模型。通过此微课程,可以在经历以下场景时构建模型:你的堂兄已经赚了数百万美元,投机房地产。由于您对数据科学的兴趣,他愿意与您成为业 阅读全文
posted @ 2020-08-05 23:26 caishunzhe 阅读(186) 评论(0) 推荐(0) 编辑
摘要: Inconsistent-data-entry 教程 本讲中我们将学习如何清理不一致的文本条目 Do some preliminary text pre-processing 首先使用head查看文件前几行 假设我们有兴趣清理“城市”列,以确保其中没有数据输入不一致。 当然,我们可以手动检查每一行, 阅读全文
posted @ 2020-08-05 23:09 caishunzhe 阅读(303) 评论(0) 推荐(0) 编辑
摘要: Character-encodings 教程 What are encodings? 什么是编码,字符编码是从原始二进制字节字符串(看起来像:01101000010100100)到构成人类可读文本(例如“ hi”)的字符的映射的特定规则集。 有许多不同的编码,如果您尝试使用与最初编写的编码不同的编码 阅读全文
posted @ 2020-08-05 10:05 caishunzhe 阅读(303) 评论(0) 推荐(0) 编辑
摘要: Parsing-dates 教程 实际情况下我们的保存文件之中日期往往为字符串。 Pandas使用“ object” dtype来存储各种类型的数据类型,但是大多数情况下,当您看到带有dtype“ object”的列时,它就会包含字符串。如果在此处查看pandas dtype文档,您会发现还有一个特 阅读全文
posted @ 2020-08-05 08:57 caishunzhe 阅读(417) 评论(0) 推荐(0) 编辑