将数据导入 Power BI — Airbnb#007
将数据导入 Power BI — Airbnb#007
欢迎阅读关于我的 Airbnb 项目的另一本日记!阅读更多关于它的信息 这里 .这是以下步骤 在 PostgreSQL 上创建数据库 — Airbnb#006 .
所以,如果你读过我以前的日记,你就会知道我已经放弃了尝试将 csv 文件导入 PostgreSQL,至少目前是这样。知道我有一个超过 900 万行的文件,我认为 SQL 是唯一可能的答案。但后来,在做我目前就读的 Power BI 课程时,老师说了一句真的引起了我的注意。我不知道他是怎么说的,但它是这样的:
“当 Excel 无法存储数据时,你将需要 Power BI。”
不知何故,这正是我的问题。问题是我不知道 Power BI 可以存储比 Excel 更多的数据(实际上我认为它的容量更小)。但是,听到这个消息,将我的数据集导入 PowerBI 的想法出现了。而且,实验从来都不是一个坏主意。我尝试导入 日历.csv 文件,最大的一个超过 400Mb 和可怕的 900 万行。完成导入过程肯定需要一段时间,但令人惊讶的是(或者不是,如果您比我更习惯 Power BI)它起作用了!所有 900 万行都适合 Power BI。当然,一些转换是应有的,但至少对我而言,在 Power BI 中执行它们比在 PostgreSQL 中执行它们要容易得多。我们也将在这里介绍它们。
当我第一次导入它时,它看起来像这样:
我们可以看到日期是正确的(由于我的操作系统中的语言设置,它们是葡萄牙语,所以这不是问题)。虽然,id 显示为整数,但我们不希望这样。此外,在 价格 和 调整价格 显示为文本,这不是我们想要的。所以,要 转换数据 我们去。
只需单击几下,我们就可以解决我们的第一个问题,并将 id 列设置为应有的文本:
解决另一个可能有点困难。如果我们尝试像在此处所做的那样更改数据类型,它将在每个单元格中标记一个错误,因为美元符号。因此,首先我们需要删除美元符号,或者更确切地说,我们将用任何内容替换它。右键单击列名会弹出一个菜单,其中有很多选项,其中包括 替换值 选项。
单击它会弹出此窗口,我们可以在其中键入要替换的内容以及要替换的内容。在这种情况下,我想用任何内容替换美元符号。点击确定,我有这个:
所有的值都已经是“数字形状”了,我们现在可以像以前一样更改数据类型。重复这个过程 调整价格 我已经准备好我的数据集了。 ……还是我?
由于一些尴尬的原因,日期列丢失了它的数据类型并变成了文本:
将其转换为最新版本的难度取决于您的操作系统和 Power BI 环境是如何按区域设置的。我的已正确设置为美国的日期格式,因此只需单击几下,我之前的操作方式,它们现在是日期:
现在我真的有了一个工作数据集!我在 PostgreSQL 中遇到的问题是通过使用 Power BI 来解决的。当然,我打算稍后再试一次,将所有这些数据作为 PostgreSQL 上的单个数据库,我可以使用 SQL 进行分析,但现在这应该足够了。
还有其他文件和表要导入 Power BI,以便我可以整体分析数据。但现在也许我会自己分析这组数据,看看它告诉我什么。下期杂志见!
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明