2890. 重塑数据:融合

DataFrame report
+-------------+--------+
| Column Name | Type |
+-------------+--------+
| product | object |
| quarter_1 | int |
| quarter_2 | int |
| quarter_3 | int |
| quarter_4 | int |
+-------------+--------+
编写一个解决方案,将数据 重塑 成每一行表示特定季度产品销售数据的形式。

结果格式如下例所示:

示例 1:

输入:
+-------------+-----------+-----------+-----------+-----------+
| product | quarter_1 | quarter_2 | quarter_3 | quarter_4 |
+-------------+-----------+-----------+-----------+-----------+
| Umbrella | 417 | 224 | 379 | 611 |
| SleepingBag | 800 | 936 | 93 | 875 |
+-------------+-----------+-----------+-----------+-----------+
输出:
+-------------+-----------+-------+
| product | quarter | sales |
+-------------+-----------+-------+
| Umbrella | quarter_1 | 417 |
| SleepingBag | quarter_1 | 800 |
| Umbrella | quarter_2 | 224 |
| SleepingBag | quarter_2 | 936 |
| Umbrella | quarter_3 | 379 |
| SleepingBag | quarter_3 | 93 |
| Umbrella | quarter_4 | 611 |
| SleepingBag | quarter_4 | 875 |
+-------------+-----------+-------+
解释:
DataFrame 已从宽格式重塑为长格式。每一行表示一个季度内产品的销售情况。
import pandas as pd

def meltTable(report: pd.DataFrame) -> pd.DataFrame:
    return report.melt(
        id_vars=["product"],
        value_vars=["quarter_1", "quarter_2", "quarter_3", "quarter_4"],
        var_name="quarter",
        value_name="sales",
    )
# melt 是 Pandas 中用于数据重塑的方法之一,它允许您将宽格式(wide format)的 DataFrame 转换为长格式(long format)。
# 在数据分析和可视化中,经常需要将数据从宽格式转换为长格式,以便更好地进行分析和展示。下面是对 melt 方法的详细解释:
# DataFrame.melt(id_vars=None, value_vars=None, var_name='variable', value_name='value', col_level=None)
#   id_vars: 需要保留不被转换的列名,也就是标识符变量。
#   value_vars: 需要被转换为值的列名,如果未指定,则会使用除 id_vars 之外的所有列。
#   var_name: 用于存储 value_vars 列名的新列名,默认为 'variable'。
#   value_name: 用于存储 value_vars 对应值的新列名,默认为 'value'。
#   col_level: 如果 DataFrame 的列是 MultiIndex(多级索引),则可以指定需要堆叠的级别。

 

posted on 2024-05-31 19:18  XiSoil  阅读(4)  评论(0编辑  收藏  举报