2890. 重塑数据:融合
DataFrame report
+-------------+--------+
| Column Name | Type |
+-------------+--------+
| product | object |
| quarter_1 | int |
| quarter_2 | int |
| quarter_3 | int |
| quarter_4 | int |
+-------------+--------+
编写一个解决方案,将数据 重塑 成每一行表示特定季度产品销售数据的形式。
结果格式如下例所示:
示例 1:
输入:
+-------------+-----------+-----------+-----------+-----------+
| product | quarter_1 | quarter_2 | quarter_3 | quarter_4 |
+-------------+-----------+-----------+-----------+-----------+
| Umbrella | 417 | 224 | 379 | 611 |
| SleepingBag | 800 | 936 | 93 | 875 |
+-------------+-----------+-----------+-----------+-----------+
输出:
+-------------+-----------+-------+
| product | quarter | sales |
+-------------+-----------+-------+
| Umbrella | quarter_1 | 417 |
| SleepingBag | quarter_1 | 800 |
| Umbrella | quarter_2 | 224 |
| SleepingBag | quarter_2 | 936 |
| Umbrella | quarter_3 | 379 |
| SleepingBag | quarter_3 | 93 |
| Umbrella | quarter_4 | 611 |
| SleepingBag | quarter_4 | 875 |
+-------------+-----------+-------+
解释:
DataFrame 已从宽格式重塑为长格式。每一行表示一个季度内产品的销售情况。
import pandas as pd def meltTable(report: pd.DataFrame) -> pd.DataFrame: return report.melt( id_vars=["product"], value_vars=["quarter_1", "quarter_2", "quarter_3", "quarter_4"], var_name="quarter", value_name="sales", ) # melt 是 Pandas 中用于数据重塑的方法之一,它允许您将宽格式(wide format)的 DataFrame 转换为长格式(long format)。 # 在数据分析和可视化中,经常需要将数据从宽格式转换为长格式,以便更好地进行分析和展示。下面是对 melt 方法的详细解释: # DataFrame.melt(id_vars=None, value_vars=None, var_name='variable', value_name='value', col_level=None) # id_vars: 需要保留不被转换的列名,也就是标识符变量。 # value_vars: 需要被转换为值的列名,如果未指定,则会使用除 id_vars 之外的所有列。 # var_name: 用于存储 value_vars 列名的新列名,默认为 'variable'。 # value_name: 用于存储 value_vars 对应值的新列名,默认为 'value'。 # col_level: 如果 DataFrame 的列是 MultiIndex(多级索引),则可以指定需要堆叠的级别。