python使用openpyxl读取合并单元格的值(转)

目录问题:解决思路:问题:假设在test.xlsx的“Sheet1”工作表中,A1:D3区域的值如下:要求给定指定的行、列以及对应的工作表作为参数,能够正确解析合并单元格,获取指定单元格的值。如果直接...

 

问题:

假设在test.xlsx的“Sheet1”工作表中,A1:D3区域的值如下:

python使用openpyxl读取合并单元格的值

要求给定指定的行、列以及对应的工作表作为参数,能够正确解析合并单元格,获取指定单元格的值。

如果直接根据行列获取对应单元格的值,则合并单元格非左上角的其他单元格都会获取到None值,如下:

1 if __name__ == "__main__":
2      wb = xl.load_workbook("test.xlsx")
3      sheet_ = wb["Sheet1"]
4      print(sheet_["A1"].value) # 1
5      print(sheet_["A2"].value) # None
6      print(sheet_["D1"].value) # 8
7      print(sheet_["D2"].value) # None
8      print(sheet_["D3"].value) # None

 

 

解决思路:

获取到对应单元格后,判断该单元格是否为合并单元格,如果是,则找到该合并区域并获取左上角的值返回。

通过 sheet.merged_cell_ranges属性,可以获取当前工作表所有的合并区域列表:

测试代码:

1 if __name__ == "__main__":
2      wb = xl.load_workbook("test.xlsx")
3      sheet_ = wb["Sheet1"]
4      merged_ranges = sheet_.merged_cell_ranges # 获取当前工作表的所有合并区域列表
5      for merged_range in merged_ranges:
6          print(type(merged_range)) # 打印区域对象类型
7          print(merged_range) # 打印区域

 

结果如下:

python使用openpyxl读取合并单元格的值

我们巡着openpyxl.worksheet.merge.MergedCellRange查找其源码,发现定义了in操作,可以直接通过in确认某个坐标是否位于区域内

python使用openpyxl读取合并单元格的值

这时候我们已经基本具备获取合并单元格的条件了。

完整代码如下:

 1 import openpyxl as xl
 2 from openpyxl.worksheet.worksheet import Worksheet
 3 from openpyxl.cell import MergedCell
 4  
 5  
 6 def parser_merged_cell(sheet: Worksheet, row, col):
 7      """
 8      检查是否为合并单元格并获取对应行列单元格的值。
 9      如果是合并单元格,则取合并区域左上角单元格的值作为当前单元格的值,否则直接返回该单元格的值
10      :param sheet: 当前工作表对象
11      :param row: 需要获取的单元格所在行
12      :param col: 需要获取的单元格所在列
13      :return:
14      """
15      cell = sheet.cell(row=row, column=col)
16      if isinstance(cell, MergedCell): # 判断该单元格是否为合并单元格
17          for merged_range in sheet.merged_cell_ranges: # 循环查找该单元格所属的合并区域
18              if cell.coordinate in merged_range:
19                  # 获取合并区域左上角的单元格作为该单元格的值返回
20                  cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col)
21                  break
22      return cell
23  
24  
25 if __name__ == "__main__":
26      wb = xl.load_workbook("test.xlsx")
27      sheet_ = wb["Sheet1"]
28  
29      for row_index in range(1, 4):
30          for col_index in range(1, 5):
31              cell_ = parser_merged_cell(sheet_, row_index, col_index)
32              print("第%s行第%s列:%s" % (row_index, col_index, cell_.value))

 

结果如下:

第1行第1列:1
第1行第2列:2
第1行第3列:3
第1行第4列:8
第2行第1列:1
第2行第2列:4
第2行第3列:5
第2行第4列:8
第3行第1列:6
第3行第2列:7
第3行第3列:7
第3行第4列:8

 

 
posted @ 2022-05-05 15:09  shengnet  阅读(826)  评论(0编辑  收藏  举报