解决php使用ZipArchive解压时中文乱码问题
使用php自带的ZipArchive来解压带中文文件名压缩包时会造成乱码,现象如下:
原结构:
解压代码:
$zip = new \ZipArchive(); $res = $zip->open('./钱学森班.zip'); if ($res !== true){ throw new \Exception('打开压缩包失败'); } $zip->extractTo('./cache'); $zip->close();
解压后:
原因
默认windows,mac打压缩包时编码为简体中文,解压时未作文件转化导致解压结果与预期不符
解决方法
打开压缩包后先将内部文件名及目录进行转码,转码后需关闭压缩包并重新打开解压
实现如下:
$zipName = './钱学森班.zip'; $zip = new \ZipArchive(); $res = $zip->open($zipName); if ($res !== true){ throw new \Exception('打开压缩包失败'); } // 加入此段↓ $fileNum = $zip->numFiles; for ($i = 0; $i < $fileNum; $i++) { $statInfo = $zip->statIndex($i, ZipArchive::FL_ENC_RAW); $zip->renameIndex($i, iconv('GBK', 'utf-8//IGNORE', $statInfo['name'])); } $zip->close(); $zip->open($zipName); // 截至↑ $zip->extractTo($extractTo); $zip->close();
注意事项
- 转码后因为修改了原压缩包文件,所以不可重复转码,若不想对原文件产生影响需先复制(php-zip扩展是自己读文件流,不需要复制)
- 转换前使用mb_detect_encoding进行编码判断依然是返回UTF-8