spark 报错：UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 解决方法 - 疯狂的小萝卜头 - 博客园

spark 报错：UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 解决方法

pyspark 调用DataFrame.show()进行数据展示，展示的数据存在中文，会报UnicodeEncodeError: 'ascii' codec can't encode characters in position 284-285: ordinal not in range(128)异常。

在.py文件中已指定#coding:utf-8编码，需要更改系统默认编码格式：

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

异常原文如下：

Traceback (most recent call last):
  File "Demo5.py", line 33, in <module>
    read_df.show()
  File "/opt/cloudera/parcels/CDH-5.16.2-1.cdh5.16.2.p0.8/lib/spark/python/lib/pyspark.zip/pyspark/sql/dataframe.py", line 257, in show
UnicodeEncodeError: 'ascii' codec can't encode characters in position 284-285: ordinal not in range(128)

posted on 2020-07-31 14:35 疯狂的小萝卜头阅读(2029) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 10年+ .NET Coder 心语，封装的思维：从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热？
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

导航

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

公告

昵称：疯狂的小萝卜头
园龄： 11年8个月
粉丝： 30
关注： 1

统计

随笔 - 333
文章 - 0
评论 - 23
阅读 - 52万

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:Java JNA （三）—— 结构体使用及简单示例
结构体嵌套怎么模拟啊。。。。还有union最后那个field重写应该怎么写
--韩大狗
2. Re:java Missing artifact com.sun:tools:jar 1.8.0 终极解决方法
看了下shiro-redis包的依赖关系发现里面引用的tools系统路径写错了。写成${java.home}/../lib/tool.jar,实现上是没有/.. 这段的。太TM坑了
--夜之悲哀
3. Re:elasticsearch 英文数字组合字符串模糊检索
如果同时要模糊查询并且高亮也可以增加一个复制字段，高亮原字段但wildCard查询复制字段。
--PsychoChen
4. Re:java 通过图片的Base64字符串判断文件格式
原理是什么呢
--loveCrane
5. Re:NLP 基于kashgari和BERT实现中文命名实体识别（NER）
您好~想请教一下这个模型evaluate后，为什么我没有出来avg / total（p、r、f1）值，即有个总值，而是p、r、f1的micro avg和macro avg这两个值，怎样才能有个总值呢，...
--扣扣扣