博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python解决处理中文的问题
阅读量:6705 次
发布时间:2019-06-25

本文共 695 字,大约阅读时间需要 2 分钟。

阅读目录

脚本开头添加默认编码

python源码中出现了中文字符或要处理中文字符,运行时会出现错误,解决方法是,开头加入字符编码声明:

1
2
#! /usr/bin/env python
# -*- coding:utf-8 -*-

 处理时可能会出现问题:

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-15: ordinal not in range(128)

这需要在开始位置加入代码

1
2
3
import 
sys
reload
(sys)
sys.setdefaultencoding(
'utf8'
)

 比如读入一行中文代码,要写入另一个文件时,需要解码与编码的变换:

1
2
= 
"我在博客园“
w.write(p.decode(
'utf-8'
).encode(
'utf-8'
+ 
'\n'
)

csv中文编码乱码

往文件中如果存储方式是utf-8,打开csv文件时就是乱码,如果考出来重新存储为gbk格式就可以正常显示了。但是可以存储的时候就直接存储为gb2312

#! coding:utf-8f = file('ss.csv', 'w')f.write('你好'.decode('utf-8').encode('gb2312'))f.close()

这样用excel打开就不是乱码。

本文转自jihite博客园博客,原文链接:http://www.cnblogs.com/kaituorensheng/p/3375075.html,如需转载请自行联系原作者

你可能感兴趣的文章
vlc sdl 播放视频可随窗口改变大小
查看>>
ibm rational software architect download
查看>>
Web前端资源汇总
查看>>
python 相关安装和配置
查看>>
jquery的closest方法和parents方法的区别
查看>>
RHEL每天定时备份Oracle
查看>>
SQLPROMPT5.3对各种加密对象的解密测试
查看>>
QR二维码生成器源码(中间可插入小图片)
查看>>
jQuery回溯
查看>>
jquery easy ui 1.3.4 表单(7)
查看>>
Git 提交大文件提示 fatal: The remote end hung up unexpectedly
查看>>
排列组合
查看>>
2013-2014
查看>>
tftp + bras
查看>>
页面正在载入中
查看>>
二十进制数的加法
查看>>
测试使用Word发布博客
查看>>
国产系统
查看>>
EF Code First 初体验
查看>>
鼠标移至div内部其他层时,触发mouseout
查看>>