博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python3中如何解决中文乱码与编码的问题
阅读量:5019 次
发布时间:2019-06-12

本文共 701 字,大约阅读时间需要 2 分钟。

1.解决乱码问题:   

    pyhton中内部所有编码是Unicode,中文是gbk;正常情况下,我们输出的是utf-8;  

    我们可以采用sys.getdefaultencoding()查看系统默认的编码; 解决方法有如下几种:

        1.在文件开头添加上:#coding:utf-8或者# -*- coding:utf-8 -*-

         2.转换路径:原文件编码 ->unicode中转码 ->我们需要的编码格式     (decode()可选) ->unicode ->encode(),如果内容已经unicode,则不需要decode(),直接使用encode()

         3.举例:  

                 a.如果网页是utf-8,我们可使用html.read().decode('utf-8')将网页在控制台打印;  

                 b.如果网页是gb2312,则使用html.read().decode('gbk').encode(''utf-8)正常打印;(注意:decode('gbk')不能使用gbk2312,需用统一使用gbk)  

         4.判断指定的内容是什么编码:(注意:使用unicode只针对python2,python3已经取消了unicode函数,python3默认是utf8编码,Python 3中基本的str就是unicode,所以可以直接判断str: >>> isinstance('s', str) True)      

               if isinstance(content,unicode):表示如果content编码为unicode则为True,否则False

转载于:https://www.cnblogs.com/ysq0908/p/9420436.html

你可能感兴趣的文章
asp.net 按钮单击事件问题(自动弹出新窗口)
查看>>
【FLASH BUILDER 4.6 快捷键】只记几个对自己有帮助的
查看>>
数据库查询出现???及乱码问题,修改数据库语言
查看>>
再寄小读者之数学篇
查看>>
2014 年第六届全国大学生数学竞赛江西赛区赣南师范学院获奖名单(数学专业)
查看>>
[唐诗]长安古意-卢照邻
查看>>
多读书多看报,少吃零食多睡觉—2014总结,2015规划
查看>>
Microsoft JET Database Engine (0x80004005)
查看>>
前端面试(!!!)
查看>>
深入理解JavaScript 事件
查看>>
顺序表
查看>>
私有构造函数(C# 编程指南)
查看>>
单步调试及回滚测试
查看>>
安卓 混淆与反编译
查看>>
APPIUM安装与搭建Q&A
查看>>
秋季期末学习总结
查看>>
关于mac 挂载ntfs问题
查看>>
把视图转换为字符串
查看>>
linux下调试core dump文件
查看>>
用MVC5+EF6+WebApi 做一个考试功能(五) 前端主题
查看>>