标签归档:python 中文乱码

Python对中文字符的处理

    只要代码中指定的默认编码格式和操作文件的编码格式一致,操作中文文件还是很方便的。 当你操作中文文件出现乱码时,可以检查一下代码和文件的编码格式

    需要注意的是中文Windows XP中一般默认的是GB18030编码,用utf-8保存文件时,一些软件可能在文件头插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM),python中用codecs.BOM_UTF8来定义了这三个不可见字符。