Python 文件编码问题解决

最近使用python操作文件,经常遇到编码错误的问题,例如: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 350: in 我看百度的解决方法就是手动指定编码方式,类似于以下这种方式: encoding="UTF-8" 虽然这种类似的方法也能解决.但是这种方法只能靠运气去碰,如果刚好碰到文件编码和你指定的编码一致,那么就不会报错了.这种方式在尝试的过程就会很麻烦. 这里就有一个解决的小技巧,我们…

【python】中文的输出，打印，文件编码问题解决方法

直接在python中输入中文的字符串会报编译错误SyntaxError: Non-ASCII character,因为python文件默认编码方式是ASCII.如果想要打印中文字符,有两种方式: 1.在文件第一行加入# -*- coding: UTF-8 –*-,修改文件的默认编码方式.然后直接在python 文件编辑中文字符串即可,例如:string = “中文” 2. 将需要打印的中文字符转化成unicode编码并且加上u,例如要打印“我们”,则写成u“\u6211\u4eec” print…

python文件编码说明 coding=utf-8

python 支持3种编码声明,一般常用能见到下面两种 1.# -*- coding: utf-8 -*- 这种写法是为了兼容Emacs的编码声明 2.短一点,但Emacs不能用# coding=utf-8 短一点,但Emacs不能用之所以要声明未编码类型 ,主要是中文出错的问题. 在python 文件开头(一般是第一行或第二行),用来说明你的Python源程序文件用使用的编码.缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的…

Python文件编码不可以使用UTF16

1. The complete Python source file should use a single encoding. Embedding of differently encoded data is not allowed and will result in a decoding error during compilation of the Python source code. Python源文件应该使用单一编码,嵌入不同编码的数据是不允许的(个人猜测:比如单一文件里一部分使用…

Python 文件编码（文件乱码）

IndentationError: unindent does not match any outer indentation level 文件未对齐,在记事本打开. 乱码原因:源码文件的编码格式为utf-8,但是window的本地默认编码是gbk,所以在控制台直接打印utf-8的字符串当然是乱码了! 解决方法:1.print mystr.decode('utf-8').encode('gbk')2.比较通用的方法: 复制代码代码如下: import systype = sys.getfiles…

python文件编码及执行

兼容中文编码由于Python源代码也是一个文本文件,所以,当你的源代码中包含中文的时候,在保存源代码时,就需要务必指定保存为UTF-8编码. 当Python解释器读取源代码时,为了让它按UTF-8编码读取,我们通常在文件开头写上这两行: #!/usr/bin/env python3 # -*- coding: utf-8 -*- 第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释: 第二行注释是为了告诉Python解释器,按照UTF-…

python 文件编码

错误:UnicodeDecodeError: 'gbk' codec can't decode byte 原因:文件为utf-8编码,系统却用gbk去解码,必然出现错误. 解决方法: with open(outpath+ '\\lable0','r',encoding = 'utf-8') as f…

【转】关于Python脚本开头两行的：#!/usr/bin/python和# -- coding: utf-8 --的作用 – 指定文件编码类型

原文网址:http://www.crifan.com/python_head_meaning_for_usr_bin_python_coding_utf-8/ #!/usr/bin/python 是用来说明脚本语言是python的是要用/usr/bin下面的程序(工具)python,这个解释器,来解释python脚本,来运行python脚本的. # -*- coding: utf-8 -*- 是用来指定文件编码为utf-8的详情可以参考: PEP 0263 — Defining Python…

【转载】关于Python脚本开头两行的：#!/usr/bin/python和# -- coding: utf-8 --的作用 – 指定文件编码类型

1.#!/usr/bin/python 是用来说明脚本语言是 python 的是要用 /usr/bin下面的程序(工具)python,这个解释器,来解释 python 脚本,来运行 python 脚本的. 2.# -*- coding: utf-8 -*- 是用来指定文件编码为 utf-8 的详情可以参考:PEP 0263 — Defining Python Source Code Encodings 在此,详细的(主要是翻译)解释一下,为何要加这个编码声明,以及如何添加编码声明: 2.1…

运行python文件时出错SyntaxError: Non-UTF-8 code starting with '\xb5' in file, but no encoding declared;

今天ytkah在运行python文件时出现错误,提示如下,很明显这是没有定义python文件编码引起的问题,那么要怎么解决呢?很简单,在文件头部定义一下就可以了. File "hello.py", line 6 SyntaxError: Non-UTF-8 code starting with '\xb5' in file hello.py on line 6, but no encoding declared; see http://python.org/dev/peps/pep-0…

Python文件读写机制

Python提供了必要的函数和方法进行默认情况下的文件基本操作文件打开方式: open(name[,mode[buf]]) name:文件路径 mode:打开方式 buf:缓冲buffering大小文件读取方式: read([size]):读取文件(读取size字节,默认读取全部) readline([size]):读取一行 readline([size]) :读取缓冲buf(io.DEFAULT_SET_BUFFER),返回每一行所组成的列表 iter:使用迭代器遍历读取文件 f.open…

Python | 多种编码文件（中文）乱码问题解决

问题线索 1 可以知道的是,文本文件的默认编码并不是utf8. 我们打开一个文本文件,并点击另存为 2 我们在新窗口的编码一栏看到默认编码是ANSI.先不管这个编码是什么编码,但是通过下拉列表我们知道,这种编码不是utf8. END 编码测试 1 对于Python里面的中文显示,我们常常使用utf8和gbk的编码.对于这两种编码笔者就不介绍了,总之都是专门可以处理中文的编码方式啦. 2 我们首先对文本文件测试了gbk解码.我们发现,此编码下文本文件内容可以正常显示,但是使用utf8解码,…

关于Python脚本开头两行的：#!/usr/bin/python和# -- coding: utf-8 --的作用 – 指定文件编码类型

#!/usr/bin/python指定用什么解释器运行脚本以及解释器所在的位置 # -*- coding: utf-8 -*-用来指定文件编码为utf-8的PEP 0263 -- Defining Python Source Code Encodingshttp://www.python.org/dev/peps/pep-0263/ 估计有不少人注意过一些python脚本开头有这么行东东:#!/usr/bin/python它是用来干嘛的?貌似没有它对脚本功能也没啥影响.它是用来指定用什么解释器运…

python声明文件编码，必须在文件的第一行或第二行

#coding=utf-8和# -*- coding: utf-8 -*-的作用 – 指定文件编码类型注意的两点: 1.声明必须在文件的第一行或第二行: 2.coding后面必须紧跟冒号或等号,#coding : utf-8是错的. 例: 声明编码前有字符串 '''testing user longin''' #coding:utf-8 print u'''登录相关的测试''' 或声明编码位于第三行 #'test' #coding:utf-8 print u'''登录相关的测试''' 或 c…

［译］如何定义python源文件的文件编码

简介这篇文章是为了介绍定义python源文件文件编码的方法.python解释器可以根据所指定的编码信息对当前文件进行解析.通常来说,这种方法可以提高解析器对Unicode编码的源文件的识别,并且支持书写Unicode编码,例如在一个支持unicode编码的编辑器中使用UTF-8. 问题在python2.1中,unicode编码只能通过Latin-1中的“unicode-escape”的方式来实现.这让很多平时不使用Latin-1编码的用户感到非常的不友好,尤其是大多数的亚洲国家更是这样.程序…

Python 字符编码及其文件操作

本章节内容导航: 1.字符编码:人识别的语言与机器机器识别的语言转化的媒介. 2.字符与字节:字符占多少个字节,字符串转化 3.文件操作:操作硬盘中的一块区域:读写操作注:浅拷贝与深拷贝用法: dic={'name':'zhaokang','age':18,'aa':[12,13,14]} l.copy() 浅拷贝:会重新开辟内存地址去存储值的内存地址,但值得内存地址指向的还是需要拷贝的值的内存地址. 深拷贝:会重新开辟内存地址去存储值得内存地址,但是值的内存地址指向的是新的一个内存地址,如…

python文件（概念、基本操作、常用操作、文本文件的编码方式）

文件目标文件的概念文件的基本操作文件/文件夹的常用操作文本文件的编码方式 01. 文件的概念 1.1 文件的概念和作用计算机的文件,就是存储在某种长期储存设备上的一段数据长期存储设备包括:硬盘.U 盘.移动硬盘.光盘... 文件的作用将数据长期保存下来,在需要的时候使用 CPU 内存硬盘 1.2 文件的存储方式在计算机中,文件是以二进制的方式保存在磁盘上的文本文件和二进制文件文本文件可以使用文本编辑软件查看本质上还是二进制文件例如:pyt…

python字符编码与文件打开

一字符编码储备知识点: 1.计算机系统分为三层: 应用程序操作系统计算机硬件 2.运行Python程序的三个步骤 1.先启动python解释器 2.再将python文件当做普通的文本文件读入内存 3.解释执行读入内存的代码,开始识别语法字符编码 1.什么是字符编码字符编码表:人类的字符<------------>数字 1Bytes=8bit 1B=8bit 1字节等于8个二进制 ASCII码:只能识别英文字符,1英文字符=8bit 用8个二进制bit(比特位)表示一个英文字符 G…

系统编码，文件编码，python编码

系统编码,可以通过locale命令查看(LINUX)https://wiki.archlinux.org/index.php/Locale_(简体中文), centos7 配置文件在/etc/profile.d/lang.sh 文件编码,它代表源码文件内的所有内容都是根据词方式编码成二进制码流,存入到磁盘中的. python编码,是指python内设置的解码方式.如果不设定的话,python2默认是ascii解码.在源码文件开头(一定是第一行):#-*-coding:UTF-8-*-,源码文件的…

系统编码、文件编码与python系统编码

在linux中获取系统编码结果: Windows系统的编码,代码页936表示GBK编码可以看到linux系统默认使用UTF-8编码,windows默认使用GBK编码.Linux环境下,文件默认使用UTF-8编码.当然你也可以指定文件编码方式. 这个时候需要告诉python解释器用utf-8去解读python源文件 Python解释器内部默认使用的ASCII编码方式去解读python源文件 Python字符编码 Python2中有两类字符串,分别是str与unicode.这两类字符串都派生自抽象…

Python编程笔记（第三篇）【补充】三元运算、文件处理、检测文件编码、递归、斐波那契数列、名称空间、作用域、生成器

一.三元运算三元运算又称三目运算,是对简单的条件语句的简写,如: 简单条件处理: if 条件成立: val = 1 else: val = 2 改成三元运算 val = 1 if 条件成立 else 2 二.智能检测文件编码用第三方模块chardet 首先要安装chardet模块 ,用pip命令进行安装 chardet的用法 import chardet f = open("staff_table.txt","rb") data =f.read() f.clos…

python文件操作与字符编码

知识内容: 1.文件对象与文件处理流程 2.基本操作 3.上下文管理 4.文件的修改与文件内光标的移动 5.字符编码一.文件对象与文件处理流程 1.文件对象 (1)文件分类按文件中数据的组织形式可以把文件分为文本文件和二进制文件文本文件中存储的是常规字符串,由若干文本行组成,通常每行以换行符('\n')结尾二进制文件把对象内容以字节串(bytes)进行存储,无法用记事本及其他普通文本处理软件打开,也无法直接被人阅读理解,需要使用专门的软件进行解码才能读取其中的内容 (2)文件对象: py…

Python中文件编码的检测

前言: 文件打开的原则是“ 以什么编码格式保存的,就以什么编码格式打开 ”,我们常见的文件一般是以“ utf-8 ”或“ GBK ”编码进行保存的,由于编辑器一般设置了默认的保存和打开方式,所以我们在记事本或常见文档编辑器如Word中不容易看到乱码的情况发生,但是,当我们要在内存里读取打开一个文件时,如果文档编码方式和计算机内存默认读取文件的编码不同,或者我们打开文件时未设置正确的编码打开规则,则很有可能出现一堆乱码,无法正常读取文件内容,影响接下来的工作. 其实,这些情况早就有大佬想到了,所以…

python 修改文件编码方式

import chardet import os def strJudgeCode(str): return chardet.detect(str) def readFile(path): try: f = open(path, 'r') filecontent = f.read() finally: if f: f.close() return filecontent def WriteFile(str, path): try: f = open(path, 'w') f.write(str)…

Python文件中执行脚本注释和编码声明

在 Python 脚本的第一行经常见到这样的注释: #!/usr/bin/env python3 或者 #!/usr/bin/python3 含义在脚本中, 第一行以 #! 开头的代码, 在计算机行业中叫做 "shebang", 也叫做 sha-bang / hashbang / pound-bang / hash-pling, 其作用是"指定由哪个解释器来执行脚本". 注意 #!之后的空格是可选的, #!/usr/bin/env python3 和 #! /us…

Python读取文件编码及内容

Python读取文件编码及内容最近做一个项目,需要读取文件内容,但是文件的编码方式有可能都不一样.有的使用GBK,有的使用UTF8.所以在不正确读取的时候会出现如下错误: UnicodeDecodeError: 'gbk' codec can't decode byte 而且当你使用rb模式读取文件时候,返回的结果通过django返回的json会出现下面错误: TypeError: b'\xbc\x8c\xe6\x9c\xaa\xe6\x9d\xa5' is not JSON serializ…

Python学习笔记八：文件操作（续），文件编码与解码，函数，递归，函数式编程介绍，高阶函数

文件操作(续) 获得文件句柄位置,f.tell(),从0开始,按字符数计数 f.read(5),读取5个字符返回文件句柄到某位置,f.seek(0) 文件在编辑过程中改变编码,f.detech() 获取文件编码,f.encoding() 获取文件在内存中的编号,f.fileno() 获取文件终端类型(tty.打印机等),f.isatty() 获取文件名,f.name() 判断文件句柄是否可移动(tty等不可移动),f.seekable() 判断文件是否可读,f.readable() 判断文件是…

python 转化文件编码 utf8

使用visual studio最大的一个问题就是文件编码问题,当文件中有中文时,visual studio 会默认为区域编码,也就是gb2312,如果想跨平台或者不用vs编译的话,就会因为编码问题导致各种错误. 所以写了个python脚本来检测原文件编码并转换为目标编码,以下代码以目标编码为utf-8为例: 需要安装chardet,详情:https://pypi.python.org/pypi/chardet 使用方法:python to_utf8.py /my_project/src impo…

python文件操作：字符编码与文件处理

一.字符编码二.文件处理一.字符编码储备知识点: 1. 计算机系统分为三层: 应用程序操作系统计算机硬件 2. 运行python程序的三个步骤 1. 先启动python解释器 2. 再将python文件当作普通的文本文件读入内存 3. 解释执行读入内存的代码,开始识别语法字符编码 1. 什么是字符编码字符编码表: 人类的字符<------------>数字 1Bytes=8bit 1B=8b 1字节等于8个二进制位 ASCII码:只能识别英文字符,1英文字符=8bit 用8个二进…

python 的文件编码处理

python的文件编码处理有点粗鲁 1.不管文件原来是编码类型,读入后都转换成Unicode的编码 2.写入文件时,write函数把变量以读入文件的编码方式写入(根据open(path,mode,encoding='utf-8')里的encoding,这个的utf-8只是举个例子,如果encoding未赋值,责根据解释器默认的文件读入编码模式来编码),(举个例子:读入文件是gbk编码,处理过程是用Unicode处理,处理完了会转成gbk保存.这些事儿都是python默默的做的) 3.如果想中途…

【Python 文件编码问题解决】的更多相关文章