直接在python中输入中文的字符串会报编译错误SyntaxError: Non-ASCII character,因为python文件默认编码方式是ASCII.如果想要打印中文字符,有两种方式: 1.在文件第一行加入# -*- coding: UTF-8 –*-,修改文件的默认编码方式.然后直接在python 文件编辑中文字符串即可,例如:string = “中文” 2. 将需要打印的中文字符转化成unicode编码并且加上u,例如要打印“我们”,则写成u“\u6211\u4eec” print…
本节学习Python的格式化输出,文件操作以及json的简单用法 1.格式化输出 将非字符串类型转换成字符串,可以使用函数:str() 或者repr() ,(这两个函数的区别目前我还没搞懂,求解答) >>> str([1,2,3,4]) '[1, 2, 3, 4]' >>> repr([1,2,3,4]) '[1, 2, 3, 4]' >>> str(10) ' >>> repr(10) ' 可以使用str.ljust() .str.…
python将命令输出写入文件 将文件写入到对应文件,方便后期处理或保存 def write_file(file_path): with open(file=file_path, mode="w", encoding="utf-8") as out_file: command = "ifconfig" p = subprocess.Popen(command, shell=True, stdout=out_file, \ stdin=subpro…
前面学习了解析PDF文档,并写入文档的知识,那篇文章的名字为深入学习Python解析并读取PDF文件内容的方法. 链接如下:https://www.cnblogs.com/wj-1314/p/9429816.html 但是最近出现了一个新问题,就是上面使用pdfminer这个库只能解析正常的PDF内容,然而在实际情况中,公司的一些文档可能是加密的,那么如何处理加密的PDF文件,就是本文学习的重点. 在网上查找资料,发现pypdf2可以实现对pdf文件进行加密,解密,所以就学习了一下这个库,并留下…
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应用.主要参考了一些已有的博客内容,代码. 主要思路是首先利用一个做项目的形式,描述所做的问题,运行环境,和需要安装的库,然后写代码,此代码是在python2.7中运行,小编也写出在python3.6中运行的代码,并详细解释python2.7和python3.6中python库的一些不同之处,最后详细…
最近使用python操作文件,经常遇到编码错误的问题,例如: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 350: in 我看百度的解决方法就是手动指定编码方式,类似于以下这种方式: encoding="UTF-8" 虽然这种类似的方法也能解决.但是这种方法只能靠运气去碰,如果刚好碰到文件编码和你指定的编码一致,那么就不会报错了.这种方式在尝试的过程就会很麻烦. 这里就有一个解决的小技巧,我们…
特别的注意:一般的CSV文件并不是UTF-8编码,而是10008(MAC-Simplified Chinese GB 2312),所以再通过Navicat导入数据的时候需要指定的编码格式是10008(MAC-Simplified Chinese GB 2312),而不能是UTF-8,这样会出现乱码 前两天做项目中用到含有中文字段的数据CSV文件,使用workbench导入文件报错: 从网上找了很长时间都说是CSV文件编码与client编码不匹配的问题,尝试将CSV转化为utf8编码,导入还是不行…
<?php /** * 检测文件编码 * @param string $file 文件路径 * @return string|null 返回 编码名 或 null */ function detect_encoding($file) { $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1'); $str = file_get_contents($file); foreach ($list as $item) { $t…
情况:文件乱码,在cmd上输出print也乱码.解决方案:统一为gbk的简体中文编码方式.步骤如下: 1.每个py文件使用[简体中文(GB2312)- 代码页 936]格式保存,行尾为[Windows(CR LF)]: 或者是[ANSI]: 或者是[ANSI/ASCII]: 这三种都一样.注意,VS里只有gb2312的选项,但实际上windows已经把代码页936统一为gbk,而且gbk兼容gb2312,因此VS里保存为gb2312是没有问题的. 2.每一个文件的开头,添加一行: # -*- c…
一. 格式化输出现在有以下需求,让用户输入name, age, job,hobby 然后输出如下所示: -----------info of Alex Li----------- Name : Alex Li Age : 22 job : Teacher Hobbie : gril ----------------end----------------- 你怎么实现呢?你会发现,用字符拼接的方式还难实现这种格式的输出,所以一起来学一下新姿势只需要把要打印的格式先准备好, 由于里面的 一些信息是需…