Python2和Python3的一些语法区别

python


1.print

在版本2的使用方法是:

print 'this is version 2

也可以是

print('this is version 2')

但到了3,就只能加上括号,像一个函数一样来使用 print:

print('this is version 3')

2.input

2里面有两个用来从命令行接受输入的函数:input raw_input

value = input()

input 接收的是一个值或变量,也就是说,你如果输 123,程序接收到的就是整数 123,你输 True,就是 boolTrue。如果你输了 abc,程序会认为这是一个叫做 abc 的变量,而假如你没有定义过这个变量,就会报错。

所以,当你想用 input 得到一段文字的话,必须把文字写在引号 "" 或 '' 中。

text = raw_input()

raw_input 接收的则是你输入的字符串,而不管你输的是什么内容。如果你直接拿 raw_input 得到的“数字”去比较大小,则会得到奇怪的结果。

在版本3里,为了减少混乱,这两种输入方式被合并了。只是合并的方式又坑了新手:它保留了 input 这个名字和 raw_input 的效果。3里只有input函数,它接收你输入的字符串,不管你输的是什么。

text = input()

那么在3里,如何像2一样得到用户输入的一个值呢?方法是 eval()

value = eval(input())

或者,如果你只是需要一个整数值,也可以:

value = int(input())

3. python3版本相对2版本的部分其他区别

除了一开始越到的这两个坑外,还有其他一些可能遇到的变动,这里以3与2相比的差异来说:

1.打开文件不再支持 file 方法,只能用 open

2.range不再返回列表,而是一个可迭代的range对象

3.除法 / 不再是整除,而是得到浮点数,整除需要用双斜杠 //

4.urlliburllib2合并成了urllib,常用的urllib2.urlopen()变成了urllib.request.urlopen()

5.字符串及编码相关有大变动,简单来说就是原来的str变成了新的bytes,原来的unicode变成了新的str

  • bytes

相当于python2中的str类型,从网页上抓取下来的数据流也是该类型的

在python3中,要得到一个bytes类型的变量,可以在字符串内容前面加入b得到,前提是该字符串的内容是可以完全由ASCII码表示的,否则会出现语法错误

相当于Python2中的str类型,从网页上抓取下来的数据流也是该类型的

在Python3中,要得到一个bytes类型的变量,可以在字符串内容前面加入b得到,但前提是该字符串的内容是可以完全由ascii码表示的,否则会出现语法错误。

Python 3.6.1

>>>s1 = "你好"
>>>s1
'你好'
>>>type(s1)
<class 'str'> >>>s2 = b'你好'
>>>
File "<stdin>", line 1
SyntaxError: bytes can only contain ASCII literal characters. >>>s2 = b'abc'
>>>s2
b'abc'
>>>type(s2)
<class 'bytes'>
  • unicode

unicode为解决传统字符编码的局限性而产生,为每一种语言的每一个字符设置了统一且唯一的二进制码,Python内部用于记录的也是该编码方式

上面的例子中s1就是通过unicode码来进行存储的

  • str

在Python3中的str类型对应的就是Python2中的unicode类型,即以统一的unicode码保存。而且,在Python3中,程序中所设置的字符串即直接保存为统一的str类型(unicode)

上面的例子中s1就是str类型的变量

  • encode与decode

由于存在着这两种不同的类型,势必要牵涉到二者的互相转化。bytes通过某一种编码方式(decode)得到str,而str通过某一种解码方式(encode)得到bytes

问题:为何会出现乱码的情况

unicode是表示了世界上所有的字符的, 但是其内部的存储是以二进制位存储的,比如你好的unicode编码为\u4f60\u597d

但是我们所见到的并不是\u4f60\u597d这一串编码,而是你好这两个汉字

这是由于控制台环境本身提供一个编码方式,比如uft-8gbkcp936等,通过这些编码方式,unicode码就转换成了我们可识别的字符了。

但是,不同的编码方式之间是存在区别的,当得到一个通过A方式编码得到的bytes类型,如果用B方式去进行解码的话,它就会按照B的标准去解读,那样就会出现乱码的现象。

s = "你好"
print(s)
s1 = s.encode("utf-8").decode("gbk")
print(s1)
######output########
你好
浣犲ソ

因此,开发的时候要弄清楚输入来源的编码以及输出环境的编码,尽可能保证一致性,或者做好转换的工作,可以减少出现乱码的可能性

问题:如何获取编码方式的信息?

  • 获取目标bytes的编码方式

这一情况可以通过chardet模块的detect()函数来获取信息,chardet是第三方库,可以通过pip来安装

b是待检测的bytes变量

import chardet
print(chardet.detect(b))
######output####
{'confidence': 1.0, 'encoding': 'ascii'}

confidence是指匹配程度,encoding是指可能的编码方式

获取当前环境的编码方式

这一情况可以使用sys模块下的getdefaultencoding()函数来获取信息

import sys
print(sys.getdefaultencoding()) ######## output#####
utf-8

问题:在控制台上看到的到底是什么?

写上面的东西的时候产生了一个疑问,现在已经知道Python内部存储str的方式是使用unicode字符集,但是我们在屏幕上看到的并不是unicode字符集

s = "你好"
print(s) #########output#############
你好
s的 unicode 是 \u4f60\u597d

那么,这中间应该是进行了某种转换

实际上,在执行print(str)的时候,python内部执行了encoding操作,控制台拿到的其实是一个bytes变量

之后,控制台又根据环境内部的编码方式,将所得到的bytes内容进行decoding的操作,就显示了原先str的内容

Python2和Python3的一些语法区别的更多相关文章

  1. day008 字符编码之 字符编码 、Python2和Python3字符编码的区别

    计算机基础(掌握) 启动应用程序的流程 双击qq 操作系统接受指令然后把该操作转化为0和1发送给CPU CPU接受指令然后把指令发送给内存 内存接受指令把指令发送给硬盘获取数据 qq在内存中运行 文本 ...

  2. Python2与Python3字符编码的区别

    目录 字符编码应用之Python(掌握) 执行Python程序的三个阶段 Python2与Python3字符串类型的区别(了解) Python2 str类型 Unicode类型 Python3 字符编 ...

  3. python2和python3中range的区别

    参考自 python2和python3中的range区别 - CSDN博客 http://blog.csdn.net/xiexingshishu/article/details/48581379 py ...

  4. Python2与python3中字符串的区别

    Python2 在python中包含两种字符串类型:str和unicode,str并不是完全意义上的字符串,其实是由unicode经过编码(encode)后的字节组成的字节字符串,而unicode则是 ...

  5. python2和python3中的range区别

    python2中的range返回的是一个列表 python3中的range返回的是一个迭代值 for i in range(1,10)在python2和python3中都可以使用,但是要生成1-10的 ...

  6. python2与python3中除法的区别

    python2中的除法 >>>1/2 0 即一个整数(无小数部分的数)被另外一个整数除,计算结果的小数部分被截除了,只留下了整数部分 有时候,这个功能比较有用,譬如在做一些需要取位数 ...

  7. python2 与python3中最大的区别(编码问题bytes&str

    1,在python2.x 中是不区分bytes和str类型的,在python3中bytes和str中是区分开的,str的所有操作bytes都支持 python2 中 >>> s = ...

  8. flask ssti python2和python3 注入总结和区别

    总结一下flask ssti的注入语句 代码 import uuid from flask import Flask, request, make_response, session,render_t ...

  9. python2和python3中str,bytes区别

    python2中,有basestring.str.bytes.unicode四种类型 其中str == bytes ,basestring = (str,unicode) >>> i ...

随机推荐

  1. IBM Security AppScan Standard 用外部设备录制脚本(手机端应用、app、微信等)进行安全测试

    一.打开AppScan,选择外部设备/客户机,点击下一步 二.记录代理设置,可以手动输入需要的端口号,也可以自动选择,记住端口号以及PC电脑的ip地址,手机端如何设置对应的端口跟ip可以参考 Jmet ...

  2. Java WebService学习资料

    最近用到了WebService,以前没用过,想要好好学习一下.感觉网上资料比较少,而且很杂,找了很久,觉得下面的两个文章解释的比较清楚,分享一下: WebService概念.原理:http://mp. ...

  3. 【JS小技巧】JavaScript 函数用作对象的隐藏问题

    用户反馈 @消失的键盘 在论坛反馈了一个问题,在 AppBoxMvc 中的 Title 模型中,如果将 Name 属性改名为小写的 name 属性,就会报错: 因为这是一个 ASP.NET MVC 的 ...

  4. 输入3个数a,b,c,按大小顺序输出

    题目:输入3个数a,b,c,按大小顺序输出 package com.li.FiftyAlgorthm; import java.util.Scanner; /** * 题目:输入3个数a,b,c,按大 ...

  5. Linux Redis自动启动,Redis开机启动,Linux Redis设置开机启动

    Linux Redis自动启动,Redis开机启动,Linux Redis设置开机启动 >>>>>>>>>>>>>> ...

  6. 《javascript设计模式与开发实践》读书笔记之函数,this,闭包

    一.函数基本理论 function compare(val1,val2){ return val1 - val2; }var result = compare(5,10); 1,函数的定义没什么意义, ...

  7. Python爬取百度贴吧数据

    本渣除了工作外,在生活上还是有些爱好,有些东西,一旦染上,就无法自拔,无法上岸,从此走上一条不归路.花鸟鱼虫便是我坚持了数十年的爱好. 本渣还是需要上班,才能支持我的业余爱好.上班时间还是尽量访问外网 ...

  8. Python蜕变-2017-4-23

    我的第一篇博客,这是试水练习.这次上的菜是Haporxy配置文件操作. <1> 上需求: 具体配置文件如下: global log 127.0.0.1 local2 daemon maxc ...

  9. 【Django】中间件

    Middleware 这个地方把所有Request 拦截住,用我们自己的方式完成处理以后直接返回 Response.因此了解中间件的构成是非常必要的. Initializer: __init__(se ...

  10. [技术] 如何正确食用cnblogs的CSS定制

    用过cnblogs的估计都知道cnblogs提供了相对比较开放的个性化选项,其中最为突出的估计就是页面CSS定制了.但是没学过Web前端的人可能并不会用这个东西... 所以我打算在此分享一些定制CSS ...