今天在做下python开发笔记之如何通过xml快捷获取数据,下面以调取nltk语料库为例: import nltk nltk.download() showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml Out[2]: True…
环境描述: 操作系统版本: root@9deba54adab7:/# uname -a Linux 9deba54adab7 --generic #-Ubuntu SMP Thu Dec :: UTC x86_64 GNU/Linux root@9deba54adab7:/# root@9deba54adab7:/# more /etc/issue Debian GNU/Linux \n \l python环境: root@9deba54adab7:/# pip pip pip2 root@9d…
按位取反: 要弄懂这个运算符的计算方法,首先必须明白二进制数在内存中的存放形式,二进制数在内存中是以补码的形式存放的 原码 原码(true form)是一种计算机中对数字的二进制定点表示方法.原码表示法在数值前面增加了一位符号位(即最高位为符号位):正数该位为0,负数该位为1(0有两种表示:+0和-0),其余位表示数值的大小. [+7]原= 0 0000111 B [-7]原= 1 0000111 B   反码 反码:正数:正数的反码与原码相同. 负数:负数的反码,符号位为“1”,数值部分按位取…
目标镜像环境介绍: 操作系统:ubuntu16.04 python版本:python 3.7.4 django版本:2.2 操作步骤: 1.  本地安装docker环境(略)2. 拉取ubunut指定版本镜像文件 docker pull ubuntu:16.04 3. 指定映射端口,启动容器 补充启动容器注意点:启动的时候,加参数-t -it有区别, https://www.cnblogs.com/miracle-luna/p/11111852.html -i: 以交互模式运行容器,通常与 -t…
今天分享一篇关于python下的zip()函数用法. zip()是Python的一个内建函数,它接受一系列可迭代的对象作为参数,将对象中对应的元素按顺序组合成一个tuple,每个tuple中包含的是原有序列中对应序号位置的元素,然后返回由这些tuples组成的list.若传入参数的长度不等,则返回list的长度和参数中长度最短的对象相同.在所有参数长度相同的情况下,zip()与map()类似,没有参数的情况下zip()返回一个空list. 使用zip反转字典       <span style=…
查找正则表达式 import re re_txt = re.compile(r'(\d)*.txt') m = re_txt.search(src) if not m == None: m.group(0) #complete str m.group(1) # first group string 匹配正则表达式 if re.match(r'(\d)*.txt',path): print("match") else: print("not match") 分割正则表…
类的基本概念: 问题空间:问题空间是问题解决者对一个问题所达到的全部认识状态,它是由问题解决者利用问题所包含的信息和已贮存的信息主动的地构成的. 初始状态:一开始时的不完全的信息或令人不满意的状况: 目标状态:你希望获得的信息或状态:     操作:为了从初始状态迈向目标状态,你可能采取的步骤. 对象:对象(object),是面向对象(Object Oriented)中的术语,既表示客观世界问题空间(Namespace)中的某个具体的事物,又表示软件系统解空间中的基本元素. 对象:一个对象具有自…
操作系统 : CentOS7.3.1611_x64 gcc版本 :4.8.5 Python 版本 : 2.7.5 思路如下 : 1.将浮点数a通过内存拷贝,赋值给相同字节的整型数据b: 2.将b转换为网络字节序变量c并发送到服务端: 3.服务端接收c并将c转换为主机字节序变量d: 4.将整型数据d通过内存拷贝,赋值给相同字节的浮点数据e: 至此,浮点数网络传输完成. C示例代码: #define htonl64 htobe64 #define ntohl64 be64toh uint64_t h…
网络数据获取(爬取)分为两部分: 1.抓取(抓取网页) · urlib内建模块,特别是urlib.request · Requests第三方库(中小型网络爬虫的开发) · Scrapy框架(大型网络爬虫的开发) 2.解析(解析网页内容) · BeautifulSoup库 · re模块(正则表达式) 或者第三方API抓取和解析. Requests库(http://www.python-requests.org/en/master/) 基本方法: requests.get():请求获取指定URL位置…
Python中的数组ndarray是什么? 1.NumPy中基本的数据结构 2.所有元素是同一种类型 3.别名是array 4.利于节省内存和提高CPU计算时间 5.有丰富的函数 ndarray的创建: import numpy as np >>> aArray=np.array([1,2,3]) >>> aArray array([1, 2, 3]) >>> bArray=np.array([(1,2,3),(4,5,6)]) >>>…