Python 读书】的更多相关文章

Web Scraping with Python读书笔记 标签(空格分隔): web scraping ,python 做数据抓取一定一定要明确:抓取\解析数据不是目的,目的是对数据的利用 一般的数据抓取结构如下: 概要 一个简单的web数据抓取的流程就像下面的图一样 HTML获取 分析工具 Firefox Firebug 工具包 urllib urllib2 Requests phantomjs selenium 反反爬虫策略 动态设置User-Agent Cookie的使用 时间延迟/动态延…
1. 原文<A byte of Python> 翻译版:<<简明Python教程>> 2. Python:核心编程…
看这本书的目的:再熟悉基本概念. 大部分都是知道,但是需要 明确 出来的 概念. - 欢迎吐槽错误,非常感谢. <A byte of python> - THIS 1. 组织行 - 形式:#! /usr/bin/python - 告诉linux通过哪个解释器去运行 源文件. 2. print实际上是一个操作符. 3. 自然字符串(又,原始字符串) - r 或 R, 我猜 r = raw - 完全地直接输出,即使是转义符也直接输出了 >>> print r'\n\nhello'…
2.1 可变序列与不可变序列 可变序列 list. bytearray. array.array. collections.deque 和 memoryview. 不可变序列 tuple. str 和 bytes. 2.2 列表推导和生成器表达式 列表推导是构建列表(list)的快捷方式 生成器表达式则可以用来创建其他任何类型的序列 ps: **很多 Python 程序员都把列表推导(list comprehension)简称为 listcomps,生成 式表达器(generator expre…
列表推导是构建列表(list)的快捷方式,而生成器表达式则可以用来创建其他任何类型的序列.如果你的代码里并不经常使用它们,那么很可能你错过了许多写出可读性更好且更高效的代码的机会. 2.2.1 列表推导和可读性 把一个字符串变成 Unicode 码位的列表 第一种方法 symbols = '$¢£¥€¤' codes = [] # ord() ascii字符串 转换成对应的数字 for symbol in symbols: codes.append(ord(symbol)) print(code…
原文:http://www.djangobook.com/en/2.0/frontmatter.html 译文:http://djangobook.py3k.cn/2.0/ 或者http://docs.30c.org/djangobook2/chapter01/ 其他资料:Django1.3 模板标签和过滤器:http://my.oschina.net/dddttttt/blog/304200 django documentation 1.5中文文档:http://django-chinese-…
编辑器:windows,linux 不要用notepad,缩进糟糕 -------------- 5.18缩进 同一层次的语句必须有相同的缩进.每一组这样的语句称为一个块. i = 5 2  print('Value is ', i)# Error! Notice a single space at the start of the line行首有空格 print('I repeat, the value is ', i) 当你运行的时候,会得到下面的出错信息: File "whitespace…
1月15日 <简明python教程>上 基本结构: 基础概念+控制流+函数+模块+数据结构+面向对象+I/O+异常+标准库+其他   1.概念 1-0    退出python linux:ctrl-D:windows:ctrl-z 1-1     ‘’,“”,“”“”“”的区别 ''和""用来指示字符串,其中的空格.制表符等将保留. 字符串是不可变得. 1-2     “\”的两种用途:转义符.连接两行 1-3     自然字符串r“”或R“”:一定要用自然字符串处理正则表…
记录一下这段时间看<Head First Python>记录的一些小知识,只是记了很少一部分,有需要的话以后再添加吧. for循环的使用: for 目标标识符 in 列表: 处理代码 if语句的使用: if 满足某个条件: true组 else: false组 len() BIF会提供某个数据对象的长度,或集合的项数. isinstance() BIF会检查一个标识符是否为某个指定类型. 使用可选参数: def print_lol(the_list , level = 0) 下面附一些代码:…
第一章 %d %s %f 数字和表达式 加减乘取模都可以直接输入 除需注意: 1/2=0.5 1/2.0=0.5 --有浮点按浮点计算 1//2=0 --整除 1.0/2.0=0.5 1.0//2.0=0.0   --取整后四舍五入 幂运算: 2**3 --2的3次方 长整形:数字结尾加L 十六和八进制: 0xAF 0o101 变量: 字母数字下划线,不能以数字开头 获取用户输入:input 函数: pow(x,y)--次方 等值于 ** abs(x)--绝对值 round(x)--四舍五入 模…
有些位置可能翻译理解的不到位,各位看官如有疑问,欢迎留言赐教. Pythonic Thinking 大家经常用Pythonic来形容python语法风格的编程方式:简单优美,没有之一:通过import this查看Python之禅. 使用python之前需要明确使用的是python2 or python3.推荐使用python3. PEP8编码风格指南 PEP8(Python Enhancement Proposal #8 ),点击查看官方文档,按这种方式编码你的Python更加优美. 缩进留白…
继承的优缺点 推出继承的初衷是让新手顺利使用只有专家才能设计出来的框架.--Alan Kay 子类化内置类型很麻烦 (如 list 或 dict)) ,别搞这种 直接子类化内置类型(如 dict.list 或 str)容易出错,因为内置类型的 方法通常会忽略用户覆盖的方法. 不要子类化内置类型,用户自己定义的类应该继承 collections 模块的类, 例如UserDict.UserList 和 UserString,这些类做了特殊设计,因此易于扩展. import collections c…
赋值 >>> list=[] >>> app=[list,list,list] >>> app [[], [], []] >>> app[1].append(1) >>> app [[1], [1], [1]] >>> id(app[1]) 1666670423944 >>> id(app[2]) 1666670423944 条件语句: >>> app=[1,''…
django架站过程总结:1.django-admin startproject store2.store这个project的目录下有:__init__,manage,setting,urls3.setting里面的重点:     a.配置数据库(engine,name,use,passwd,port,host),以sqlite为例,填上sqlite3.已创建的db(修改:不用提前创建数据库)     b.language,time_zone     c.installed apps:安装dja…
本系列记录并分享:学习利用Python写网络爬虫的过程. 书目信息 Link 书名: 用Python写网络爬虫 作者: [澳]理查德 劳森(Richard Lawson) 原版名称: web scraping with python 读书笔记汇总 00--建立练习环境 01--网络爬虫简介 02--数据抓取 03--下载缓存 04--并发下载 05--动态内容 06--表单交互 07--验证码处理 08--Scrapy 09--总结 参考信息 Python爬虫学习系列教程 Python Spid…
http://blog.chinaunix.net/uid-26443921-id-3481357.html 半年前开始系统完整深入的了解学习 python 读书篇: <python 核心编程2> -- 系统全面了解python语法,基本对生成表达式,生成器,迭代器有了深入的了解,基本能灵活熟练使用: <python cookbook>  -- 主要了解python语言等独有的动态特性,开始接触和使用动态编程+元编程: <python 源码剖析>   -- 比较深入的了…
Fluent Python 读书手记 Python数据模型:特殊方法用来给整个语言模型特殊使用,一致性体现.如:__len__, __getitem__ AOP: zope.inteface 列表推导(list comprehensive)和 表达式生成器(generator expression),分别用 [...] 和 (...)表未.后者是迭代生成,更节省内存. 元组tuple两大功能特性:不可变.用作数据记录结构(位置信息).元组里的元素最好也是不可变数据. array 和 列表相比的区…
Python读书笔记:70个注意的小Notes 作者:白宁超 2018年7月9日10:58:18 摘要:在阅读python相关书籍中,对其进行简单的笔记纪要.旨在注意一些细节问题,在今后项目中灵活运用,并对部分小notes进行代码标注.(本文原创,转载注明出处:Python读书笔记:70个注意的小Notes  ) <Python读书笔记> 1 python始终记录变量最新值.2 变量应简短且具有描述性,如student_name等.3 变量名推荐小写.4 单双引号括起来的,字符串可以包含引号和…
简介 朋友问我能不能做一个下载他在豆瓣读书上的短评的工具,于是就做了这个“豆瓣用户读书短评下载工具”. GitHub链接:https://github.com/xiaff/dbc-downloader. 这个小工具使用Python3.4编写,其工作流程为: 用户输入其豆瓣ID: 抓取用户评论列表网页 对网页进行解析: 存储评论相关信息: 将Markdown格式文件转换为Html. 用到的库主要有: urllib.request BeautifulSoup4 markdown 抓取网页 所需要抓取…
[读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基础篇我也看了,但发现有不少理论还是讲得不够透彻,个人还是比较倾向于 <Machine Learning>--Tom M.Mitchell,Andrew 的 machine learning 课程,或周华志的<机器学习>,Jiawei Han 的 <data mining>.…
文章提纲 全书总评 读书笔记 C01.神经网络如何工作? C02.使用Python进行DIY C03.开拓思维 附录A.微积分简介 附录B.树莓派 全书总评 书本印刷质量:4星.纸张是米黄色,可以保护眼睛:印刷清楚,文字排版整洁,基本没有排版过程中引入的错误,阅读不累眼睛.但是可能是Word排版,感觉数学公式的排版不是太好. 著作编写质量:4星.简单,易懂,入门很好.可能是为了帮助读者克服对数学的恐惧,所以多用图来说明.但是,没有数学的神经网络本质上还是空中楼阁,过于淡化数学的作用反而使推导部分…
转载-<Python学习手册>读书笔记 http://www.cnblogs.com/wuyuegb2312/archive/2013/02/26/2910908.html…
python高级编程读书笔记(一) python 高级编程读书笔记,记录一下基础和高级用法 python2和python3兼容处理 使用sys模块使程序python2和python3兼容 import sys ver=sys.version_info#(major=3, minor=6, micro=6) if ver<(3,0,0):# 3是版本号,0是此版本号,第二个0修订号.    import urllib2else:   import urllib  获取当前环境所用的python包…
说明 五一将至,又到了学习的季节.目前流行的各大书单主打的都是豆瓣8.0评分书籍,却很少有人来聊聊这9.0评分的书籍长什么样子.刚好最近学了学python爬虫,那就拿豆瓣读书来练练手. 爬虫 本来思路是直接爬豆瓣的书籍目录,将评分9.0以上的书筛选出来,一打开发现事情并不简单,几千万本书可不好爬 = =,于是转化一下思路,看有没有类似的书单. 一搜还真有,找到一个9.0评分的榜单,大大减少了工作量,这样就不用先爬一下整站书籍来筛选了.看了看榜单,应该是某位好心的书友手工整理的,更新时间为2018…
说明: 该部分内容为<OpenCV Computer Vision with Python>读书笔记. 1.读入文件与保存. import cv2 image=cv2.imread('a.jpg') cv2.imwrite('b.jpg',image) 2.以灰度方式 读取进来(此时会丢失部分信息).然后将其保存. import cv2 grayImage = cv2.imread('a.jpg', cv2.CV_LOAD_IMAGE_GRAYSCALE) cv2.imwrite('b.png…
最近刚读完一本新书,关注的公众号作者出的“谁说菜鸟不会数据分析—Python篇”,话说现在很多微信公众号大牛都在出书,这貌似是一个趋势.. 说说这本书吧,我之前看过一些网文,对于数据分析这一块也有过一点点研究,很浅,大体就是爬个数据,然后做一些简要的分析,最后可视化一下就ok了.这本书还是挺适合小白或者小白加强版,毕竟还是要掌握一些基础的知识,全盲肯定是不行的.读完此书后,依照惯例做了个简要版的读书笔记,虽然看着很low,但还是花费了我一下午的时间,另外我也搞到了本书的简版电子书,只有几十页,如…
用过“微信读书”的朋友都知道,如果我们想阅读全本的付费书籍,除了购买整本(使用书币)外,还可以使用无限卡.可无论是购买全书还是无限卡,归根结底都是要花银子的. 除此之外,还有一种方式——用阅读时长兑换书币.根据目前微信读书的兑换策略,阅读半个小时,即可兑换1枚赠币,每周最多可兑换10枚赠币.因此,理论上每周我们可以使用5个小时的时间,获得最多10元等价书币. 本篇文章博主就教大家一种方法,通过模拟书籍的手动翻页,快速免费获得书币的方法,该方法仅适用于Android平台. 首先要配置好Androi…
[TOC] ##项目来源 这个有意思的项目是我从GitHub上找来的,起因是在不久前微信读书突然就设置了非会员书架数目上限,我总想做点什么来表达我的不满,想到可否用爬虫来获取某一本书的内容, 但是我技术有限,我使用F12进行检查,发现微信读书的网页版中的内容居然是canvas元素结合js绘制出来的图像? 但是大佬arry-lee不知通过什么方法找到了微信读书的各种接口,从而可以获取到诸如笔记.标注.想法等信息,另一位大佬liuhao326,在前一位的基础上进行了功能上的完善 可以参考他们的Git…
推荐 <改善Pthon程序的91个建议>是从基本原则.惯用方法.语法.库.设计模式.内部机制.开发工具和性能优化8个方面深入探讨编写高质量python代码的技巧.禁忌和最佳实践. 读书就如同和作者对话,阅读本书可以感觉的到作者是一个实战经验丰富的Pythoner,与高手对话受益匪浅.对于一个想要提高自己python代码的coder来说值得一读的. 边读书边记录,把我认为重要的建议记录下来,20个左右,希望更多人能从中获益. 引论 建议5:通过适当添加空行使代码布局更为优雅合理 在函数定义或者类…
本文是<python编程从入门到实践>读书实践笔记11章的内容,主要包含测试,为体现测试的重要性,独立成文. 11 测试代码 写在前面的话,以下是我这些年开发中和测试相关的血泪史. 对于一个bug,发现得越晚,处理它的成本就越高. bug在一个复杂系统中时,找到它要比处理它麻烦的多. 大多数bug都低级得令人发指. 永远无法找到所有bug,成本和安全需要互相妥协,极端一般都不那么美好. 测试人员有他们的KPI,自己找的bug才适合自己 11.1函数自测.测试用例和unittest Python…