今天是周末后的第一天,周末四处浪浪浪,所以在周一的时候就要狠狠的复习之前的东西了,之后从第一天的计算机基础开始复习,具体内容请翻阅前三篇随笔,主要是要仔细看看,怕学了后面的忘了前面的,今天引进的第一个新东西,列表,一个列表可以表示多个事物,因为在列表中能够存放很多东西,至于符号就是用[]来表示,这也是一个新的数据类型,它自然又它自己的方法,比如用apend添加,用insert插入,还可以和索引一起狼狈为奸,随便插入,这个世界是相对的,有添加肯定有删除,而且还让你有多种方法任选一个删除,一个是re…
1 概述 两个向量之间的距离(此时向量作为n维坐标系中的点)计算,在数学上称为向量的距离(Distance),也称为样本之间的相似性度量(Similarity Measurement).它反映为某类事物在距离上接近或远离的程度.直觉上,距离越近的就越相似,越容易归为一类:距离越远越不同. 2 常用距离及其python实现 2.1 闵可夫斯基距离(Minkowski Distance) 严格意义上讲,闵可夫斯基距离不是一种距离,而是一组距离的定义.两个n维变量A(x11,x12,...,x1n)与…
今天,来时大概复习了上一天讲过的一些计算机基础和简单数据类型和if语句,第二天就来了循环,还是个while的死循环,突然想到还是电脑好,不管循环多少次,只要电脑不崩溃,就能一直精准的算下去,这就和人不一样了,不管同样的事做过多少次也是又概率出错的,时间的长短就决定概率的大小了,while的基本类型就是后面加个正确的条件就行了,如果条件一直正确并成立,则就一直循环下去,在循环内能运行的东东就多了,可以不停的加啊什么的,想要停的只要在一定条件下加个break就可以了,还讲了一个硬货就是字符串格式化,…
新的一天,依旧是内容补充,补充了数学没有的运算符,in和not in,就是判断in前面的东西是不是在后面的数据中,然后新课讲了平常最常用的字符串的方法,引号的里面全部都是字符串,在其中就会又如何判断这个字符串能不能转换成整型,之后还讲了输入的字符串能不能变换大小写之类的,顿时解开了为什么在输入验证码的时候大小写都可以,还有在字符串里万一不小心输入了一些空格键,一般来说是看不出来的,所以这个功能就比较厉害了,可以清除空格,避免申请输入的时候出错时一脸懵逼,还有替换功能,可以把原来字符串里的一些东西…
#定义几种距离计算函数 #更高效的方式为把得分向量化之后使用scipy中定义的distance方法 from math import sqrt def euclidean_dis(rating1, rating2): #欧式距离计算 """计算2个打分序列间的欧式距离. 输入的rating1和rating2都是打分dict 格式为{'小时代4': 1.0, '疯狂动物城': 5.0}""" distance = 0 commonRatings =…
Python 之父讲述退位原因,以及 Python 的未来将何去何从. ​ 在 Python 社区,Python 的发明者 Guido Van Rossum 被称为 “仁慈的终生独裁者”(BDFL,Benevolent Dictator for Life).今年 7 月 12 日的时候他突然宣布退位了.消息一出,一时间震惊了整个 Python 世界.当时他以 PEP 572 改进提案的争吵事件为例,表明其退出缘由.Guido van Rossum 于 1990 年发明 Python,他相信 Py…
摘要:在Spark开发中,由于需要用Python实现,发现API与Scala的略有不同,而Python API的中文资料相对很少.每次去查英文版API的说明相对比较慢,还是中文版比较容易get到所需,所以利用闲暇之余将官方文档翻译为中文版,并亲测Demo的代码.在此记录一下,希望对那些对Spark感兴趣和从事大数据开发的人员提供有价值的中文资料,对PySpark开发人员的工作和学习有所帮助. 官网地址:http://spark.apache.org/docs/1.6.2/api/python/p…
大家好,并发编程 进入第四篇. 本文目录 前言 Event事件 Condition Queue队列 总结 . 前言 前面我已经向大家介绍了,如何使用创建线程,启动线程.相信大家都会有这样一个想法,线程无非就是创建一下,然后再start()下,实在是太简单了. 可是要知道,在真实的项目中,实际场景可要我们举的例子要复杂的多得多,不同线程的执行可能是有顺序的,或者说他们的执行是有条件的,是要受控制的.如果仅仅依靠前面学的那点浅薄的知识,是远远不够的. 那今天,我们就来探讨一下如何控制线程的触发执行.…
一不留神已经到第四部分了,这一部分继续总结数据结构和常用的gevent类,废话不多说继续. 1.Timeout错误类 晚上在调试调用第三方接口的时候,发现有些接口耗时非常多,觉得应该有个超时接口来限制他们的过长时间的不结束.我开始尝试了requests上面的timeout参数,整个代码流程里面使用到了monkey_patch()但是有个问题,我发现requests.timeout参数在gevent协作的时候表现很奇怪,似乎无法像同步程序这样表现出预想的状况.于是去gevent官方文档里面找寻ti…
由于Python的GIL限制,多线程未必是CPU密集型程序的好的选择. 多进程可以完全独立的进程环境中运行程序,可以充分地利用多处理器. 但是进程本身的隔离性带来的数据不共享也是一个问题.而且线程比进程轻量级. multiprocessing Process类 Process类遵循了Thread类的API,减少了学习难度.(几乎和Thread类使用方法一模一样) 上一篇文章里最后使用了多线程来解决CPU密集型的例子,但发现多线程和多线程最终执行效率几乎相同,多线程并没有想象中的优势. 上一篇中多…