Python数据挖掘——基础知识 数据挖掘又称从数据中 挖掘知识.知识提取.数据/模式分析 即为:从数据中发现知识的过程 1.数据清理 (消除噪声,删除不一致数据) 2.数据集成 (多种数据源 组合在一起) 3.数据选择 (从数据库中提取和分析任务相关的数据) 4.数据变换 (通过汇总或聚焦操作,把数据变换和统一成适合挖掘的形式) 5.数据挖掘 (基本步骤,使用智能化方法提取数据) 6.模式评估 (根据某种兴趣度量,识别代表知识的真正的有趣模式) 7.知识表示 (使用可视化和知识表示技术,向用户…
面向对象基础知识 1.什么是面向对象编程? - 以前使用函数 - 类 + 对象 2.什么是类什么是对象,又有什么关系? class 类: def 函数1(): pass def 函数2(): pass # obj是对象,实例化的过程 obj = 类() obj.函数1() ========== 面向对象不好 ============ ========== 函数编程好 ============== 有时候,函数编程能实现?比较麻烦, 面向对象非常的简单就能实现 3.什么时候适用面向对象? - 1.…
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本. 网络爬虫必备知识点 1. Python基础知识2. Python中urllib和urllib2库的用法3. Python正则表达式的使用4. python Beautiful Soup的用法5. Python爬虫框架Scrapy 网站浏览网页的过程 网页实质是由 HTML 代码构成的,爬虫爬来的便是这些内容,通过分析和过滤这些 HTML 代码,实现对图…
python是一种解释型.面向对象的.带有动态语义的高级程序语言. 一.下载安装 官网下载地址:https://www.python.org/downloads 下载后执行安装文件,按照默认安装顺序安装即可.然后可以在命令行中输入python,检查是否已安装成功,如果出现以下内容,则证明安装成功. 二.编译器 支持python的编译器是很多的,但编译器的选择,根据个人习惯,没有最好的,只有最适合自己的,编译器的选择可参考下面这两个链接的内容. 开源中国:Python开发工具 知乎:有哪些值得推荐…
目录 Python基础知识2 一.二进制 二.文字编码-基础 为什么要有文字编码? 有哪些编码格式? 如何解决不同国家不兼容的编码格式? unicode编码格式的缺点 如何既能全球通用还可以规避unicode的缺点? python3的编码格式是什么样的? 三.浮点数 四.列表 如何理解列表? 列表的操作有哪些? 深浅复制问题 五.字符串 什么是字符串? 字符串的常用方法 使用r取消字符串转义 六.元组 元组和列表有什么区别? 七.哈希 八.字典 什么是字典? 字典常用操作 九.集合 什么是集合?…
第三节 简单的Python数据类型.变量赋值及输入输出 Python是一门解释性语言,它的执行依赖于Python提供的执行环境,前面一章介绍了Python环境安装.WINDOWS系列Python编辑和运行界面等内,这节就开始真正的语言学习了.本节介绍的内容是为了大家尽快开始使用Python编写简单的代码,是Python编程最基本的内容. 一. Python的基础数据类型 学语言首先要知道语言的数据类型,Python数据类型比较多,本节只引入最基础的字符串(str)和整数(int).浮点数(flo…
Python入门不知道这些你还是承早放弃吧!真的 Python 简介 Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构. Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节.类似于PHP和Perl语言. Python 是交互式语言: 这意味着,您可以在一个Python提示符,直接互动执行写你的程序. Python 是面向…
看完本文大概需要8分钟,看完后,仔细看下代码,认真回一下,函数基本知识就OK了.最好还是把代码敲一下. 一.函数基础 简单地说,一个函数就是一组Python语句的组合,它们可以在程序中运行一次或多次运行.Python中的函数在其他语言中也叫做过程或子例程,那么这些被包装起来的语句通过一个函数名称来调用. 有了函数,我们可以在很大程度上减少复制及粘贴代码的次数了(相信很多人在刚开始时都有这样的体验).我们可以把相同的代码可以提炼出来做成一个函数,在需要的地方只需要调用即可.那么,这样就提高了代码的…
http://www.javaeye.com/topic/560229 一 预备知识 字符集1, 常用字符集分类ASCII及其扩展字符集作用:表语英语及西欧语言.位数:ASCII是用7位表示的,能表示128个字符:其扩展使用8位表示,表示256个字符.范围:ASCII从00到7F,扩展从00到FF.ISO-8859-1字符集作用:扩展ASCII,表示西欧.希腊语等.位数:8位,范围:从00到FF,兼容ASCII字符集.GB2312字符集作用:国家简体中文字符集,兼容ASCII.位数:使用2个字节…
requests Python标准库中提供了:urllib.urllib2.httplib等模块以供Http请求,但是,它的 API 太渣了.它是为另一个时代.另一个互联网所创建的.它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务. Requests 是使用 Apache2 Licensed 许可证的 基于Python开发的HTTP 库,其在Python内置模块的基础上进行了高度的封装,从而使得Pythoner进行网络请求时,变得美好了许多,使用Requests可以轻而易举的完成浏览器…
一,编程语言的类型: 1.编译型 2.解释型 3.静态语言 4.动态语言 5.强类型定义语言 6.弱类型定义语言 编译型vs解释型 编译型: 优点:编译器一般会有预编译的过程对代码进行优化.因为编译只做一次,运行时不需要编译,所以编译型语言的程序执行效率高,可以脱离语言环境独立运行 缺点:编译之后如果需要修改,就需要整个模块重新编译,编译时根据对应的运行环境生成机器码,不同的操作系统之间移植会有问题,需要根据运行的操作系统环境编译不同的可执行文件. 解释型 优点:有良好的平台兼容性,在任何环境中…
1.计算机历史 计算机使用高低电压的两种状态来描述信息.计算机可以理解的只有二进制数据即010100011....,1个比特位可以表示的状态只有2种,n个比特位可以表示的状态有2的n次方种. 所以如果想要描述天气状态:天晴.下雨.刮风.下雪.霜冻,则需要使用3个比特位. 2.编程语言历史 计算机只能理解二进制数据,二进制数据中蕴含了很多指令.操作.数据,计算机通过cpu直接运行二进制代码执行不同的功能,二进制代码被称为机器语言. 但是机器语言(二进制代码)对于人类而言可读性太差.编写太困难,所以…
Python基础计算机常识:硬件性能:CPU.内存输入设备:鼠标.键盘外部存储设备:硬盘输出设备;显示器.打印机(不算自带)通讯设备:无线网卡-----------------------------------------------------------------软件系统软件:操作系统(Unix系统.Windows.MacOS操作系统.Linux操作系统)应用软件:程序编写----------------------------------------------------------…
第三章 基础 3.1程控制语句 3.1.1if语句 1.单if ​ if 关键字 空格 条件 冒号 ​ 缩进 结果 print(1) if 3 > 2: print(9) print(8) 2 .if......else......(二选一) ​ if 空格 条件 冒号 ​ 缩进 结果 ​ else 冒号 ​ 缩进 结果 n = int(input("请输入数字:")) if 3 < n: print(123) else: print(321) print(6) 3 .if…
目录 1 面向过程编程与函数式编程 2 函数的基本结构 3 函数的参数 1 面向过程编程与函数式编程 截至目前我们所接触.所写的编程为:面向过程式编程[可读性差/可重用性差] # 面向过程编程 user_input = input('请输入角色:') if user_input == '管理员': import smtplib from email.mime.text import MIMEText from email.utils import formataddr msg = MIMETex…
学习python前最好知道的知识点: python之父:Guido van Rossum python是一种面向对象语言 目前python最新的版本是3.8,python2已经逐渐淘汰 python的优点:简单,简单,简单(python的哲学就是:简单优雅),而且可以用很少的语言实现复杂的功能,同时有很丰富的基础代码库和第三方库(python拒绝重复造轮子):剩下还有一堆的优点:开源.可移植性.易维护阅读.易扩展.可嵌入(这个比较有意思,它可以嵌入到C.C++.java代码中) python的缺…
python基础 --基础: 1, 第一句python - 用cmd 调用--python (路径)+(文件名)) 扩展名是任意的 - 导入模块是,如果不是.py文件,可能导入不成功 - python --> 扩展名必须是.py 2, 2种执行方式 python解释器 python (路径)+(文件名) cmd输入python 进去解释器,实时输入并获取结果 !!!编码 ASCII 8位 Unicode 16位+ UTF-8 :能用多少表示就用多少表示 ==>python3无需关注,pytho…
1.输入输出 输出实例   1 2 print 'hello','world' hello world 输入实例   1 2 3 4 5 name = raw_input(); print "hello,",name   world hello,world 输入时提示实例   1 2 3 4 5 name = raw_input('please enter your name:'); print "hello,",name   please enter your n…
Python文件命名时不要有中文,不然在dos中不能执行 D:\Program Files\Py>Python hellyy.pyYear:2016Month(1-12):1Day(1-31):1January 1st. 2016 [环境变量]D:\Program Files\Python; [字符串转义]"Let's go!"'"Hello, world!" she said''Let\'s go' [序列]Python包含六中内建的序列列表 元组 字符串…
1.python字符串可以用"aaa",'aaa',"""aaa""这三种方式来表示 2.python中的转义字符串为"r",C#里面为@逐字符 3.使用index获取字符串的某个字符:如字符串str="abcd123456" ,使用str[3]得到一个字符d 4.使用[startindex:endIndex]截取字符串,如:str[2:3],结果为:c,这里注意的一点:截取的字符串包括开始字符(…
一.什么是爬虫,爬虫能做什么 爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来.比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张网上来获取数据. 爬虫可以抓取的某个网站或者某个应用的内容,提取有用的价值.也可以模拟用户在浏览器或者App应用上的操作,实现自动化的程序.以下行为都可以用爬虫实现: 咨询报告(咨询服务行业) 抢票神器 投票神器 预测(…
一.数据类型和变量 计算机顾名思义就是做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值.但是,计算机能处理的远不止数值,还可以处理文本.图形.音频.网页等各种各样的数据,不同的数据,需要定义不同的数据类型.在Python中,能够直接处理的数据类型有以下几种: 1.整数 Python可以处理任意大小的整数,当然包扣负整数,在程序中的表示方法和数学上的写法一模一样,例如:2,100,20等等. 计算机由于使用二进制,所以,有时候用十六进制表示整数比较方便,十六进制欧诺个0x前缀和0-9,…
字典 在python中,字典是一系列键-值对,每个键都与一个值相关联,可使用键来访问相关联的值.与键相关联的值可以是数字.字符串.列表乃至字典,即可将任何python对象用在字典中的值. 在python中,字典用放在花括号{}中的一系列键-值对表示. alien_o = {'color':'green','points':'5'} #键值对是两个相关联的值,指定键时,将返回与之相关联的值.键与值之间用冒号隔开,而键值对之间用逗号分割.在字典中,想存储多少个键值对都可以. #最简单的是只有一个键值…
1 列表 用[]来表示列表,并用逗号分隔其中的元素.如: B=['trek','cannondale','redline','specialized'] print(B) ['trek', 'cannondale', 'redline', 'specialized'] 1.1 访问列表元素(可指出列表的名称,再取出元素的索引,并将其放在括号内) 如:从B中取出第一个元素: B=['trek','cannondale','redline','specialized'] print(B[0]) tr…
首先,对于初学者在一个项目中设置多个程序可以执行,是非常方便的,可以方便对不同知识点的练习和测试 对于商业项目而言,通常在一个项目中,只有一个可以执行的Python程序 一.注释 为了提高可读性,注释应该至少离开代码至少两个空格 单行注释(行注释) 以#开头,右边是说明文字 最好#后加一个空格 保持代码的优雅~ (一键修改) 多行注释(块注释) """ 这是一个多行注释 在多行注释之间,可以写很多很多内容.... """ print("…
一.函数 def 函数名(): 函数封装的代码 ... def是英文define缩写 别的Python文件可以引入 调用 定义时 和其他代码包括注释保留两个空行 pycharm 调试时 F8 Step Over 单步执行代码,会把函数调用看作一行代码直接执行 F7 Step Into   单步执行代码,如果是函数,会进入函数内部 注释时 快捷键Ctrl+Q 查看函数的说明信息 二.模块 模块是Python程序架构的一个核心概念 模块好比是工具包,要使用需要导入,import这个模块 每一个.py…
1.执行Python脚本的两种方式 1.pyhon解释器 python zhurui.py 2.简述位.字节的关系 8位一个字节 3.简述ascii.unicode.utf-­‐8.gbk的关系 4.请写出  “朱锐”  分别用utf-­‐8和gbk编码所占的位数 一个汉字 utf-8占3个字节,utf-8:6 gbk:4 5.Pyhton单行注释和多行注释分别用什么? 6.声明变量注意事项有那些? 7.如有一下变量n1  =  5,请使用int的提供的方法,得到该变量少可以用多少个二进制位表示…
我的笔记里的python代码运行环境都是在pycharm软件中运行,所以不去记录如何配置环境变量呀什么的. python种类 Cpython: Python的官方版本,使用C语言实现,使用最为广泛,CPython实现会将源文件(py文件)转换成字节码文件(pyc文件),然后运行在Python虚拟机上. Jpython: Python的Java实现,Jython会将Python代码动态编译成Java字节码,然后在JVM上运行. IronPython:   Python的C#实现,IronPytho…
一.第一个Python程序 用vim编写,格式: vim hello.py 然后按 i 进入插入模式开始写代码,注意所有的代码都要用英文输入法,先写括号和引号,再在引号里面写内容(为了避免引号.括号不匹配) 代码: print("hello,world!") 在文件所在路径运行程序(python xxx 是用python2运行程序:python3 xxx是用python3运行程序) python hello.py 或者 python3 hello.py 二.Python的交互模式 在终…
一,编程语言介绍 1.机器语言:直接用二进制编程,直接控制硬件,需要掌握硬件的操作细节 优点:执行效率高   缺点:   开发效率低 2.汇编语言:用英文标签取代二进制指令去编写程序,直接控制硬件,需要掌握硬件的操作细节.    优点:开发效率比机器语言高   缺点:仍然没有改变直接操作硬件的本质,执行效率高,但不如机器语言高. 3.高级语言:直接用人类的语言去编写程序,不再需要掌握硬件的操作细节.   编译型C:类似于谷歌返回,经过一次翻译,以后可以直接拿着翻译的结果去执行.   编译的工具-…