首先说一下什么是离散化以及连续变量离散化的必要性. 离散化是把无限空间中无限的个体映射到有限的空间中去,通俗点讲就是把连续型数据切分为若干“段”,也称bin,离散化在数据分析中特别是数据挖掘中被普遍采用,主要原因有: 1.算法需要.有些数据挖掘算法不能直接使用连续变量,必须要离散化之后才能纳入计算,在数据挖掘软件中,表面上看可以直接使用连续变量进行计算,实际上在软件后台已经对其进行了离散化预处理. 2.降低异常数据的敏感度,使模型更加稳定.我们知道极端值和异常值会使模型参数拟合的不准确,误差过大…
有时我们需要对数据资料按照某个规则进行归组,如 在上述资料中,想按照年龄进行分组,30岁以下为组1,30-40岁为组2,40岁以上为组3 有两种方法可以实现: 1.使用计算变量功能 <1>打开转换-计算变量菜单,定义组变量名group,并在数字表达式中赋值为1,点击确定,这样资料中新增了一个名为group的变量,并且值全部为1<2>打开转换-计算变量菜单,在数字表达式中赋值为2,点击左下方“如果”按钮,设置条件年龄>=30 & 年龄<=40,点击确定,之后看到g…
在实际工作中,往往需要对取得的数据资料进行整理,使其满足特定的分析需求,下面介绍SPSS在资料整理方面的一些功能. 1.加权个案加权个案是指给不同的个案赋予不同的权重,以改变该个案在分析中的重要性.为什么要这么做呢?比如某些原始的数据资料每一行代表一个个案,在实际分析时,通常会整理成列联表或频数表,即增加一个频数变量,对重复取值的个案进行计数,这样整理之后数据内容会简化很多,但如果直接使用的话还不行,因为每种取值的个数不同,导致权重不同,因此需要加权处理.SPSS的加权个案在数据菜单的加权个案过…
常常忘记mysql的一些命令行操作,甚至于说,比较复杂的sql格式记不住或忘记了,也可能根本不会考虑去记,因此,做一下汇总,当下次出现恍惚时不至于去百度挨个找,有时就是记不起来,但是只要给点药引子,立马会想起来. 一.mysql基础操作 mysql命令规则:每行sql后边都跟个分号表示一个命令语句结束 1.登录本地mysql数据库 $ mysql -u root -p$ password 2.更改root密码 mysql>mysqladmin -uroot password 'yourpassw…
各种张量初始化 创建特殊类型的tensor a = torch.FloatTensor(2,3) a = torch.DoubleTensor(2,3) ... 设置pytorch中tensor的默认类型 torch.set_default_tensor_type(torch.DoubleTensor) 更改tensor类型 a.float() 各种常用初始化 torch.randn_like() torch.rand(3,3) #创建 0-1 (3,3)矩阵 torch.randn(3,3)…
各种张量初始化 创建特殊类型的tensor a = torch.FloatTensor(2,3) a = torch.DoubleTensor(2,3) ... 设置pytorch中tensor的默认类型 torch.set_default_tensor_type(torch.DoubleTensor) 更改tensor类型 a.float() 各种常用初始化 torch.randn_like() torch.rand(3,3) #创建 0-1 (3,3)矩阵 torch.randn(3,3)…
系统目录结构了解 CentOS系统中没有磁盘的概念,一切皆文件,/目录下的的一个个文件夹目录就相当于磁盘了,这里简单记录几个常用的目录以及对应的作用: dev:Linux一切皆文件,包括硬件也进行了文件化,可以在该目录下看到所有的硬件设备 medie:连接到系统中的硬件例如U盘.光驱等会被系统识别并挂载到该目录下 mnt:外部存储挂载,例如Windows.Linux双系统时可以将windows分区挂载到该目录下,再或者虚拟机与物理机的文件共享 etc:关于一些环境变量之类的配置项都在该目录下 b…
数值函数是常用函数之一,也是学习mysql必会的,常用的有如下一些: 1.ceil:返回大于某个数的最小整数值: 2.floor:和上一个相反,返回小于某个数的最大整数值: 3.round:返回某个数值四舍五入后的数值: 如上图,round的第二个参数代表需要保留的小数位. 4.truncate:返回某个数值被截断后的数值: 这里与round不同的是,不管需要保留的小数位后边一位是什么都会直接抛弃,同样的第二个参数代表需要保留的小数位. 注:以上的例子中都是整数,但这些函数也可以一样的处理负数.…
1.左外连接left outer join或者left jion,outer可以省略不写,下边的右连接和全连接也一样: 左外连接的意思是,以left join左边的表中的数据为基准,即左边的表中有的必须要全部显示出来,如下图: 这里第一个查询中,company表在左边,因此就以company为基准,所以显示的结果中除了depart_id相同的6条数据外,还把company中存在的另外一条也显示出来. 而第二个查询中,emp在左边,就以emp为基准,因此显示的结果中除了depart_id相同的6条…
1.使用union和union all合并两个查询结果:select 字段名 from tablename1 union select 字段名 from tablename2: 注意这个操作必须保证两张表字段相同,字段数据类型也相同.另外,使用union的时候会去除重复(相同)的记录,而union all则不会. 注:下边的几个连接查询涉及到笛卡尔积的概念,即如果存在两张表,第一张记录数为n条,另一张表的记录数为m条,那么笛卡尔积得出的记录数就是n*m条:如果第一张表的字段数为a个,另一张的字段…
1.mysql简单的查询:select 字段1,字段2...  from tablename; 如果字段那里写一个*,代表查询所有的字段,等同于指定出所有的字段名,因此如果要查询所有字段的数据,一般都是用*. 2.去重查询:select distinct 字段1,字段2... form tablename: 可以结合上一张图的结果来对比. 3.直接在查询时做数学四则运算,加减乘除余: 4.查询时给查询结果字段重命名:select 字段1 as 名称1,字段2 as 名称2 ... from ta…
1.全局安装: cnpm install -g sails 2.创建项目: sails new sails_shop ,选2 或者: sails new sails_shop --fast ,选2 cd sails_cqwu cnpm install 注:安装依赖包 3.启动项目: sails lift 4.使用自动路由:修改config->blueprints.js->actions: true 5.创建路由控制: sails generate controller users list d…
一.常用设置 1.界面设置(快捷键Ctrl+K):可以对PS界面的颜色.导出格式.性能等等进行设置(这里暂存盘建议设置D盘或F盘,默认C盘). 2.常用面板整理(菜单栏->窗口) 二.常用快捷键 新建文档:Ctrl+N 存储:Ctrl+S 存储为:Shift+Ctrl+S 画布的放大和缩小:Ctrl++\Ctrl+- 新建图层:Shift+Ctrl+N 取消选择:Ctrl+D 放大.缩小(Alt+Shift):从中心放大缩小 填充:Alt+Delete…
1.获得集群中的节点列表: curl 'localhost:9200/_cat/nodes?v' 2.获得所有索引: curl 'localhost:9200/_cat/indices?v' 3.创建指定文档,并索引到指定索引和类型 # 索引 类型1 curl -XPUT 'localhost:9200/customer/external/1?pretty' -d ' 2 { 3 "name": "John Doe" 4 }' 4.取出指定文档 curl -XGET…
注:sql的移植性比较强,函数的移植性不强,一般为数据库软件特有,例如mysql有mysql的函数,oracle有oracle的函数. 1.concat连接字符串: 从上图中可以看出,直接使用select concat就可以连接任意两个以上的字符串,同时也可以用来连接查询结果,一般情况中也是会用来连接查询结果.需要注意的是,如果连接的内容有null存在的话,那么结果就只会是null. 2.concat_ws使用分隔符连接字符串: 在上边的语法中,第一个字符传代表指定的连接格式,其他的代表需要连接…
mysql中虽然有连接查询实现多表连接查询,但是连接查询的性能很差,因此便出现了子查询. 1.理论上,子查询可以出现在查询语句的任何位置,但实际应用中多出现在from后和where后.出现在from后的子查询结果通常是多行多列的,充当临时表:而出现在where后的子查询结果通常是单行单列,充当条件: 2.where后作为条件的子查询多与"="."!=".">"."<"等比较运算符一起使用.结果虽然通常是单行单列,但…
注:文中所有的...代表多个. 1.使用count统计条数:select count(字段名...) from tablename; 2.使用avg计算字段的平均值:select avg(字段名) from tablename: 这里都可以适当的拓展,比如加条件,重命名等等. 3.使用sum求和:select sum(字段名) from tablename: 4.使用max和min求最大值.最小值: 5.注意:使用这些函数时,如果数据库中没有数据,count返回0,其他的返回null: 6.使用…
1.使用order by对查询的结果进行排序,asc升序,desc降序: 也可以在order by后指定多个字段名和排序方式进行多级排序: 2.使用limit限制查询结果的数量: 上图中的0,代表查询的开始位置,也可以理解为跳过的数量:上图中的2代表需要查询出的数量.这个表中有3条数据,因为限制了条数为2,因此实际结果只是两条.另外,这里的初始位置是0,实际上可以不写,默认就是0: 这里还有一种情况,就是指定查询结果的数量可能大于表中的实际数量,这个时候返回结果会返回表中所有符合条件的数据,例如…
1.单条件查询:select 字段名 from tablename where 条件: 2.简单多条件查询,使用&&或者between and等: 3.is null和is not null查询,这里要注意null不是空字符串不是0: 4.in和not in查询,相当于是用or把in后边的集合元素连起来.注意如果in后边带的集合中存在null,那么不会影响结果,但not in后边集合中有null,就不会查处任何结果,not in也查不出null: 5.like模糊查询(不仅适用字符串):…
1.插入单条数据:insert into tablename(字段名1,字段名2,...) values(值1,值2,...); 从图中可以看出,插入时不需要每个字段都有值(在没有相关的约束前提下),但是需要注意的是字段的数量和后边的值的数量必须一致,还要和自定的字段的顺序一致,类型也要一致,否则会报错.另外,如果没有指定任何字段的情况下,默认是选择了所有字段,则必须每个字段都有对应的值,并且需要和表中的字段顺序一致,否则会报错,如图: 2.插入多条数据:insert into tablenam…
1.修改表名:alert table oldtablename rename newtablename; 或者alert table oldtablename rename to newtablename; [图形界面用多了,alter老是敲成alert] 2.在表的最后添加一个字段列:alter table tablename add 属性名 属性类型; 3.在表的第一列添加字段:alter table tablename add 属性名 属性类型 first; 4.在表指定字段后增加字段:a…
1.创建数据库:create Database databaseName;例如需要创建mysqlTest数据库,create Database mysqlTest; 由此还可以看出,这里的名称是不分大小写的,据我所知可以通过设置设置为全大些或者全小写. 2.查看系统中已经存在的数据库:show databases; 3.选择数据库:use databaseName;(本文中所有databaseName均是一个代称,表示数据库名称,tableName也是代称,表示表名): 4.删除数据库:drop…
目录 前言 基础操作 hdfs操作 总结 一.前言        作为一个全栈工程师,必须要熟练掌握各种语言...HelloWorld.最近就被"逼着"走向了python开发之路,大体实现的功能是写一个通用类库将服务器本地存储的文件进行简单清洗后转储到HDFS中,所以基本上python的相关知识都涉及到了,这里对一些基础操作以及hdfs操作做一总结,以备查阅. 二.基础操作 2.1 字符串操作        字符串操作应该是所有语言的基础.python基本上也提供了其他语言常用的一些字…
基础操作     一:MySQL基础操作         1:MySQL表复制             复制表结构 + 复制表数据             create table t3 like t1;  --创建一个和t1一样的表,用like(表结构也一样)             insert into t3 select * from t1;  --t1的数据全部拿过来,注意是表结构一致才select* ,否则选择相应的的字段列插入                           c…
目录 一.什么是Linux 二.常用基础指令 2.1.vi编辑 2.2.Linux文件类型 2.3.常用指令:增.删.改.查.其他 三.Linux的目录和权限 3.1.目录 3.2.权限 3.3.修改权限 一.什么是Linux Linux是操作系统:Windos.Mac.Linux.Unix\ Linux的划分 Ubuntu //教育 Centos //服务器端 Deepin Suse 红旗 使用Linux的原因 稳定.安全(开发人员.权限控制.开源).免费.省资源 虚拟机 Window:VMw…
0x00 基础操作介绍 在本文中将介绍InfluxDB常用的基础操作,帮助读者建立对InfluxDB的感性认识,快速的动手玩起来,持续查询(Continuous Queies).Group by.Series.行协议(Line Protocol).InfluxQL等高级特性和细节,将会在后续文章中逐步介绍.    InfluxDB支持类SQL的操作接口,尽管因为时序数据的特点,InfluxDB是非CRUD的,不支持更新数据.删除单条数据操作,但考虑到大多数的读者对应CRUD的关系型数据库比较熟悉…
这篇博客主要是Oracle常用基础语法, 另外,存储过程和存储函数很重要,这个后期看视频学习,还有DB优化,另外,还有plsql develop和navicat的使用,重点是数据的导入导出: ----------------------------------------------------------------------------------------------------------------------------------------------------------…
常见操作命令:1.连接Mysql (客户端工具NaviCat.phpMyAdmin.MySQL-Front)格式: mysql -h 主机地址 -u用户名 -p用户密码(1)连接到本机上的MYSQL. 首先进入Mysql安装程序的bin目录下, 命令./mysql -u root -p,回车后提示你输密码. 注意用户名前可以有空格也可以没有空格,但是密码前必须没有空格,否则让你重新输入密码. (2)连接到远程主机上的MySQL.假设远程主机的IP为:110.110.110.110,用户名为roo…
SPSS超详细操作:分层回归(hierarchical multiple regression) 1.问题与数据 最大携氧能力(maximal aerobic capacity, VO2max)是评价人体健康的关键指标,但因测量方法复杂,不易实现.某研究者拟通过一些方便.易得的指标建立受试者最大携氧能力的预测模型. 目前,该研究者已知受试者的年龄和性别与最大携氧能力有关,但这种关联强度并不足以进行回归模型的预测.因此,该研究者拟逐个增加体重(第3个变量)和心率(第4个变量)两个变量,并判断是否可…
MYSQL基础操作 [TOC] 1.基本定义 1.1.关系型数据库系统 关系型数据库系统是建立在关系模型上的数据库系统 什么是关系模型呢? 1.数据结构可以规定,同类数据结构一致,就是一个二维的表格 2.2.数据之间的关系可以设置,实体之间的联系 1.2.关系型数据库 要把一个数据信息保存到数据库里面,是先有数据库,再有表,然后再有信息 数据库:数据的仓库,保存有多个表 表:数据保存在表内,一个表内,应有相同的数据格式 行&列:行用于记录,列用于规定数据的格式 记录:当列规定好保存的数据格式的时…