#.duplicated / .replace import numpy as np import pandas as pd s = pd.Series([1,1,1,1,1,2,3,3,3,4,4,5,6,6]) print(s) print(s.duplicated())#True表示重复 得到布尔型 print(s[s.duplicated() == False])# #通过布尔类型的判断来得到不重复的值 s_re = s.drop_duplicates()#直接去除重复值 #inplac…
# 连接和修补concat.combine_first 沿轴的堆叠连接 # 连接concatimport pandas as pdimport numpy as np s1 = pd.Series([1,2,3]) s2 = pd.Series([2,3,4]) s3 = pd.Series([1,2,3],index=['a','c','h']) s4 = pd.Series([2,3,4],index=['b','e','d']) print(s1) print(s2) print(pd.c…
--------– 2018.03.27 更新--------- 便携版已更新,点此获取便携版 已知BUG:中文目录无法正常调试 用于cpptools 0.15.0插件的配置文件更新 新的launch.json // Available variables which can be used inside of strings. // ${workspaceRoot}: the root folder of the team // ${file}: the current opened file…
#2.16 合并 merge-join import numpy as np import pandas as pd df1 = pd.DataFrame({'key1':['k0','k1','k2','k3'], 'A':['A0','A1','A2','A3'], 'B':['B0','B1','B2','B3']}) df2 = pd.DataFrame({'key1':['k0','k1','k2','k3'], 'C':['C0','C1','C2','C3'], 'D':['D0'…
Cron 用于配置定时任务. -- 环境为 Ubuntu16-04 -- 先说说怎么配置一个简单的定时任务.直观的可以看到效果. 之前在网上查找资料,对Shell编程不熟悉的实在是很头疼,走了不少弯路,但是这个又是是比较重要的命令. 先明白Cron的结构,Cron是一个[守护程序]用于在指定的时间内执行行程类的任务,每一个用户都有一个Crontab文件,执行计划.相同的,系统也有一个 Crontab. -- 创建一个定时任务 crontab -e 当你输入指令时,会出现下面的界面,我们直接向下看…
博主欢迎转载,但请给出本文链接,我尊重你,你尊重我,谢谢~http://www.cnblogs.com/chenxiwenruo/p/8660814.html特别不喜欢那些随便转载别人的原创文章又不给出链接的所以不准偷偷复制博主的博客噢~~ 1. 自定义排序 第一题是第一行给出n(1<=n<=100),表示下面有n行,每行A(0<=A<24)和B(0<=B<60),表示定的闹钟为AhBmin. 接下来给定X,表示小明从起床到教室需要X分钟,最后一行给出A(0<=A…
数据分析03 /基于pandas的数据清洗.级联.合并 目录 数据分析03 /基于pandas的数据清洗.级联.合并 1. 处理丢失的数据 2. pandas处理空值操作 3. 数据清洗案例 4. 处理重复的数据 5. 处理异常的数据 6. 级联 7. 合并操作 1. 处理丢失的数据 两种丢失的数据: 种类 None:None是对象类型,type(None):NoneType np.nan(NaN):是浮点型,type(np.nan):float 两种丢失数据的区别: object类型比floa…
20172319 2018.03.27-04.05 <Java程序设计>第4周学习总结 教材学习内容总结 第四章 编写类 类与对象的回顾:对象是有状态的,状态由对象的属性值确定.属性由类中的声明的变量所定义.对象的操作可能改变该对象的状态.对象的操作由 类中声明的方法定义. 类的分析:类的成员(类的数据和方法):构造方法(给类赋初值):实例数据(变量声明的位置定义其作用域):UML类图(类及其对象关系可视化描述). 封装:(1) 可见性修饰符:public(公有):private(私有,只能从…
str.replace()可以一次处理一整个Series.str.replace()的正式形式为 Series.str.replace(pat, repl) ,其中pat为想要寻找的模式,一般为正则表达式,repl为要替换进去的字符串或函数. 下面是几个简单的例子,X代表一个Series,repl皆为字符串: X.str.replace(r"iphone\s+7", "iphone7") #为了将iphone7视为一个词,把iphone 7转换为iphone7,去除…
date 命令主要用于查看和修改时间和时区 -- 这里主要学习基本的查看和设置时间和时区的方法. 直接显示日期 date '+%D' 效果 vagrant@hong:~$ date '+%D' 03/31/18 -- 直接显示时间[24小时制] date '+%X' 效果 vagrant@hong:~$ date '+%X' 12:31:42 PM -- 如何设置时间 首先应该看你的时区在哪里,是不是选用正确的时区 我这里就是选用了错误时区,导致了时间的错误 vagrant@hong:~$ da…
import numpy as np import pandas as pd 1 #字符串常用方法 - strip s = pd.Series([' jack ','jill',' jease ','feank']) df = pd.DataFrame(np.random.randn(3,2),columns=[' Column A',' Column B'],index=range(3)) print(s) print(df.columns) print('----') print(s.str…
链接:http://211.140.156.254:2333/contest/64 我去掉了一百多分! 这次的题目怎么说呢,特别水,但是就是出现了一些很逗的错误导致炸裂. 最好笑的是SB的不只我一个: hl666:T1没写负数读优,100炸成40 yu‘ao:T1写了判负数的但最后忘记乘上去了,100炸35 cjj:T2输出没写lld写d爆0了 zi’tai:作死写了clock导致爆0 ye‘ke’he:把T2的CODE交到T1去了,真的逗比,T1爆0 然后全部掉了一百多分 T1 水题不解释.…
'''Matplotlib -> 一个python版的matlab绘图接口,以2D为主,支持python,numpy,pandas基本数据结构,高效图标库''' import numpy as np import pandas as pd import matplotlib.pyplot as plt #图标窗口 -> plt.show() plt.plot(np.random.rand(10)) plt.show() #直接生成图表…
#数据读取# read_table,read_csv,read_excel #读取普通分隔数据:read_table #可以读取txt,csv import os import pandas as pd os.chdir(r'C:\Users\BRIGHT-SH-002\Desktop\python') data1 = pd.read_table('data1.csv',delimiter=',',header=0) print(data1) data1 = pd.read_table('dat…
#透视表 pivot table #pd.pivot_table(data,values=None,index=None,columns=None, import numpy as np import pandas as pd aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='ALL') date = ['2017-5-1','2017-5-2','2017-5-3']*3 rng = pd.to_dat…
#一般化的groupby方法:apply df = pd.DataFrame({'data1':np.random.rand(5), 'data2':np.random.rand(5), 'key1':list('aabba'), 'key2':['one','two','one','two','one']}) print(df) #print(df.groupby('key1').apply(lambda x:x.describe())) #apply直接运算其中的函数 #这里是匿名函数,直接…
groupby 分组统计 1.根据某些条件将数据分组 2.对每个组独立应用函数 3.将结果合并到一个数据结构中 Dataframe在行或列上分组,将一个函数应用到各个分组并产生一个新值,然后函数执行结果被合并到最终的结果对象中 #分组 import numpy as npimport pandas as pddf = pd.DataFrame({'A':['foo','bar','foo','bar','foo','bar','foo','foo'], 'B':['one','one','two…
手动维护一个数组模拟即可,233-- 可以使用algorithm中的lower_bound(相当于二分) 代码如下: #include<cstdio> #include<algorithm> using namespace std; int a[1000000],tot,n,x; int main(){ scanf("%d",&n); for(int i=1;i<=n;i++) { scanf("%d",&x); if(…
public class DistributedClient { // 超时时间 private static final int SESSION_TIMEOUT = 5000; // zookeeper server列表 private String hosts = "localhost:4180,localhost:4181,localhost:4182"; private String groupNode = "locks"; private String s…
对于这个问题自己是比较清楚的,在分支比较多时,switch-case的效率肯定比if-else的要高许多,其原理类似于我们在优化某些程序时使用查表来代替算法计算一样. 如果想进一步深究的话,可以查看GCC编译之后的汇编代码. 这里有两篇Blog可以参考一下,致谢两位作者. 1. switch与ifelse的效率问题 https://blog.csdn.net/kehui123/article/details/5298337 2. if else和switch的效率 https://blog.cs…
Flask flask-login flask-sqlalchemy flask-mail psutil lvm2py oss2 python-ldap pyudev pyOpenSSL urllib2 pycurl…
一.容器的概念 在Java当中,如果有一个类专门用来存放其它类的对象,这个类就叫做容器,或者就叫做集合,集合就是将若干性质相同或相近的类对象组合在一起而形成的一个整体 二.容器与数组的关系 之所以需要容器: 1.数组的长度难以扩充 2.数组中数据的类型必须相同 容器与数组的区别与联系: 1.容器不是数组,不能通过下标的方式访问容器中的元素 2.数组的所有功能通过Arraylist容器都可以实现,只是实现的方式不同 3.如果非要将容器当做一个数组来使用,通过toArraylist方法返回的就是一个…
#直接用while循环去除.ad l=['xuyutao.ad','wangjun.ad','liuchao.ad','liuyan1.ad'] n=0 L=[] while n < 4: A=l[n][:-3] L.insert(n,A) n=n+1 print(L) #while+定义函数去除.ad def xad(x): if x[-3:] in '.ad': a=x[:-3] return a else: return L=['xuyutao.ad','liuchao6.ad','liu…
每日一个Linux命令 2018-03-08 Linux 命令 chattr/lsattr chattr [-参数] [+/-属性] [文件或者目录] 经过今天没有对铃,粥熬糊了,我就知道...... 好记性不如烂笔头啊,主要还不是什么好记性...... chattr命令,用于改变文件属性. 我之前会问,对于一个文件,都有组,所有者,权限来控制文件的读写和操作,为什么还需要这个命令? 假如:对于一个文件,你 rm 了一下 , 这个文件就没了,也就找不回来了. 这个命令也就是为了解决像上述这种尴尬…
每日一个Linux命令 2018-03-07 Linux 命令 cat cat [-参数] fileName 在之前的Linux使用中 cat 命令一直作为文本输出指令来使用,很少可以深入学习的该命令,碰到特别长的文本就不用 cat 打开,直接打开Vim, 仔细学习之后,发现它也真的很方便. 功能: 1:输出整个文本内容. cat fileName 优点:快速查看整体内容,而不用做其他操作. 缺点:文本过大,导致你根本不能找到你想找到的东西. 辅助参数: -n :由 1 开始对所有输出的行数编号…
传送门 数位dpdpdp经典题. 题面已经暗示了我们按照二进制位来数位dpdpdp. 直接dpdpdp多少个数有111个111,222个111,333个111-, 然后快速幂算就行了. 于是我们枚举前几位跟nnn相同,后面比nnn小的方案数. 这个显然是可以用组合数算的. 注意nnn自己的也要算进贡献. 代码: #include<bits/stdc++.h> using namespace std; typedef long long ll; const int mod=10000007; l…
传送门 唉蒟蒻又退化了,这道sb题居然做了20min,最后发现是updcovupdcovupdcov写成了updaddupdaddupdadd我还能说什么233233233 就是让你转边权为点权之后,支持树上路径覆盖,单点覆盖,路径加,求路径最大. 直接乱码一发居然AAA了? 贴代码了(稍微有点长): #include<bits/stdc++.h> #define lc (p<<1) #define rc (p<<1|1) #define mid (T[p].l+T[p…
传送门 状压dp入门题. 按照题意建一个图. 要求的就是合法的链的总数. 直接f[i][j]f[i][j]f[i][j]表示当前状态为jjj,下一位要跟iii连起来的方案数. 然后从没被选并且跟iii连通的点转移就行了. 代码: #include<bits/stdc++.h> using namespace std; typedef long long ll; const int N=20; bool tran[N][N]; int n,K,up,s[N]; ll f[N][1<<…
传送门 g[i][j][k][l]g[i][j][k][l]g[i][j][k][l]表示将区间l,rl,rl,r变成最小值等于kkk,最大值等于lll时的花费的最优值. f[i][j]f[i][j]f[i][j]表示取掉区间l,rl,rl,r的最优值. 考虑ggg数组的转移. g[i][j+1][min(k,w[j+1])][max(l,w[i+1])]=min(g[i][j+1][min(k,w[j+1])][max(l,w[i+1])],g[i][j][k][l])g[i][j+1][mi…
传送门 显然的贪心题啊...考试没调出来10pts滚了妙的一啊 直接分别用堆贪心出洗完第iii件衣服需要的最少时间和晾完第iii件衣服需要的最少时间. 我们设第一个算出来的数组是aaa,第二个是bbb,然后令ccc数组是bbb的一个任意排列. 于是要求minminmin{maxmaxmax{a1+c1,a2+c2,...al+cla_1+c_1,a_2+c_2,...a_l+c_la1​+c1​,a2​+c2​,...al​+cl​}} 里面东西跟排序不等式很像啊 ,于是aaa正序bbb倒序加起…