需求: 快速的获取一个列表中最大/最小的n个元素. 方法: 最简便的方法是使用heapq模组的两个方法nlargest()和nsmallest(),例如: In [1]: import heapqIn [2]: nums = [1, 0, -23, 45, 34, -11, 0, 2, 99, 103, -78]In [3]: print(heapq.nlargest(3, nums))[103, 99, 45]In [4]: print(heapq.nsmallest(3, nums))[-7…
需求: 如何从一个序列中快速获取出现次数最多的元素. 方法: 利用collections.Counter类可以解决这个问题,特别是他的most_common()方法更是处理此问题的最快途径.比如,现在有一个单词的序列,你想快速获取哪个单词出现频率最高,就可以这么做: In [22]: words = ['look', 'into', 'my', 'eyes', 'look', 'into', ...: 'my', 'eyes', 'the', 'eye', 'the', 'eyes', 'not…
需求: 前面的文章讲的是使用变量的个数需要和迭代器数据变量的元素个数相同的方法,但更多的时候确实不想根据元素个数n来定义相应多的变量,而是希望用较少的变量( def drop_first_last(grades): def avg(my_list): return sum(my_list) / len(my_list) first, *middle, last = sorted(grades) return avg(middle)12345当然,“星表达式”可以在任何位置,对应的解包元素存入之后…
需求: 很多时候手上已经有了一个具有n个元素的列表或者元组,你打算把这些元素单独取出来(解包)放入n个变量组成的集合(这里的集合和Python自己的set不同)中. 方法: 显然,最好的办法就是直接用赋值语句(=)来做这件事,唯一需要注意的就是,新变量的个数一定要和原列表.元组里面的元素个数相同: In [1]: p = (4, 6, 7)In [2]: x, y, z = pIn [3]: xOut[3]: 4In [4]: yOut[4]: 6In [5]: zOut[5]: 7 In [7…
需求: 当前有个字典实例,你想以某个字段比如”日期”对整个字典里面的元素进行分组. 方法: itertools.groupby()函数是专门用来干这个活的.请看下面这个例子,这里有一个列表构成的字典,你想按照日期来对列表进行分组,可以这么做: In [42]: from operator import itemgetter In [43]: from itertools import groupby In [44]: rows = [ ...: {'address' : '5412 N CLAR…
阅读OReilly.Web.Scraping.with.Python.2015.6笔记---找出网页中所有的href 1.查找以<a>开头的所有文本,然后判断href是否在<a>里面,如果<a>里面有href,就像<a href=" " >,然后提取href的值. from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("ht…
//重复元素:3,4,5 //不重复元素:1,8,9 , , , , , , , , , , }; //不重复元素 var unique = arr.GroupBy(i => i) .Where(g => g.Count() ==) .Select(g => g.ElementAt()); foreach (var i in unique) Console.WriteLine(i); //分割线 Console.WriteLine("==="); //重复元素 var…
从汤姆大叔的博客里看到了6个基础题目:本篇是第1题 - 找出数字数组中最大的元素(使用Match.max函数) 从要求上来看,不能将数组sort.不能遍历.只能使用Math.max,所以只能从javascript的特征和本质方面着手. 分析:查找列表是一个数组,那么意味着我们要传入一个数组参数给Math.max,但是Math.max只能传入枚举参数,如下: Math.max(n1, [n2, [n3, [...]]]) 有什么方法可以传入一个数组并将这个数组中的每个元素一一传递给Math.max…
目的:找出一个整形数组中的元素的最大值   以下,我们用类和对象的方法来做.   #include<iostream> using namespace std; class Array_max{ private://声明在类的外部不可訪问的隐私成员 int array[10]; int max; public://声明在类的外部能够訪问的开放的成员函数 void set_value(){ int i; cout<<"请输入10个整数"<<endl;…
http://bbs.chinaunix.net/thread-1680208-1-1.html 如何找出 python list 中有重复的项 http://www.cnblogs.com/feisky/archive/2012/12/06/2805251.html 比较容易记忆的是用内置的setl1 = ['b','c','d','b','c','a','a']l2 = list(set(l1))print l2 还有一种据说速度更快的,没测试过两者的速度差别l1 = ['b','c','d…
一.一个列表中可能含有重复元素,使用set()可以实现列表的去重处理,但是无法知道哪些元素是重复的,下面的函数用于找出哪些元素重复了,以及重复的次数. 代码: from collections import Counter #引入Counter a = [1, 2, 3, 3, 4, 4] b = dict(Counter(a)) print(b) print ([key for key,value in b.items() if value > 1]) #只展示重复元素 print ({key…
生物信息:找出基因,生物学家使用字母A.C.T和G构成的字符串建模一个基因组.一个基因是基因组的子串,它从三元组ATG后开始在三元组TAG.TAA或TGA之前结束.此外,基因字符串的长度是3的倍数,而且基因不包含三元组ATG.TAG.TAA和TGA.编写程序提示用户输入一个基因组,然后显示基因组里的所有基因.如果在输入序列中没有找到基因,那么程序显示“no gene is found” s=input('Please input the Gene String:\r\n') endsplit=[…
leecode题目描述如下: 给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次.找出那个只出现了一次的元素. 思路: 最开始想到的是使用排序,排序之后就很容易找到非重复元素了. 后面看到网上有更巧妙的解决办法,即使用异或来找出非重复元素,因为重复的元素经异或之后就互相抵消为0了,最后数组各个元素经过异或计算之后的结果就是那个唯一的非重复元素. 代码: class Solution(object): def singleNumber(self, nums): ""…
怎么从一个集合中获取最大或最小的N个元素列表? heapq模块有两个函数:nlargest() 和 nsmallest() 可以完美解决这个问题. In [39]: import heapq In [40]: nums = [2, 5, 3, 4] In [41]: heapq.nlargest(2,nums) Out[41]: [5, 4] In [42]: heapq.nsmallest(2,nums) Out[42]: [2, 3] 两个函数都能接受一个关键字参数,用于更复杂的数据结构中:…
本题目摘自<Python程序员面试算法宝典>,我会每天做一道这本书上的题目,并分享出来,统一放在我博客内,收集在一个分类中. [百度面试题] 难度系数:⭐⭐⭐ 考察频率:⭐⭐⭐⭐ 题目描述:数字1 ~ 1000放在含有1001个元素的数组中,其中只有唯一的一个元素重复,其他数字均只出现一次.设计一个算法,将重复元素找出来,要求每个数组元素只能访问一次. 进阶:在上面题目描述中,如果不使用辅助空间,能否设计一个算法实现? 方法一:空间换时间 首先分析题目所要达到的目标以及其中的限定条件.从题目中…
代码: import geocoder g = geocoder.ip('me') print(g.latlng) # 经纬度 print(g.city) # 所在城市 输出: C:\Users\horn1\Desktop\python\49-geo>python geo.py [38.9122, 121.602] Dalian 参考资料:https://blog.csdn.net/hailangnet/article/details/53287585 很可惜其它的API都报: Status c…
1.最基本的抓站 import urllib2 content = urllib2.urlopen('http://XXXX').read() 2.使用代理服务器 这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等. 1 2 3 4 5 import urllib2 proxy_support = urllib2.ProxyHandler({'http':'http://XX.XX.XX.XX:XXXX'}) opener = urllib2.build_opener(p…
"作为一名爬虫工程师,你最需要关注的,是数据的来源" 原文:https://www.jb51.net/article/90114.htm 霍夫曼编码压缩算法 1.最基本的抓站   import urllib2   content = urllib2.urlopen('http://XXXX').read() 2.使用代理服务器 这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等. 1 2 3 4 5 import urllib2 proxy_support = …
int [][]a={{3,2,6},{6,8,2,10},{5},{12,3,23}}; //先对二维数组进行遍历:然后把二维数组合成一个数组 int[] k=new int[11]; int q=0; for(int i=0;i<a.length;i++) { for(int j=0;j<a[i].length;j++) { for(int m=q;m<11;m++) { k[m]=a[i][j]; q++; break;//当i=0,j=0时,m=0时,得到k[0]=a[0][0]…
// ConsoleApplication2.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include "stdafx.h" #include<iostream> #include<vector> #include<algorithm> #include<numeric> #include<list> #include<iterator> #inc…
#如'abbcc','abbdd' 找到abba='abbcc'b='abbdd'from difflib import *s=SequenceMatcher(None,a,b)m=s.find_longest_match(0,len(a),0,len(b))print a[m.a:m.a+m.size]…
package com.bao; public class Erweim { public static void main(String[] args) { int[][]a={{3,2,6},{6,8,2,10},{5},{12,3,23}}; int max=a[0][0],min=a[0][0]; for(int i=0;i<a.length;i++) { for(int j=0;j<a[i].length;j++) { if(max<a[i][j]) { max=a[i][j]…
# 方法一 利用max min 函数. 注意这里max min 分别都是功能函数 def main_m(*args): i = max(args) j = min(args) print("最大值是%s" % i) print("最小值是%s" % j) list1 = [23,56,8,99]main_m(*list1) # 方法二 给max min 变量赋初值(这里max 和min 都是变量) 然后遍历容器将所需的最大和最小值分别赋给两个变量 def main_…
1.生成随机字典 # 从abcdefg 中随机取出 3-6个,作为key, 1-4 的随机数作为 value s1 = {x : randint(1, 4) for x in sample('abcdefg', randint(3, 6))} 方法1 用集合方法 s1 = {'c': 3, 'f': 3, 'g': 3, 'd': 4, 'b': 2} s2 = {'b': 3, 'f': 2, 'c': 2} s3 = {'f': 3, 'b': 1, 'c': 4, 'd': 3, 'g':…
import java.util.Arrays; /** * Created by ccc on 16-4-27. */ public class Test { public static void main(String arg[]) { , , }; ,,,, , }; Arrays.sort(a); Arrays.sort(b); int len = a.length; ; i < len; i++) { ) { System.out.println(b[i]); } } } } Arra…
#include <stdio.h> #include <stdint.h> #include <stdlib.h> #include <time.h> #include <malloc.h> #include <memory.h> #define MAX_SIZE (1000 * 10000 + 1) #define PARENT(i) (i/2) #define RIGHT(i) (i*2 + 1) #define LEFT(i)…
A.B 中相同元素:print(set(A)&set(B)) A.B 中不同元素:print(set(A)^set(B))…
•已知数组中的n个正数,找出其中最小的k个数. •例如(4.5.1.6.2.7.3.8),k=4,则最小的4个数是1,2,3,4 •要求: –高效: –分析时空效率 •扩展:能否设计出适合在海量数据中实现上述运算?       方法一: //利用最大根堆实现最小k个节点 //最大根堆特点:每个节点都比他左右孩子要大 //调整最大堆的时间复杂度为O(lnK),因此该算法(问题)时间复杂度为O(nlnK). //思路:通过数组建堆 //规律:第i个节点的左孩子为2i+1,右孩子为2i+2 #incl…
题目 题目:输入n个整数,找出其中最小的K个数.例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,. 解析 思路1 这一题应用堆排序算法复杂度只有O(nlog k),堆是完全二叉树的一种,最大堆就是最上面的数是最大的该方法基于二叉树或者堆来实现,首先把数组前k个数字构建一个最大堆,然后从第k+1个数字开始遍历数组,如果遍历到的元素小于堆顶的数字,那么久将换两个数字,重新构造堆,继续遍历,最后剩下的堆就是最小的k个数,时间复杂度O(nlog k). 思路2 排序…