ali数据分析面试题】的更多相关文章

表A结构如下 Member_ID   --用户的Id,字符型 Log_time  --用户访问页面时间,日期型(只有一天的数据) URL ---访问的页面地址,字符型 要求:提取每个用户访问的第一个URL.(按时间最早),形成一个新表(新表名为B,表结构和表A一致) SQL语言实行如下 select * from ali tb where Member_ID not in (select Member_ID from ali where Log_time<tb.Log_time ); selec…
接到的电话面试,人比较随和,当时IOS有一段时间没怎么碰了,因为近期一直在用C++,QT做IM.很多回答我都扯到了C++上,所以可能没戏- -! 回想一下,大概有如下几个问题:(都是很常见的问题) 1.谈谈Objective-c中的内存管理 这个问题比较广泛,自己分别对 OC中指针,对象的创建与释放,autoRelease/autoReleasePool,arc,编译中对arc文件的编译区分,以及局部变量尽量不要new等方面都说了一点. 2."什么是谓词?" 我表示没有听过.后台查了一…
  昨天晚上,笔者有幸参加了一场面试,有一个环节就是现场编程!题目如下:   示例数据如下,求每名学生(ID)对应的成绩(score)最高的那门科目(class)与ID,用Python实现: 这个题目看上去很简单,其实,并不简单.即要求输出形式如下:   当然,我们一开始能先到的是利用Pandas中的groupby,按ID做groupby,按score取最大值,可是之后的过程就难办了,是将得到的结果与原表做join,还是再想其他办法?   怎么办?答案就是Pandas中groupby的官方文档说…
我们整理了Python面试的主要问题清单,分为7个部分: 基本面试问题 OOPS面试问题 基本的Python程序 Python库面试问题 数据分析面试题 选择题(MCQ) 基本的Python面试问题 Q1.Python中的列表和元组有什么区别? LIST TUPLES 列表是可变的,即可以编辑. 元组是 不可变的(元组是无法编辑的列表). 列表比元组慢. 元组比列表快. 语法:list_1 = [10,'全栈程序员社区',20] 语法:tup_1 =(10,'全栈程序员社区',20) Q2.Py…
[TOP] 为什么百度校招数据挖掘工程师的笔试题目是跟数据挖掘关系不大? - 研究生生活交流 - 王道论坛,专注于计算机考研的点点滴滴! http://www.cskaoyan.com/thread-244995-1-3.html 笔试时间:2014-9-20 笔试职位:机器学习/数据挖掘工程师 笔试城市:天津.深圳.南京等 一. 简答题 1. new 和 malloc 的区别. 2. hash冲突是指什么?怎么解决?给两种方法,写出过程和优缺点. 3. 命中的概率是 0.25,若要至少命中一次…
阿里面试的一点感受 <!-- [废话开始] 百度实习三个月,明天就要离职了,感觉还挺开心的,同事们都很照顾我,Boss也比较欣赏我,我很满足了.掐指一算,这大四其实也没几个月了,同事们都在感叹大学的那些事儿,也告诫我要好好享受大学最后的时光,我会好好把握! 离开之前呢,还挺幸运的,这几天阿里在各地招人,我也去试了一把,由于之前拿过阿里的实习offer,所以笔试就给免了,呵呵,也省得我再去做那些枯燥的笔试题.不过期间也有不少的坎坷,就不细说了= = 下午四点去北京大望路附近某个旮旯里头找aliba…
1.海量日志数据,提取出某日访问百度次数最多的那个IP. 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中.注意到IP是32位的,最多有个2^32个IP.同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率.然后再在这1000个最大的IP中,找出那个频率最大的IP,即为所求. 或者如下阐述(雪域之鹰): 算法思想:分而治之+Hash 1.…
SQL笔试题 1.请简单写出left join和join的用法区别(可举例说明): 2.求出订单表(order表)中每个客户(custid)的最近一次购买日期(要求:按custid降序排列,transdate显示年月日格式): 3.用一条SQL语句查出订单表(order表)购买的每类产品付款都大于60元的客户姓名: 4.请问‘SELECT 1/3’运行后能否得到结果0.33,如不能请给出正确的代码: 5.根据如下订单表,请使用sql语法,按购买时间统计出每天的新客人数和老客人数: 名词定义如下:…
供Linux开发中的同学们,Shell这可以说是一个基本功. 对于同学们的操作和维护.Shell也可以说是一种必要的技能,Shell.对于Release Team,软件配置管理的同学来说.Shell也起到了非常关键的数据.尤其是分布式系统发展的如火如荼,非常多开源项目都开展的如火如荼(好像不是分布式的系统都不好意思拿出来说事).分布式系统的配置.管理,Shell也起到了非常关键的数据,尽管仅仅是简单的文件拷贝,可是谁让Shell天生是做这些的呢? 当然了,以上不是本文的主题.本文的主题是Shel…
在LoadRunner中为什么要设置思考时间和pacing 答: 录制时记录的是客户端和服务端的交互,如果要精确模拟 用户的行为,那么客户操作客户端时花费了很多时间要怎么模拟呢?录入 填写提交的内容,从列表中下拉搜索选择特定的值等,这时LOADRUNNER 不会记录用户 的客户端操作,而是记录了用户这段时间,成为思考时间(Think-time),因为用户的这些客户端操作不会影响服务端,只是让服务器端在这段时间内没有请求而已.,所以加入思考时间就能模拟出熟练的或者生疏的用户操作,接近实际对于服务端…