数据挖掘python,java
互联网公司zamplus诚聘以下职位:
(1)数据挖掘工程师 (Location:上海、北京)
岗位职责:
1. 研究基于sponsored search, content match和behavior targeting的广告匹配技术和数据挖掘任务,提升广告相关性。
2. 根据用户的行为结合机器学习的模型推送适合展现给用户的相关广告。
3. 研究合适的竞价模型并实现,帮助用户合理的进行在线广告的投资。
4. 通过优化广告在广告位的展现,实现在线广告的利益最大化。
基本要求:
1. 扎实的编码能力与算法基础。熟悉Linux平台下的C/C++语言开发,掌握stl的使用。
2. 深刻理解并熟练掌握机器学习、统计学、数据挖掘的算法和技术。
3. 至少掌握 Perl / Python / Linux Shell 中的一种。
4. 有相关的 自然语言处理 / 数据挖掘 / 机器学习 / 广告竞价理论 / 优化理论的研究和项目经验者优先。
5. 有较强的学习能力,并且能够快速实现数学模型。
6. 创新精神,对互联网领域有热情。
7. 计算机,应用数学,统计,电子工程及相关专业,硕士及以上学历。
(2) C/C++ 开发工程师(Location:上海)
职位描述:
1.web后端产品架构 的设计、优化和开发;
2.海量动态数据存储系统研发;
3.可扩展的分布式系统研发。
职位要求:
1.计算机及相关专业本科以上学历,3年以上工作经验;
2.对数据结构和算法设计具有较深刻的理解;
3.精通C/C++语言编程;
4.熟悉Linux/Unix系统、精通网络编程、多线程编程技术;熟悉TCP/IP、HTTP等协议;
5.善于学习和运用新知识,具有良好的分析和解决问题能力;具有良好的团队合作精神和积极主动的沟通意识 ;
6.熟悉nosql数据库, 具有大型分布式系统架构设计,性能调优经验或互联网广告行业经验优先考虑。
(3)广告监测系统研发工程师(Location:北京)
工作职责:
1. 参与网络广告投放数据监测系统的研究和开发工作
2. 参与网站分析系统的研究和开发工作
3. 负责系统模块和数据分析模块之间的衔接
职位需求:
1. 计算机相关专业,大学本科及以上学历。
2. 有强烈地学习与沟通意愿,能够迅速地学习新知识。
3. 了解WEB服务器技术,熟悉Linux日常操作和shell脚本。
4. 了解并熟悉Mysql数据库或者HBase。
5. 熟悉一门服务端开发技术,例如Python,PHP,Java等。
6. 熟悉互联网广告营销行业者优先。
(4)java 开发工程师 (Location:上海)
工作职责:
1. 参与高并发的后台处理系统的需求整理和开发工作
2. 负责系统性能优化和改进
3. 运用在分布式系统,网络设计及大型存储系统的知识,构建能够满足商业需求的平台,系统及网络基础结构。
4. 编写,分析并优化新的算法或数据结构并证明比现有方案更优。
职位需求:
1. 计算机相关专业,大学本科及以上学历。
2. 有强烈地学习与沟通意愿,能够迅速地学习新知识。
3. 了解nginx, 必须了解Linux系统。
4. 了解基本的前端技术技能,如HTML/CSS/Javascript
5. 有扎实的编程功底,有两年以上的互联网产品开发经验
6. 至少两年以上java开发经验
7. 能够胜任开拓者的角色:,这意味着你必须担任很多角色,此外你需要贡献和不断自我学习。
8. 有互联网广告营销相关系统开发经验者优先。5.有强烈地学习与沟通意愿,能够迅速地学习新知识。
(5)Python/Django研发工程师 (Location:上海)
工作职责:
1. 参与高并发的后台处理系统的需求整理和开发工作
2. 负责系统性能优化和改进
3. 编写,分析并优化新的算法或数据结构.
职位需求:
1. 计算机相关专业,大学本科及以上学历。
2. 有扎实的编程功底, 至少两年以上Python开发经验,熟悉django者优先
3. 了解WEB 服务器技术,熟悉nginx者优先。
4. 了解基本的前端技术技能,如HTML/CSS/Javascript
5.有强烈地学习与沟通意愿,能够迅速地学习新知识。
6. 有互联网广告营销相关系统开发经验者优先。
(6) 平台研发工程师(Location:上海)
职位描述
参与公司互联网软件核心项目的开发
职位要求 :
1.计算机相关专业,大学本科及以上学历,有两年以上大型互联网软件项目开 发经验。
2.对广告行业和FP有一定经验者优先。
3.有Python/Django编程经验最好(非必须)。
4.有在Linux环境下开发经验者优先。
5.精通SQL语言的设计和编程,精通MySQL优先。
(7)数据平台开发工程师(Location:上海、北京)
岗位职责:
1.带领技术团队进行数据平台的架构制定、技术选型;
2.海量数据离线分析和实时分析系统架构(包括搜索引擎)的建设和维护:开发、测试、代码管理、预发布、备份、监控;
3.与算法、标注等部门协调,保证数据挖掘和机器学习算法在大数据下的效率;
4.高吞吐量和低延迟的系统的性能调优和算法优化。
任职资格:
1.重点高校本科以上学历,5年以上相关领域工作经验;
2.精通开发语言:Java、python、C++;
3.精通海量数据分析的相关工程技术:Linux, hadoop, hbase, hive, mongodb, mysql, redis, storm, scribe等;
4.了解JS、COOKIE等WEB前端技术;
5.有丰富的海量数据处理经验,有丰富的服务器集群架构经验
薪酬优厚,福利丰满,具体面议
简历请发至:hiring@zamplus.com(简历请标注:应聘岗位+工作地点)
QQ: 1684748057
数据挖掘为什么要用java或python
我是统计学出身,对机器学习的模型一般是用sas 或者spss modeler做,编码也只会sas和R的。最近发现好多用人单位在招聘数据挖掘岗位的时候都要求会java或者python。想问下这一块的作用是什么?需要再学习一下么?
主要是方便,python的第三方模块很丰富,而且语法非常简练,自由度很高,python的numpy、scipy、matplotlib模块可以完成所有的spss的功能,而且可以根据自己的需要按照定制的方法对数据进行清洗、归约,需要的情况下还可以跟sql进行连接,做机器学习,很多时候数据是从互联网上用网络爬虫收集的,python有urllib模块,可以很简单的完成这个工作,有些时候爬虫收集数据还要对付某些网站的验证码,python有PIL模块,可以方便的进行识别,如果需要做神经网络、遗传算法,scipy也可以完成这个工作,还有决策树就用if-then这样的代码,做聚类不能局限于某几种聚类,可能要根据实际情况进行调整,k-means聚类、DBSCAN聚类,有时候可能还要综合两种聚类方法对大规模数据进行聚类分析,这些都需要自行编码来完成,此外,基于距离的分类方法,有很多距离表达方式可以选用,比如欧几里得距离、余弦距离、闵可夫斯基距离、城市块距离,虽然并不复杂, 但是用python编程实现很方便,基于内容的分类方法,python有强大的nltk自然语言处理模块,对语言词组进行切分、收集、分类、统计等。
综上,就是非常非常方便,只要你对python足够了解,你发现你可以仅仅使用这一个工具快速实现你的所有想法
数据挖掘python,java的更多相关文章
- paip.判断字符是否中文与以及判读是否是汉字uapi python java php
paip.判断字符是否中文与以及判读是否是汉字uapi python java php ##判断中文的原理 注意: 中文与汉字CJKV 的区别..日本,韩国,新加坡,古越南等国家也用汉字,但不是中 ...
- paip.截取字符串byLastDot方法总结uapi python java php c# 总结
paip.截取字符串byLastDot方法总结uapi python java php c# 总结 ========uapi left_byLastDot right_byLastDot 目前 ...
- paip.文件目录操作uAPI php python java对照
paip.文件目录操作uAPI php python java对照 chdir -- 改变目录 chroot -- 改变根目录 dir -- directory 类 closedir -- 关闭目录句 ...
- 十大经典排序算法(Python,Java实现)
参照:https://www.cnblogs.com/wuxinyan/p/8615127.html https://www.cnblogs.com/onepixel/articles/7674659 ...
- [Python+Java双语版自动化测试(接口测试+Web+App+性能+CICD)
[Python+Java双语版自动化测试(接口测试+Web+App+性能+CICD)开学典礼](https://ke.qq.com/course/453802)**测试交流群:549376944**0 ...
- Python Java 快速配置环境变量(Path)
Python Java 快速配置环境变量(Path) 最近系统被重置,清空了C盘中的program等文件夹以及初始化了环境变量. 通常环境下,在windows环境中我们都会打开"环境变量&q ...
- 搭建 windows(7)下Xgboost(0.4)环境 (python,java)以及使用介绍及参数调优
摘要: 1.所需工具 2.详细过程 3.验证 4.使用指南 5.参数调优 内容: 1.所需工具 我用到了git(内含git bash),Visual Studio 2012(10及以上就可以),xgb ...
- EditPlus配置[C++] [Python] [Java] 编译运行环境
以前一直用Codeblocks写C++,eclipse写Java,再在eclipse里面集成PyDev写Python,首先无法忍受代码自动补全功能(这个功能也许你万分喜欢),也无法忍受如此重量级的ID ...
- JavaScript ,Python,java,Go系列算法之选择排序
常见的内部排序算法有:插入排序.希尔排序.选择排序.冒泡排序.归并排序.快速排序.堆排序.基数排序等. 用一张图概括: 选择排序 选择排序是一种简单直观的排序算法,无论什么数据进去都是O(n2) ...
随机推荐
- Python开发第三方必备工具
<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style=&quo ...
- Tengine 如何查找 server 块
概述 本文的目标读者是Tengine/Nginx 研发或者运维同学,如果自己对这块逻辑非常清楚,那可以略过,如果在配置或者开发 Tengine/Nginx 过程中,有如下疑问的同学,本文或许能解答你多 ...
- VitualBox虚拟机安装CentOS, shell模式与图形化界面的相互切换
方法一:永久切换 # vi /etc/inittab 编辑 init 5 为 init 3,重启就自动进入控制台方式:反之桌面模式 方法二:当前有效 桌面模式切换shell模式:Ctrl + Alt ...
- 自己动手编写JEECMS自定义栏目统计标签
今天想在给Java客二级版面加入栏目文章统计效果,如下图, 查看JEECMS的源代码发现开发者版本还没有类似现成的统计标签,一种解决的办法是使用现有的JEECMS标签,像这样Struts( [@cms ...
- 两天了。照着SVN的界面画的一个界面。
可以选择显示哪些列. 界面上的东西,都简单,麻烦的是它的下层.下层全部用svn server的服务器自带的svn.exe来支持. 有些位置要启动svn.exe不止一次.所以参数的来回传递,来回组合 ...
- GC Roots的几种对象
在java语言里,可作为GC Roots的对象包括下面几种: >虚拟机栈(栈帧中的本地变量表)中的引用的对象: >方法区中类静态属性引用的对象: >方法区中常量引用的对象: > ...
- Mac下,spacy配置
pip3 install -U spacy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com python3 -m spa ...
- JS数组的相关方法
数组创建 JavaScript中创建数组有两种方式,第一种是使用 Array 构造函数: ? 1 2 3 var arr1 = new Array(); //创建一个空数组 var arr2 = ne ...
- 使用pdf.js在移动端预览pdf文档
pdf.js 是一个技术原型主要用于在 HTML5 平台上展示 PDF 文档,无需任何本地技术支持. 在线演示地址:http://mozilla.github.com/pdf.js/web/viewe ...
- python条件变量之生产者与消费者操作实例分析
python条件变量之生产者与消费者操作实例分析 本文实例讲述了python条件变量之生产者与消费者操作.分享给大家供大家参考,具体如下: 互斥锁是最简单的线程同步机制,面对复杂线程同步问题,Pyth ...