2019-08-26 17:19:58

1)聊实习项目

2)代码题,二维数组中的查找某个target

3)讲一些最能体现创新能力的工作,而不是一些工程上的实现

4)讲论文可以从哪些方面做创新点,文本生成的结果怎么排序

5)部门是做任务型聊天机器人的
 
 
第一个开始面试的公司,一开始没找内推,被互娱的组捞了。
3.8 一面,聊项目,然后计算机基础(dns),最后一道算法题,比较愉快。面完两小时接到电话邀请二面,时间定在3.12(这里可能时间定太晚了?)
3.12 二面,项目+一道算法,但还是准备不多,有些东西忘了,对前沿技术讨论的时候有几个点我说的有问题,面试官评价是做的很多,基础要多把握
3.28 一面,惯例项目介绍一波。但对方明显对nlp和深度学习相对不是很感兴趣? 话题转移到数学,“τ分布是啥" "..." "极限知道吗" ”知道点,比如求梯度求斜率的时候可以用到“ "呵呵" 猝 转移到基础算法的原理,“分类,聚类xxxxxxx哪个熟。” “分类吧” “哪种” “有哪些?” “lr,svm,xxxxx神经网络” "那就神经网络吧" "太简单了,不问了" 猝 "xgboost和adaboost原理" "...." 疙疙瘩瘩答了一些原理。
“你对机器学习还停留在理论阶段啊” 猝 .... "我找了nlp内推,如果觉得我不ok的话,就把我转走或者灰掉吧" "我这里了解你的情况了,会处理的" 然后过一个小时变复试。。
更新: 30号晚上leader加微信,31号下午二面,晚上状态变成已完成
 
 
1.重复数字的二分查找,找到始末位置
问了问最近两年的腾讯广告算法比赛有什么不一样。
问了个场景题,如果有用户历史的阅读文章,怎么做兴趣点的挖掘。
问了问文本的分类算法。
问了个给一个query,怎么找相关的文章。
匹配和检索算法。
都有哪些方法,没怎么扣细节。
感觉对NLP问的比较多。问了两遍工作城市意向。
后面找了个HR,发起了个正式的流程。
 
 
内推的是自己的学长。一面的是深圳分部的同事,人很好,自己正好有一点network让他认识了我,所以就捞了简历。面试内容很大一部分都是详细问了做过的项目,包括每一步是如何实现的,想法怎么来的。涉及到NLP的问题,问了有word2vec skip-gram的原理,negative sampling怎么做,为什么这么做,如何加速word2vec的训练。attention的机制,lstm和gru的原理,为什么可以解决梯度消失的问题。以及对于我做的一个跨语言情感分析的项目,还详细问了如何区分并提取每个语言不同的特征以及共同的特征。问了大约1h就说会尽快安排二面。
二面是同一天的晚上,是来自美国分部的同事,重点问了我之前发表论文的课题,包括我在其中负责的部分,对于时序数据的处理等。具体涉及NLP的问题,问了防止过拟合的做法,dropout的原理,batch normalization的原理,maxout激活函数的原理,因为我最近的课题用了Attent is all you need里的position embedding和Multihead的做法,他也详细问了各个步骤和原理,因为是晚上比较晚开始的面试,所以问了半小时就结束了。
hr面是第二天的晚上七点好像是,也是深圳的同事,问了简历中暑期科研的课题,我的背景,自己希望的工作地点这样。
然而等offer等了11天。。虽然中间有清明,但是流程还是过了很久。
 
  • 一面:

    • 项目介绍;
    • viterbi解码原理,code;beamsearch;
    • 代码:一道hash的题,忘了;
  • 二面:
    • 项目介绍;
    • BN介绍(为什么加速收敛,从SGD更新角度和weight scale角度),dropout介绍,训练测试差异;
    • 代码:二分查找的题,绝对值;
  • 三面(总监):
    • 聊项目;

NLP interview的更多相关文章

  1. CrowdFlower Winner's Interview: 1st place, Chenglong Chen

    CrowdFlower Winner's Interview: 1st place, Chenglong Chen The Crowdflower Search Results Relevance c ...

  2. 【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理

    干货!详述Python NLTK下如何使用stanford NLP工具包 作者:白宁超 2016年11月6日19:28:43 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的 ...

  3. 【NLP】十分钟快览自然语言处理学习总结

    十分钟学习自然语言处理概述 作者:白宁超 2016年9月23日00:24:12 摘要:近来自然语言处理行业发展朝气蓬勃,市场应用广泛.笔者学习以来写了不少文章,文章深度层次不一,今天因为某种需要,将文 ...

  4. 【NLP】前戏:一起走进条件随机场(一)

    前戏:一起走进条件随机场 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有 ...

  5. 【NLP】蓦然回首:谈谈学习模型的评估系列文章(一)

    统计角度窥视模型概念 作者:白宁超 2016年7月18日17:18:43 摘要:写本文的初衷源于基于HMM模型序列标注的一个实验,实验完成之后,迫切想知道采用的序列标注模型的好坏,有哪些指标可以度量. ...

  6. 【NLP】Python NLTK处理原始文本

    Python NLTK 处理原始文本 作者:白宁超 2016年11月8日22:45:44 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开 ...

  7. 【NLP】Python NLTK获取文本语料和词汇资源

    Python NLTK 获取文本语料和词汇资源 作者:白宁超 2016年11月7日13:15:24 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集 ...

  8. NLP点滴——文本相似度

    [TOC] 前言 在自然语言处理过程中,经常会涉及到如何度量两个文本之间的相似性,我们都知道文本是一种高维的语义空间,如何对其进行抽象分解,从而能够站在数学角度去量化其相似性.而有了文本之间相似性的度 ...

  9. Pramp mock interview (4th practice): Matrix Spiral Print

    March 16, 2016 Problem statement:Given a 2D array (matrix) named M, print all items of M in a spiral ...

随机推荐

  1. wxpython(2)--按钮,位图按钮,滑动块,微调控制器

    本文介绍按钮,位图按钮,滑动块,微调控制器**.. 按钮 基本按钮 创建一个按钮,绑定点击事件,点击后修改Label 123456789101112131415161718 import wx cla ...

  2. 一道二叉树题的n步优化——LeetCode98validate binary search tree(草稿)

    树的题目,往往可以用到三种遍历.以及递归,因为其结构上天然地可以往深处递归,且判断条件也往往不复杂(左右子树都是空的). LeetCode 98题讲的是,判断一棵树是不是二叉搜索树. 题目中给的是标准 ...

  3. 少用 string.Format

    如果你使用的是 C# 6.0 及其以上版本的话我建议你使用新增的 内插字符串 这个功能.这个功能可以更好的帮助开发人员设置字符串格式.下面我们就来看一下为什么要少用 string.Format 而要多 ...

  4. vs2017 tfs服务器迁移更换服务器IP地址方法

    今天公司服务器换了IP地址,然后发现tfs的服务器删除不了,也添加不了.最后参考了其他vs版本提供的方法,找到了解决的方法. 一共需要修改两个地方: 1.找到项目的sln文件,使用其他文本编辑器打开, ...

  5. 关于js传送json到.net后台处理

    这里的内容好像跟标题不太符合,应该是如何实现将请求得到的结果作为另一个请求的请求参数,方法就是使用json处理配合全局变量进行处理 今天做项目遇到以下情景,页面请求获得一个list数据,然后要将得到的 ...

  6. python xlwings Excel 内容截图

    import xlwings as xw from PIL import ImageGrab def excel_save_img(path, sheet=0, img_name="1&qu ...

  7. 一位资深程序员大牛推荐的Java技术学习路线图

    Web应用,最常见的研发语言是Java和PHP. 后端服务,最常见的研发语言是Java和C/C++. 大数据,最常见的研发语言是Java和Python. 可以说,Java是现阶段中国互联网公司中,覆盖 ...

  8. czC#01

    1. .net简介: .net分为.net平台及.net Framework 2..NET作用 2.转义与@ 3.类型转换 1) 隐式转换 2)显式类型转换 (待转换的目标类型)原始值

  9. grid实战之微信钱包 腾讯服务界面

    网格布局简介 CSS3网格布局是让开发人员设计一个网格并将内容放在这些网格内.而不是使用浮动制作一个网格,实际上是你将一个元素声明为一个网格容器,并把元素内容置于网格中. 有一些浏览器是不支持网格布局 ...

  10. 初窥Mybatis初始化

    引言 这篇文章呢,主要是讲Mybtais的两种方式的源码剖析:传统方式以及Mapper代理方式,初次探索Mybatis源码,希望大佬勿喷并且指正错误,谢谢! 个人博客:www.fqcoder.cn 一 ...