算法面经之讯飞+CVTE

一、科大讯飞（合肥）

概况：刚经历了科大讯飞的初面，大概35分钟左右，问的内容比较笼统，主要针对简历上的内容来，面试官比较亲切，回忆了一下面试内容。

建议：把简历上的内容整吧清楚，不知道的别瞎写，写了就要知道点，还要说的比较匀称、圆满。

1.你简历上写的这个聚类的项目，具体是怎么做的呢？

2.你这个文字识别是用什么方法呢？检测用的什么？说一下该方法的具体使用？既然单阶段的结果不够好为什么不试一下其他方法呢？

3.期望薪资是多少？

4.家哪里的？有对象吗？

5.有什么想问的？

小声bb:约好的两点半，我左等右等焦躁如思春少女，半小时等不来刚进厕所然后电话面试来了，吐血。

一面已过，二面等面了再来更。

二面已挂，就俩问题，没答出来已经gg，问题：

1.谱聚类图切怎么整的？

2.矩阵分解方法？

二、CVTE（广州）

概况：这个公司感觉不够友好，问题贼多，贼广，怕是挂唧唧。

建议：图像处理、深度学习、机器学习各个方面都要看。

数学方面：

1.机器学习中，1范数和2范数的比较？

答：参考 https://blog.csdn.net/zouxy09/article/details/24971995%20

l1范数：向量中各个元素的绝对值之和，矩阵中沿列方向绝对值求和再选出最大值，稀疏规则算子，是l0范数的最优凸近似，比l0好解；

能够实现稀疏，完成特征选择，模型更容易理解；

倾向于元素大部分=0。

l2范数：向量的平方和的平方根，矩阵的最大特征值开方；

可以防止过拟合，提升模型的泛化能力（小参数说明模型简单，模型简单解决过拟合）；

让优化求解更稳定（矩阵病态，加二范数正则，解析解+λI）快速；

倾向于元素小，≠0。

2.SVD怎么做的？意义？和特征值分解的区别和联系？

答：参考 https://blog.csdn.net/shenziheng1/article/details/52916278

意义：A=Q∑Q^-1一个矩阵就是一个线性变换（一个矩阵乘以一个向量得到另一个向量相当于将该向量进行了变换），高维的矩阵就相当于高维空间的变换，这个变换有很多的变换方向，通过特征值得到的前N个特征向量，就是该矩阵主要的变换方向。所以，矩阵特征值分解可以得到特征向量，特征值表示这个特征向量多重要，特征向量表示这个变换方向是什么。

A=U∑V^T，奇异值分解就是提取矩阵的主要部分。

做法：奇异值的计算是一个难题，是一个O(N^3)的算法。

区别：

特征值分解要求矩阵必须是方阵，但是所有的矩阵都能进行奇异值分解；

当矩阵是对称的方阵，它的奇异值分解就是特征值分解，即特征值分解是奇异值分解的一个特例。

机器学习：

3.SVM的核函数？SVM离群点？

答：

核函数：一个低维空间向高维空间的映射，这个映射可以把低维空间线性不可分的变成线性可分的。可能面临维度灾难，使用对偶和核技巧可以避免显示的特征变换。

计算两个向量在隐式映射过后的空间中的内积的函数叫做核函数，核函数能简化映射空间中的内积运算，且SVM 里需要计算的地方数据向量总是以内积的形式出现的。避开了直接在高维空间中进行计算，而结果却等价。

离群点：采用软间隔的方法，允许一些样本不满足约束，但是这种样本越少越好，比如采用l_0,1损失函数，有些离群点计算的时候不计入损失，或者以一定的权重计入损失等。

4.过拟合和欠拟合？解决方案？

答：

判断：根据学习误差曲线，训练集误差增大测试集误差减小说明在学习，属于欠拟合。测试集误差变大，训练集误差很小属于过拟合。

过拟合

定义：学习到的模型在训练样本中表现的过于优越，导致在测试集或验证集上泛化能力差表现不佳。即学习得过于彻底，将噪声也学到了。

情况：参数过多；模型过大；训练样本过少；数据不纯；

措施：加入正则项；dropout；（训练的时候让神经元以一定的概率不工作）扩大训练样本集；清洗数据；

欠拟合

定义：模型不能很好的捕捉到数据特征，不能很好的拟合数据。

情况：特征不够好或者维度不够，训练时间不够

措施：更换更好的特征；增加网络复杂度；减少正则化参数；增大训练时间

5.logistic回归？

答：见 https://www.cnblogs.com/EstherLjy/p/9343616.html

图像方面：

6.形态学操作？

答：见 https://www.cnblogs.com/EstherLjy/p/9348047.html%20

7.边缘检测算法？

答：见 https://www.cnblogs.com/EstherLjy/p/9347919.html

深度学习方面：

8.sigmod函数的优缺点？

答：见https://www.cnblogs.com/EstherLjy/p/9343487.html

9.有自己开发的layer吗？

10.偏差和方差？

答：

误差=偏差+方差，偏差表示的是输出与Gt的误差，即模型的准确度，方差指的是模型在不同数据集上的预测值与所有数据集平均预测值之间的差异，即模型稳定性。

11.resnet？

答：见 https://www.cnblogs.com/EstherLjy/p/9350118.html

12.Inception？

答：见 https://www.cnblogs.com/EstherLjy/p/9350118.html

目标检测方面：

13.faster RCNN的anchor机制?

答：见 https://www.cnblogs.com/EstherLjy/p/9328996.html

14.Mask RCNN?

答：见 https://www.cnblogs.com/EstherLjy/p/9328996.html

15.单阶段小目标漏检？

答：

样本不均衡（可通过给负样本加权重和控制负样本数量来改善）；拍摄时目标比较小丢失信息（模糊等，边缘信息等），不能很好的学习；丢进网络也是越来越小，更小可能被视为噪音。

16.selective search?

答：见 https://www.cnblogs.com/EstherLjy/p/9328996.html

小声bb:和科大讯飞刚好一个后脚要结束一个前脚要开始，还重合了一分钟。

一面已过，二面等面了再来更。

-----------------------------------------------------------------

二面来了。已挂。

概况：二面的面试官仿佛一个zz，面试官不是做目标检测的，全程问我文字检测的问题，感觉他并不知道神经网络是什么，而且问的感觉都是**问题，解释了他还听不懂，简直一个杠精。各种打断别人说话，一句话没说超过三秒过。

建议：这种没啥建议了。

问题：1.文字检测你是怎么做的呢？（首先用基础网络提取特征然后....）

2.哎我打断，神经网络怎么就能知道他是不是文字呢？（光这个问题解释了十分钟硬是听不懂....这不是神经网络常识吗？不是你喂什么他出什么吗？？）

3.哎我打断，神经网络你就这样搞搞技术壁垒呢？（在于神经网络的设计，比如架构等，如变形卷积,inception，resnet）

4.哎我打断，不用神经网络你怎么做？（传统方法先提取连通分量再....）

5.哎我打断，怎么提取连通分量？（这基于一个观察说文字一般是连通的...）

6.哎我打断，文字怎么就是连通的？少数民族文字就不是啊？（您说的对，我指的是大部分的，针对中英文，其他的....）

7.哎我打断，连通的也不一定是文字啊，比如杂草就不是啊？（您说的对，所以我说的这是第一阶段，提取连通分量，后面会采用分类器过如svm滤....）

8.哎我打断，svm只是一种手段，跟神经网络一样，特征你怎么提？（文字有一定的特性，如宽高比等）

9.哎我打断，电线杆也是宽高比符合啊？（您说的对，所以后面会训练过滤呀）

10.哎我打断，你又要用分类器，我觉得你掉入神经网络里面了.......（卧槽？不用分类器你搞锤子哦？）

....................

小声bb: 坚定了不去这家公司的信念。

----------------------------------------------------------------

两公司提前批已挂，秋招均未投简历，此文终结。

算法面经之讯飞+CVTE的更多相关文章

android讯飞语音开发常遇到的问题
场景:android项目中共使用了3个语音组件:在线语音听写.离线语音合成.离线语音识别 11208:遇到这个错误,授权应用失败,先检查装机量(3台测试权限),以及appid的申请时间(35天期限), ...
讯飞语音JavaWeb语音合成解决方案
在线语音合成将文字信息转化为声音信息,给应用配上"嘴巴".我们提供了众多极具特色的发音人(音库)供您选择.其合成音在音色.自然度等方面的表现均接近甚至超过了人声.这种语音合成体验 ...
一百元的智能家居——Asp.Net Mvc Api+讯飞语音+Android+Arduino
大半夜的,先说些废话提提神如今智能家居已经不再停留在概念阶段,高大上的科技公司都已经推出了自己的部分或全套的智能家居解决方案,不过就目前的现状而言,大多还停留在展厅阶段,还没有广泛的推广起来,有人说 ...
基于讯飞语音API应用开发之——离线词典构建
最近实习在做一个跟语音相关的项目,就在度娘上搜索了很多关于语音的API,顺藤摸瓜找到了科大讯飞,虽然度娘自家也有语音识别.语义理解这块,但感觉应该不是很好用,毕竟之前用过百度地图的API,有问题也找不 ...
android用讯飞实现TTS语音合成实现中文版
Android系统从1.6版本开始就支持TTS(Text-To-Speech),即语音合成.但是android系统默认的TTS引擎:Pic TTS不支持中文.所以我们得安装自己的TTS引擎和语音包. ...
Twitter算法面试题详解（Java实现）
最近在网上看到一道Twitter的算法面试题,网上已经有人给出了答案,不过可能有些人没太看明白(我也未验证是否正确),现在给出一个比较好理解的答案.先看一下题目. 图1 先看看图图1.可以将方块看做砖 ...
算法实践——Twitter算法面试题（积水问题）的线性时间解法
问题描述:在下图里我们有不同高度的挡板.这个图片由一个整数数组所代表,数组中每个数是墙的高度.下图可以表示为数组(2.5.1.2.3.4.7.2).假如开始下雨了,那么挡板之间的水坑能够装多少水(水足 ...
Android讯飞语音云语音听写学习
讯飞语音云语音听写学习这几天两个舍友都买了iPhone 6S,玩起了"Hey, Siri",我依旧对我的Nexus 5喊着"OK,Google" ...
关于讯飞使用android SDK出现21001错误码的分析
21001,没有安装语音组件1.有没有使用SpeechUtility.createUtility()设置appid2.有没有将libmsc.so放到工程中,jar包有Msc.jar.Sunflower ...

随机推荐

[原]NTP时间服务器简单设置
====server edit /etc/ntp.conf 添加 server 127.127.1.0 fudge 127.127.1.0 stratum 1 fudge 127.127.1.0 ...
Orleans学习总结(四)--集群配置篇
上篇我们讲了Orleans学习总结(三)--持久化篇,这一篇我们来说说集群配置,毕竟这个才是Orleans的看家本领 Orleans支持热起动,支持自动节点发现,能够断线重发等一系列黑科技. 我这篇是 ...
day_5.25py
作用域
struts2常用标签详解(申明：来源于网络)
struts2常用标签详解(申明:来源于网络) 地址:http://blessht.iteye.com/blog/1184960
TOP100summit2017：网易云通信与视频CTO赵加雨：外力推动下系统架构的4个变化趋势
壹佰案例:很荣幸邀请到您成为第六届壹佰案例峰会架构专场的联席主席,您曾深度参与Cisco Jabber,Webex Meeting, Cisco Spark等多项分布式实时通信类产品的架构与研发, ...
MS14-064 漏洞测试入侵——20145301
MS14-064 漏洞测试入侵 Microsoft Windows OLE远程代码执行漏洞,OLE(对象链接与嵌入)是一种允许应用程序共享数据和功能的技术执行摘要此安全更新可解决 Microsof ...
Codeforces 219C - Color Stripe - [DP]
题目链接:http://codeforces.com/problemset/problem/219/C 题意: 给你 $n$ 个方块排成水平一排,每个方块都涂上 $k$ 种颜色中的一种.要求对尽量少的 ...
[No0000F5]C# 类（Class）
当你定义一个类时,你定义了一个数据类型的蓝图.这实际上并没有定义任何的数据,但它定义了类的名称意味着什么,也就是说,类的对象由什么组成及在这个对象上可执行什么操作.对象是类的实例.构成类的方法和变量成 ...
UDP，TCP的套接字编程的Python实现
UDP,TCP的套接字编程的Python实现套接字:连接应用层和运输层,应用层的网络应用程序使用IP地址+端口号来标识自己,然后通过套接字调用运输层为其服务,网络应用程序只能指定自己要使用的网络类型 ...
Sharding-JDBC读写分离
https://www.jianshu.com/p/8bbc8ca63037 官网文档:当当网,架构师张亮 http://shardingsphere.io/document/current/cn/m ...

算法面经之讯飞+CVTE

算法面经之讯飞+CVTE的更多相关文章

随机推荐

热门专题