一、科大讯飞(合肥)

概况:刚经历了科大讯飞的初面,大概35分钟左右,问的内容比较笼统,主要针对简历上的内容来,面试官比较亲切,回忆了一下面试内容。

建议:把简历上的内容整吧清楚,不知道的别瞎写,写了就要知道点,还要说的比较匀称、圆满。

1.你简历上写的这个聚类的项目,具体是怎么做的呢?

2.你这个文字识别是用什么方法呢?检测用的什么?说一下该方法的具体使用?既然单阶段的结果不够好为什么不试一下其他方法呢?

3.期望薪资是多少?

4.家哪里的?有对象吗?

5.有什么想问的?

小声bb:约好的两点半,我左等右等焦躁如思春少女,半小时等不来刚进厕所然后电话面试来了,吐血。

一面已过,二面等面了再来更。

二面已挂,就俩问题,没答出来已经gg,问题:

1.谱聚类图切怎么整的?

2.矩阵分解方法?

二、CVTE(广州)

 概况:这个公司感觉不够友好,问题贼多,贼广,怕是挂唧唧。

建议:图像处理、深度学习、机器学习各个方面都要看。

   数学方面:

1.机器学习中,1范数和2范数的比较?

答:参考 https://blog.csdn.net/zouxy09/article/details/24971995%20

l1范数:向量中各个元素的绝对值之和,矩阵中沿列方向绝对值求和再选出最大值,稀疏规则算子,是l0范数的最优凸近似,比l0好解;

能够实现稀疏,完成特征选择,模型更容易理解;

倾向于元素大部分=0。

l2范数:向量的平方和的平方根,矩阵的最大特征值开方;

可以防止过拟合,提升模型的泛化能力(小参数说明模型简单,模型简单解决过拟合);

让优化求解更稳定(矩阵病态,加二范数正则,解析解+λI)快速;

倾向于元素小,≠0。

2.SVD怎么做的?意义?和特征值分解的区别和联系?

答: 参考 https://blog.csdn.net/shenziheng1/article/details/52916278

意义:A=Q∑Q-1 一个矩阵就是一个线性变换(一个矩阵乘以一个向量得到另一个向量相当于将该向量进行了变换),高维的矩阵就相当于高维空间的变换,这个变换有很多的变换方向,通过特征值得到的前N个特征向量,就是该矩阵主要的变换方向。所以,矩阵特征值分解可以得到特征向量,特征值表示这个特征向量多重要,特征向量表示这个变换方向是什么。

A=U∑VT,奇异值分解就是提取矩阵的主要部分。

做法:奇异值的计算是一个难题,是一个O(N^3)的算法。

区别:

特征值分解要求矩阵必须是方阵,但是所有的矩阵都能进行奇异值分解;

当矩阵是对称的方阵,它的奇异值分解就是特征值分解,即特征值分解是奇异值分解的一个特例。

机器学习:

3.SVM的核函数?SVM离群点?

答:

核函数:一个低维空间向高维空间的映射,这个映射可以把低维空间线性不可分的变成线性可分的。可能面临维度灾难,使用对偶和核技巧可以避免显示的特征变换。

计算两个向量在隐式映射过后的空间中的内积的函数叫做核函数,核函数能简化映射空间中的内积运算,且SVM 里需要计算的地方数据向量总是以内积的形式出现的。避开了直接在高维空间中进行计算,而结果却等价。

离群点:采用软间隔的方法,允许一些样本不满足约束,但是这种样本越少越好,比如采用l0,1损失函数,有些离群点计算的时候不计入损失,或者以一定的权重计入损失等。

4.过拟合和欠拟合?解决方案?

答:

判断:根据学习误差曲线,训练集误差增大测试集误差减小说明在学习,属于欠拟合。测试集误差变大,训练集误差很小属于过拟合。

  过拟合

定义:学习到的模型在训练样本中表现的过于优越,导致在测试集或验证集上泛化能力差表现不佳。即学习得过于彻底,将噪声也学到了。

情况:参数过多;模型过大;训练样本过少;数据不纯;

措施:加入正则项;dropout;(训练的时候让神经元以一定的概率不工作)扩大训练样本集;清洗数据;

   欠拟合

定义:模型不能很好的捕捉到数据特征,不能很好的拟合数据。

情况:特征不够好或者维度不够,训练时间不够

措施:更换更好的特征;增加网络复杂度;减少正则化参数;增大训练时间

5.logistic回归?

答:见 https://www.cnblogs.com/EstherLjy/p/9343616.html

图像方面:

6.形态学操作?

答: 见 https://www.cnblogs.com/EstherLjy/p/9348047.html%20

7.边缘检测算法?

答:见 https://www.cnblogs.com/EstherLjy/p/9347919.html

深度学习方面:

8.sigmod函数的优缺点?

答:见https://www.cnblogs.com/EstherLjy/p/9343487.html

9.有自己开发的layer吗?

10.偏差和方差?

答:

误差=偏差+方差,偏差表示的是输出与Gt的误差,即模型的准确度,方差指的是模型在不同数据集上的预测值与所有数据集平均预测值之间的差异,即模型稳定性。

11.resnet?

答:见 https://www.cnblogs.com/EstherLjy/p/9350118.html

12.Inception?

答: 见 https://www.cnblogs.com/EstherLjy/p/9350118.html

目标检测方面:

13.faster RCNN的anchor机制?

答:见 https://www.cnblogs.com/EstherLjy/p/9328996.html

14.Mask RCNN?

答: 见 https://www.cnblogs.com/EstherLjy/p/9328996.html

15.单阶段小目标漏检?

答:

样本不均衡(可通过给负样本加权重和控制负样本数量来改善);拍摄时目标比较小丢失信息(模糊等,边缘信息等),不能很好的学习;丢进网络也是越来越小,更小可能被视为噪音。

16.selective search?

答:见 https://www.cnblogs.com/EstherLjy/p/9328996.html

小声bb:和科大讯飞刚好一个后脚要结束一个前脚要开始,还重合了一分钟。

一面已过,二面等面了再来更。

-----------------------------------------------------------------

二面来了。已挂。

概况:二面的面试官仿佛一个zz,面试官不是做目标检测的,全程问我文字检测的问题,感觉他并不知道神经网络是什么,而且问的感觉都是**问题,解释了他还听不懂,简直一个杠精。各种打断别人说话,一句话没说超过三秒过。

建议:这种没啥建议了。

问题:1.文字检测你是怎么做的呢?(首先用基础网络提取特征然后....)

2.哎我打断,神经网络怎么就能知道他是不是文字呢?(光这个问题解释了十分钟硬是听不懂....这不是神经网络常识吗?不是你喂什么他出什么吗??)

3.哎我打断,神经网络你就这样搞搞技术壁垒呢?(在于神经网络的设计,比如架构等,如变形卷积,inception,resnet)

4.哎我打断,不用神经网络你怎么做?(传统方法先提取连通分量再....)

5.哎我打断,怎么提取连通分量?(这基于一个观察说文字一般是连通的...)

6.哎我打断,文字怎么就是连通的?少数民族文字就不是啊?(您说的对,我指的是大部分的,针对中英文,其他的....)

7.哎我打断,连通的也不一定是文字啊,比如杂草就不是啊?(您说的对,所以我说的这是第一阶段,提取连通分量,后面会采用分类器过如svm滤....)

8.哎我打断,svm只是一种手段,跟神经网络一样,特征你怎么提?(文字有一定的特性,如宽高比等)

9.哎我打断,电线杆也是宽高比符合啊?(您说的对,所以后面会训练过滤呀)

10.哎我打断,你又要用分类器,我觉得你掉入神经网络里面了.......(卧槽?不用分类器你搞锤子哦?)

....................

小声bb:  坚定了不去这家公司的信念。

----------------------------------------------------------------

两公司提前批已挂,秋招均未投简历,此文终结。

算法面经之讯飞+CVTE的更多相关文章

  1. android讯飞语音开发常遇到的问题

    场景:android项目中共使用了3个语音组件:在线语音听写.离线语音合成.离线语音识别 11208:遇到这个错误,授权应用失败,先检查装机量(3台测试权限),以及appid的申请时间(35天期限), ...

  2. 讯飞语音JavaWeb语音合成解决方案

    在线语音合成 将文字信息转化为声音信息,给应用配上"嘴巴".我们提供了众多极具特色的发音人(音库)供您选择.其合成音在音色.自然度等方面的表现均接近甚至超过了人声.这种语音合成体验 ...

  3. 一百元的智能家居——Asp.Net Mvc Api+讯飞语音+Android+Arduino

    大半夜的,先说些废话提提神 如今智能家居已经不再停留在概念阶段,高大上的科技公司都已经推出了自己的部分或全套的智能家居解决方案,不过就目前的现状而言,大多还停留在展厅阶段,还没有广泛的推广起来,有人说 ...

  4. 基于讯飞语音API应用开发之——离线词典构建

    最近实习在做一个跟语音相关的项目,就在度娘上搜索了很多关于语音的API,顺藤摸瓜找到了科大讯飞,虽然度娘自家也有语音识别.语义理解这块,但感觉应该不是很好用,毕竟之前用过百度地图的API,有问题也找不 ...

  5. android用讯飞实现TTS语音合成 实现中文版

    Android系统从1.6版本开始就支持TTS(Text-To-Speech),即语音合成.但是android系统默认的TTS引擎:Pic TTS不支持中文.所以我们得安装自己的TTS引擎和语音包. ...

  6. Twitter算法面试题详解(Java实现)

    最近在网上看到一道Twitter的算法面试题,网上已经有人给出了答案,不过可能有些人没太看明白(我也未验证是否正确),现在给出一个比较好理解的答案.先看一下题目. 图1 先看看图图1.可以将方块看做砖 ...

  7. 算法实践——Twitter算法面试题(积水问题)的线性时间解法

    问题描述:在下图里我们有不同高度的挡板.这个图片由一个整数数组所代表,数组中每个数是墙的高度.下图可以表示为数组(2.5.1.2.3.4.7.2).假如开始下雨了,那么挡板之间的水坑能够装多少水(水足 ...

  8. Android讯飞语音云语音听写学习

    讯飞语音云语音听写学习         这几天两个舍友都买了iPhone 6S,玩起了"Hey, Siri",我依旧对我的Nexus 5喊着"OK,Google" ...

  9. 关于讯飞 使用android SDK出现21001错误码的分析

    21001,没有安装语音组件1.有没有使用SpeechUtility.createUtility()设置appid2.有没有将libmsc.so放到工程中,jar包有Msc.jar.Sunflower ...

随机推荐

  1. [Node.js] 04 - Event and Callback

    回调函数 回调函数在完成任务后就会被调用,Node 使用了大量的回调函数,Node 所有 API 都支持回调函数. 异步读取文件的回调函数: var fs = require("fs&quo ...

  2. 09观察者模式ObServer

    一.什么是观察者模式 Observer模式是行为模式之一,它的作用是当 一个对象的状态发生变化时,能够自动通知其他 关联对象,自动刷新对象状态. Observer模式提供给关联对象一种同步通信的 手段 ...

  3. Hadoop -- HDFS 读写数据

    一.HDFS读写文件过程 1.读取文件过程 1)       初始化FileSystem,然后客户端(client)用FileSystem的open()函数打开文件 2)       FileSyst ...

  4. Git 学习笔记--拉取远程分支到本地

    1.查看远程分支,和上面的第一步相同2. 从远程获取最新版本到本地 git fetch origin master:temp git fetch origin master:temp 这句命令的意思是 ...

  5. nginx的80端口跳转到443

    然后在80端口设置http跳转到https 在80端口location中加入rewrite ^(.*)$ https://$host$1 permanent; 如图,然后输入命令service ngi ...

  6. DOM内容操作

    <table border="2"> <thead id="1" class="c1 c2"> <tr> ...

  7. ngxs 状态管理器

    官网文档 ng6,rxjs6.0.0,ngxs3.0.1 λ ng new ngxs --style=styl --routing --skip-install λ cd ngxs λ yarn λ ...

  8. 转载]PhpCms V9调用指定栏目子栏目文章的两种方法

    PhpCms V9调用指定栏目子栏目文章的两种方法 第一种.直接写子栏目id ,用cat in {pc:get sql="SELECT * from v9_news where status ...

  9. 2018ACM-ICPC南京区域赛---AJGIDKM

    含[最小球覆盖][最大流isap]模板. 题面pdf https://codeforc.es/gym/101981/attachments/download/7891/20182019-acmicpc ...

  10. {Django基础九之中间件} 一 前戏 二 中间件介绍 三 自定义中间件 四 中间件的执行流程 五 中间件版登陆认证

    Django基础九之中间件 本节目录 一 前戏 二 中间件介绍 三 自定义中间件 四 中间件的执行流程 五 中间件版登陆认证 六 xxx 七 xxx 八 xxx 一 前戏 我们在前面的课程中已经学会了 ...