一、科大讯飞(合肥)

概况:刚经历了科大讯飞的初面,大概35分钟左右,问的内容比较笼统,主要针对简历上的内容来,面试官比较亲切,回忆了一下面试内容。

建议:把简历上的内容整吧清楚,不知道的别瞎写,写了就要知道点,还要说的比较匀称、圆满。

1.你简历上写的这个聚类的项目,具体是怎么做的呢?

2.你这个文字识别是用什么方法呢?检测用的什么?说一下该方法的具体使用?既然单阶段的结果不够好为什么不试一下其他方法呢?

3.期望薪资是多少?

4.家哪里的?有对象吗?

5.有什么想问的?

小声bb:约好的两点半,我左等右等焦躁如思春少女,半小时等不来刚进厕所然后电话面试来了,吐血。

一面已过,二面等面了再来更。

二面已挂,就俩问题,没答出来已经gg,问题:

1.谱聚类图切怎么整的?

2.矩阵分解方法?

二、CVTE(广州)

 概况:这个公司感觉不够友好,问题贼多,贼广,怕是挂唧唧。

建议:图像处理、深度学习、机器学习各个方面都要看。

   数学方面:

1.机器学习中,1范数和2范数的比较?

答:参考 https://blog.csdn.net/zouxy09/article/details/24971995%20

l1范数:向量中各个元素的绝对值之和,矩阵中沿列方向绝对值求和再选出最大值,稀疏规则算子,是l0范数的最优凸近似,比l0好解;

能够实现稀疏,完成特征选择,模型更容易理解;

倾向于元素大部分=0。

l2范数:向量的平方和的平方根,矩阵的最大特征值开方;

可以防止过拟合,提升模型的泛化能力(小参数说明模型简单,模型简单解决过拟合);

让优化求解更稳定(矩阵病态,加二范数正则,解析解+λI)快速;

倾向于元素小,≠0。

2.SVD怎么做的?意义?和特征值分解的区别和联系?

答: 参考 https://blog.csdn.net/shenziheng1/article/details/52916278

意义:A=Q∑Q-1 一个矩阵就是一个线性变换(一个矩阵乘以一个向量得到另一个向量相当于将该向量进行了变换),高维的矩阵就相当于高维空间的变换,这个变换有很多的变换方向,通过特征值得到的前N个特征向量,就是该矩阵主要的变换方向。所以,矩阵特征值分解可以得到特征向量,特征值表示这个特征向量多重要,特征向量表示这个变换方向是什么。

A=U∑VT,奇异值分解就是提取矩阵的主要部分。

做法:奇异值的计算是一个难题,是一个O(N^3)的算法。

区别:

特征值分解要求矩阵必须是方阵,但是所有的矩阵都能进行奇异值分解;

当矩阵是对称的方阵,它的奇异值分解就是特征值分解,即特征值分解是奇异值分解的一个特例。

机器学习:

3.SVM的核函数?SVM离群点?

答:

核函数:一个低维空间向高维空间的映射,这个映射可以把低维空间线性不可分的变成线性可分的。可能面临维度灾难,使用对偶和核技巧可以避免显示的特征变换。

计算两个向量在隐式映射过后的空间中的内积的函数叫做核函数,核函数能简化映射空间中的内积运算,且SVM 里需要计算的地方数据向量总是以内积的形式出现的。避开了直接在高维空间中进行计算,而结果却等价。

离群点:采用软间隔的方法,允许一些样本不满足约束,但是这种样本越少越好,比如采用l0,1损失函数,有些离群点计算的时候不计入损失,或者以一定的权重计入损失等。

4.过拟合和欠拟合?解决方案?

答:

判断:根据学习误差曲线,训练集误差增大测试集误差减小说明在学习,属于欠拟合。测试集误差变大,训练集误差很小属于过拟合。

  过拟合

定义:学习到的模型在训练样本中表现的过于优越,导致在测试集或验证集上泛化能力差表现不佳。即学习得过于彻底,将噪声也学到了。

情况:参数过多;模型过大;训练样本过少;数据不纯;

措施:加入正则项;dropout;(训练的时候让神经元以一定的概率不工作)扩大训练样本集;清洗数据;

   欠拟合

定义:模型不能很好的捕捉到数据特征,不能很好的拟合数据。

情况:特征不够好或者维度不够,训练时间不够

措施:更换更好的特征;增加网络复杂度;减少正则化参数;增大训练时间

5.logistic回归?

答:见 https://www.cnblogs.com/EstherLjy/p/9343616.html

图像方面:

6.形态学操作?

答: 见 https://www.cnblogs.com/EstherLjy/p/9348047.html%20

7.边缘检测算法?

答:见 https://www.cnblogs.com/EstherLjy/p/9347919.html

深度学习方面:

8.sigmod函数的优缺点?

答:见https://www.cnblogs.com/EstherLjy/p/9343487.html

9.有自己开发的layer吗?

10.偏差和方差?

答:

误差=偏差+方差,偏差表示的是输出与Gt的误差,即模型的准确度,方差指的是模型在不同数据集上的预测值与所有数据集平均预测值之间的差异,即模型稳定性。

11.resnet?

答:见 https://www.cnblogs.com/EstherLjy/p/9350118.html

12.Inception?

答: 见 https://www.cnblogs.com/EstherLjy/p/9350118.html

目标检测方面:

13.faster RCNN的anchor机制?

答:见 https://www.cnblogs.com/EstherLjy/p/9328996.html

14.Mask RCNN?

答: 见 https://www.cnblogs.com/EstherLjy/p/9328996.html

15.单阶段小目标漏检?

答:

样本不均衡(可通过给负样本加权重和控制负样本数量来改善);拍摄时目标比较小丢失信息(模糊等,边缘信息等),不能很好的学习;丢进网络也是越来越小,更小可能被视为噪音。

16.selective search?

答:见 https://www.cnblogs.com/EstherLjy/p/9328996.html

小声bb:和科大讯飞刚好一个后脚要结束一个前脚要开始,还重合了一分钟。

一面已过,二面等面了再来更。

-----------------------------------------------------------------

二面来了。已挂。

概况:二面的面试官仿佛一个zz,面试官不是做目标检测的,全程问我文字检测的问题,感觉他并不知道神经网络是什么,而且问的感觉都是**问题,解释了他还听不懂,简直一个杠精。各种打断别人说话,一句话没说超过三秒过。

建议:这种没啥建议了。

问题:1.文字检测你是怎么做的呢?(首先用基础网络提取特征然后....)

2.哎我打断,神经网络怎么就能知道他是不是文字呢?(光这个问题解释了十分钟硬是听不懂....这不是神经网络常识吗?不是你喂什么他出什么吗??)

3.哎我打断,神经网络你就这样搞搞技术壁垒呢?(在于神经网络的设计,比如架构等,如变形卷积,inception,resnet)

4.哎我打断,不用神经网络你怎么做?(传统方法先提取连通分量再....)

5.哎我打断,怎么提取连通分量?(这基于一个观察说文字一般是连通的...)

6.哎我打断,文字怎么就是连通的?少数民族文字就不是啊?(您说的对,我指的是大部分的,针对中英文,其他的....)

7.哎我打断,连通的也不一定是文字啊,比如杂草就不是啊?(您说的对,所以我说的这是第一阶段,提取连通分量,后面会采用分类器过如svm滤....)

8.哎我打断,svm只是一种手段,跟神经网络一样,特征你怎么提?(文字有一定的特性,如宽高比等)

9.哎我打断,电线杆也是宽高比符合啊?(您说的对,所以后面会训练过滤呀)

10.哎我打断,你又要用分类器,我觉得你掉入神经网络里面了.......(卧槽?不用分类器你搞锤子哦?)

....................

小声bb:  坚定了不去这家公司的信念。

----------------------------------------------------------------

两公司提前批已挂,秋招均未投简历,此文终结。

算法面经之讯飞+CVTE的更多相关文章

  1. android讯飞语音开发常遇到的问题

    场景:android项目中共使用了3个语音组件:在线语音听写.离线语音合成.离线语音识别 11208:遇到这个错误,授权应用失败,先检查装机量(3台测试权限),以及appid的申请时间(35天期限), ...

  2. 讯飞语音JavaWeb语音合成解决方案

    在线语音合成 将文字信息转化为声音信息,给应用配上"嘴巴".我们提供了众多极具特色的发音人(音库)供您选择.其合成音在音色.自然度等方面的表现均接近甚至超过了人声.这种语音合成体验 ...

  3. 一百元的智能家居——Asp.Net Mvc Api+讯飞语音+Android+Arduino

    大半夜的,先说些废话提提神 如今智能家居已经不再停留在概念阶段,高大上的科技公司都已经推出了自己的部分或全套的智能家居解决方案,不过就目前的现状而言,大多还停留在展厅阶段,还没有广泛的推广起来,有人说 ...

  4. 基于讯飞语音API应用开发之——离线词典构建

    最近实习在做一个跟语音相关的项目,就在度娘上搜索了很多关于语音的API,顺藤摸瓜找到了科大讯飞,虽然度娘自家也有语音识别.语义理解这块,但感觉应该不是很好用,毕竟之前用过百度地图的API,有问题也找不 ...

  5. android用讯飞实现TTS语音合成 实现中文版

    Android系统从1.6版本开始就支持TTS(Text-To-Speech),即语音合成.但是android系统默认的TTS引擎:Pic TTS不支持中文.所以我们得安装自己的TTS引擎和语音包. ...

  6. Twitter算法面试题详解(Java实现)

    最近在网上看到一道Twitter的算法面试题,网上已经有人给出了答案,不过可能有些人没太看明白(我也未验证是否正确),现在给出一个比较好理解的答案.先看一下题目. 图1 先看看图图1.可以将方块看做砖 ...

  7. 算法实践——Twitter算法面试题(积水问题)的线性时间解法

    问题描述:在下图里我们有不同高度的挡板.这个图片由一个整数数组所代表,数组中每个数是墙的高度.下图可以表示为数组(2.5.1.2.3.4.7.2).假如开始下雨了,那么挡板之间的水坑能够装多少水(水足 ...

  8. Android讯飞语音云语音听写学习

    讯飞语音云语音听写学习         这几天两个舍友都买了iPhone 6S,玩起了"Hey, Siri",我依旧对我的Nexus 5喊着"OK,Google" ...

  9. 关于讯飞 使用android SDK出现21001错误码的分析

    21001,没有安装语音组件1.有没有使用SpeechUtility.createUtility()设置appid2.有没有将libmsc.so放到工程中,jar包有Msc.jar.Sunflower ...

随机推荐

  1. 【Oracle】删除所有表

    BEGIN FOR cur_rec IN (SELECT object_name, object_type FROM user_objects WHERE object_type IN ('TABLE ...

  2. TSPL学习笔记(1)

    扩展语法(Syntactic extensions) 扩展语法就是通过核心语法或已经定义的扩展语法创建一种新的语法模式. Scheme核心语法模式包括: 顶层定义 常量 变量 过程应用 '(quote ...

  3. 不可思议的颜色混合模式 mix-blend-mode (转)

    开本系列,谈谈一些有趣的 CSS 题目,题目类型天马行空,想到什么说什么,不仅为了拓宽一下解决问题的思路,更涉及一些容易忽视的 CSS 细节. 解题不考虑兼容性,题目天马行空,想到什么说什么,如果解题 ...

  4. xrdp完美实现Windows远程访问Ubuntu 16.04

    前言: 在很多场景下,我们需要远程连接到Linux服务器(本文是Ubuntu),传统的连接主要分为两种. 第一种:通过SSH服务(使用xshell等工具)来远程访问,编写终端命令,不过这个是无界面的, ...

  5. jenkins 使用curl调用时带文件参数

    最近在使用jenkins时,需要使用curl去调用,但原有的jenkins中需要有file参数,baidu查询之未找到. 特意记录下 curl -X POST http://localhost:808 ...

  6. http statusCode(状态码)含义

    201-206都表示服务器成功处理了请求的状态代码,说明网页可以正常访问. 200(成功) 服务器已成功处理了请求.通常,这表示服务器提供了请求的网页. 201(已创建) 请求成功且服务器已创建了新的 ...

  7. d9

    # 整体进度# python基础 ——38天 2个月# 数据库 —— 存储数据和信息用的,本质上和文件没有区别 1-2周 # —— 增删改查更方便了# 前端 —— 2周# 框架 —— django 2 ...

  8. F#周报2018年第52期

    新闻 Sudokube--使用Fable开发的数独立方体 Rust 2019年及以后的发展 视频及幻灯片 我爱F#代码 马蒂亚斯·布兰在Developer On Fire上的演讲--有条理的和有趣的 ...

  9. Apache的项目列表

    这里是Apache的项目列表,Apache Http Server也在这里 https://projects.apache.org/projects.html?name

  10. 深度学习中的batch的大小对学习效果的影响

    Batch_size参数的作用:决定了下降的方向 极端一: batch_size为全数据集(Full Batch Learning): 好处: 1.由全数据集确定的方向能够更好地代表样本总体,从而更准 ...