interview problems

光学,结构光,双目视觉,点云处理,点对特征,三维噪点过滤

Interview problem

https://blog.csdn.net/WarGames_dc/article/details/89520720

1、

interview problems_第1张图片

2、SVM

1>SVM与神经网络的关系

线性SVM的计算部分和一个单层神经网路一样,都是一个矩阵乘积。SVM的关键在于它的Hinge Loss以及maximum margin的想法,其实这个loss也可以应用在神经网络里。

对于处理非线性任务时,SVM和神经网络走了两条不同的路:神经网络通过多个隐层+激活函数的方法来实现非线性的函数;SVM则采用了kernel trick的方法。两者各有好坏,神经网络的好处是网络设计可以很灵活;SVM的理论很漂亮,但是kernel设计不是那么容易。

2>

3、SIFT

4、提升目标检测

https://zhuanlan.zhihu.com/p/21412911

5、 传统目标检测方法https://pic1.zhimg.com/80/6a4656e26e9c4ba27d1024477aaf4d0c_1440w.jpg
如上图所示,传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。

1) 区域选择

这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重影响后续特征提取和分类的速度和性能。(实际上由于受到时间复杂度的问题,滑动窗口的长宽比一般都是固定的设置几个,所以对于长宽比浮动较大的多类别目标检测,即便是滑动窗口遍历也不能得到很好的区域)

2) 特征提取

由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。(这个阶段常用的特征有SIFT、HOG等)

3) 分类器

主要有SVM, Adaboost等。

总结:传统目标检测存在的两个主要问题:一个是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。

6、RCNN目标检测流程

interview problems_第2张图片

上面的框架图清晰的给出了R-CNN的目标检测流程:

(1) 输入测试图像

(2) 利用selective search算法在图像中提取2000个左右的region proposal。

(3) 将每个region proposal缩放(warp)成227x227的大小并输入到CNN,将CNN的fc7层的输出作为特征。

(4) 将每个region proposal提取到的CNN特征输入到SVM进行分类。

7、softmax和svm的区别

SVM得到的是得分值,并不是确定的概率值,可以通过sigmoid函数把输入为任意数的得分值转化为概率值。
Softmax分类器使用交叉熵损失(cross-entropy loss

softmax函数:

8、深度学习端到端

不需要做其他额外处理,从原始数据输入到任务结果输出,整个训练和预测过程,都是在模型里完成的。除去region proposal提取阶段

9、图像超分、去噪、增强

扩大分辨率

图像中噪声的来源有许多种,这些噪声来源于图像采集、传输、压缩等各个方面。噪声的种类也各不相同,比如椒盐噪声,高斯噪声等,针对不同的噪声有不同的处理算法。

10、模型优化、加速算法

11、检测、识别、分割、跟踪、检索

12、

1、

interview problems_第3张图片

2、SVM

1>SVM与神经网络的关系

线性SVM的计算部分和一个单层神经网路一样,都是一个矩阵乘积。SVM的关键在于它的Hinge Loss以及maximum margin的想法,其实这个loss也可以应用在神经网络里。

对于处理非线性任务时,SVM和神经网络走了两条不同的路:神经网络通过多个隐层+激活函数的方法来实现非线性的函数;SVM则采用了kernel trick的方法。两者各有好坏,神经网络的好处是网络设计可以很灵活;SVM的理论很漂亮,但是kernel设计不是那么容易。

2>

3、SIFT

4、提升目标检测

https://zhuanlan.zhihu.com/p/21412911

5、 传统目标检测方法https://pic1.zhimg.com/80/6a4656e26e9c4ba27d1024477aaf4d0c_1440w.jpg
如上图所示,传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。

1) 区域选择

这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重影响后续特征提取和分类的速度和性能。(实际上由于受到时间复杂度的问题,滑动窗口的长宽比一般都是固定的设置几个,所以对于长宽比浮动较大的多类别目标检测,即便是滑动窗口遍历也不能得到很好的区域)

2) 特征提取

由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。(这个阶段常用的特征有SIFT、HOG等)

3) 分类器

主要有SVM, Adaboost等。

总结:传统目标检测存在的两个主要问题:一个是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。

6、RCNN目标检测流程

interview problems_第4张图片

上面的框架图清晰的给出了R-CNN的目标检测流程:

(1) 输入测试图像

(2) 利用selective search算法在图像中提取2000个左右的region proposal。

(3) 将每个region proposal缩放(warp)成227x227的大小并输入到CNN,将CNN的fc7层的输出作为特征。

(4) 将每个region proposal提取到的CNN特征输入到SVM进行分类。

7、softmax和svm的区别

SVM得到的是得分值,并不是确定的概率值,可以通过sigmoid函数把输入为任意数的得分值转化为概率值。
Softmax分类器使用交叉熵损失(cross-entropy loss

softmax函数:

8、深度学习端到端

不需要做其他额外处理,从原始数据输入到任务结果输出,整个训练和预测过程,都是在模型里完成的。除去region proposal提取阶段

9、图像超分、去噪、增强

图像超分可以将输入图放大一至四倍,同时基于推断出的细节保持结果图像的清晰度。

图像去噪是指减少数字图像中噪声的过程称为图像去噪。现实中的数字图像在数字化和传输过程中常受到成像设备与外部环境噪声干扰等影响,称为含噪图像或噪声图像

你可能感兴趣的:(interview problems)