讲座回顾|2021/4/7|青源美团|CVPR 2021 预讲 · 美团专场，覆盖实例分割，图像分割，表情识别，特征选择和对齐...

讲座回顾|美团青源视觉2021/4/7讲座

1、魏晓林，美团视觉智能中心负责人
2、论文：End-to-End Video Instance Segmentation with Transformers
3、论文：Feature Decomposition and Reconstruction Learning for Effective Facial Expression Recognition
4、论文：Rethinking BiSeNet For Real-time Semantic Segmentation
5、论文：Embedded Discriminative Attention Mechanism for Weakly Supervised Semantic Segmentation
6、论文：Partial Feature Selection and Alignment for Multi-Source Domain Adaptation

1、魏晓林，美团视觉智能中心负责人

魏晓林，美团视觉智能中心负责人。获美国德克萨斯A&M大学博士学位，拥有30多项国际专利。曾任Google总部高级工程师，是推动Google 3D Maps从零到一发布的核心研发人员。曾在美国硅谷创立视觉技术公司Virtroid，研发了行业领先的环境理解和三维重建系统，被Magic Leap收购。

美团在人工智能的储备很强，公司会有该方面的幸福感。
美团视觉领域线上搜索、推荐、安全风控、金融、安全识别、地图
线上线下连接紧密，无人配送、无人车机、无人零售、无人仓储，需要自动化、需要视觉技术
UGC\PGC数据的处理，如何有机展现在客户面前。如何把100亿图片变成几张展现给用户
无人车–在无人配送方面，大规模落地还需要较长的时间，需要积累人才不断迭代
通过无人车买菜达到了1W5单数
多模态学习、可解释性、对抗学习等等都有人专门跟进，前沿研究。

2、论文：End-to-End Video Instance Segmentation with Transformers

讲者 2：王钰晴

报告摘要：本文是第一个将Transformers应用于视频分割领域的方法。视频实例分割指的是同时对视频中感兴趣的物体进行分类，分割和跟踪的任务。现有的方法通常设计复杂的流程来解决此问题。本文提出了一种基于Transformers的视频实例分割新框架VisTR，该框架将视频实例分割任务视为直接端到端的并行序列解码和预测的问题。给定一个含有多帧图像的视频作为输入，VisTR直接按顺序输出视频中每个实例的掩码序列。该方法的核心是一种新的实例序列匹配和分割的策略，该策略在整个序列级别上对实例进行监督和分割。VisTR将实例分割和跟踪统一到了相似度学习的框架下，从而大大简化了流程。在没有任何trick的情况下，VisTR在所有使用单一模型的方法中获得了最佳效果，并且在YouTube-VIS数据集上实现了最快的速度。

相关工作：MaskTrack R-CNN基础上更新，增加了跟踪分支来提取实例特征
MaskProp 提出了

需要一个对多帧建模的模型。实现一个模型，能否将两个任务统一到一个框架下

左边表示输入多帧图像序列，右边为输出实例序列。
CNN进行单帧特征提取，变成图像特征序列，在持续维度上，变成多个图像特征序列，进入trans建模，输出实例序列。
多帧输入输出是有序的，对单帧来说，预测不同实例在原始状态下无序的，因此需要后处理。
后面强制输出的颜色顺序是一致的，令其不需要后处理

首先，针对每一帧图像，CNN的backbone进行特征提取。原始空间信息编码，特征序列输入到trans中。
decoder做预测的实例特征序列。
做目标检测监督，按照位置来监督，拍出来找不到ground tures的信息，先找最近ground trues作为监督。

损失函数的匹配和监督都是序列级别的。

length指的是帧数
有序无序时间顺序进行对比，有序比无序要结果更好

360个query，结果是33.3
不同帧关于同一个instance的信息可以共享，不同的query不能共享。

第一行，两个实例遮挡
2，相对位置变化
3，同类临近物体
4，不同姿态下情形

Youtube VIS数据集下的对比
利用监督来实现强制多帧中的instance顺序一致

3、论文：Feature Decomposition and Reconstruction Learning for Effective Facial Expression Recognition

讲者 3：阮德莲

报告摘要：考虑到不同类别的表情之间存在着相似性，本文认为人脸表情信息由不同表情之间的共享信息与每个表情的特定信息组成，提出了一种基于特征解构与重构学习的人脸表情识别方法。具体地，首先使用特征分解网络将基本特征分解为一系列能够感知面部动作的潜在特征，这些潜在特征有效地建模了表情中的共享信息。然后，特征重构网络分别对这一系列潜在特征向量进行特征内部和特征之间的相关性建模，从而学习表情的特有信息。实验结果表明该方法在三个室内数据集（包括 CK+、 MMI 和 Oulu¬CASIA）和两个室外数据集（包括 RAF¬DB 和 SFEW）上都有优越的性能表现。

提出，人脸表情信息包含表情部分和中性人（年龄、性别都是普遍的）图像。
借助对抗网络技术，做出生成器。

大型人脸表情受到遮挡、模糊性的问题。
在训练模型过程中抑制不确定性。
首先是self-attention 来计算权重，令不确定性权重低，不确定性高的把其分组，使低权值group更低权重，relabeling–差大于某个阈值，改ID，没过就不改label

跟上一篇文章同一批作者，解决pose和occlusion的问题
把表情化为不同的区域，确定区域特征的权值，相加得到全体的特征。
对之前局部特征进行微调，像加在一起得到comeatropy less来计算。

中间共享分支，下面是干扰分支。
干扰分支去除性别、年龄、人种等信息。
特征可以很好关注在和表情相关的区域。

去表情干扰因素，如何识别对表情因素有用的信息，怎样对弱强度信息表情的学习。

三个group，分别相同样子但是不同表情。

贡献：提出特征结构与程度学习的方法来建模表情相似性和差异性的方法。

重点在特征分解网络、特征重构网络

特征重构网络。得到M个潜在特征，对于不同表情也是共享的。要鉴别表情差异性，就需要对其重构。
用FC和seg的层来计算权重
对权重向量加权来得到特征重要性
会发现，对所有输入图像，第一个潜在特征激活值最大的，后面的几乎忽略。这个不是期待的方向。
用一个balanceloss来限制权重的学习。
对整个batch特征把权值分在不同潜在特征上面，
对于同一个表情不同输入图像的权值应该是相似的。为了消除影响，对每个表情都学习权值分布到中心的距离。

表情会与表情action相关。比如动嘴和动眼和吃惊相关。

对特征相关性计算相关性矩阵，m个特征得到m*m矩阵大小。
计算第一个和第二个之间的关系，计算第一个和第二个的距离+激活函数约束到0~1之间。
再更新潜在特征，计算所有与潜在特征相连的潜在特征的加强权和。得到F^
得到

overloss就是最后用来计算表情的特征。

不同损失函数参数对模型准确率的影响，当loss权值为0，效果会下降，
在λ值达到XX时效果最好

潜在特征太少时候，无法很好学习。太多的时候，会学到有关的，也会学到无用的。数量在9的时候效果最好。

潜在特征是什么样子的，展示一些图像。
9个group。8是皱眉，9是眉毛下坠。
与表情相关的 feature action
学习到的权值分布，红色是中性表情，相对较低
紫色是suprise，3最高
Feature action重要性更大的权值会大一些

表情特征2D可视化，baseline存在表情相似性边界难以区分，FDRL可以比较好的分开。

目前效果是最好的

对于提取人类表情特征关键在于：特征分解网络有效建模不同表情相似性，在此基础上对表情学习各自有用的，得到更显著表情特征
后续工作：特征分解是无监督的，后续加入空间之类的信息。在分解过程中，加入两步分解，在得到基础特征前，把模块分为上中下三个模块，最后潜在特征的总和，因为引入空间信息，应该可更有效学习feature action。
特征重构过程中，对局部特征建模，并未考虑全局特征，后续加入
在其他视觉领域，类别之间相似性高，用到其他视觉领域上去。

不确定性用self-attention的机制，让他自己去计算不确定性，自动降低权值
特征分解和特征重构网络是否直接相连？是直接相连，分解之后直接输入到重构网络中。

4、论文：Rethinking BiSeNet For Real-time Semantic Segmentation

讲者 4：范铭源

报告摘要：本文从减少深度模型的结构性冗余的角度重新思考了经典的快速图像分割方法BiSeNet，从而对基础网络结构和解码器部分同时进行改进。在基础网络部分，提出了一种高效的短时密集连接网络，在不降低性能的情况下，大幅度提升推理速度。在解码器部分，通过使用细节引导模块加强浅层特征来代替细节分支，进一步减少了网络的结构性冗余。该模型在快速图像分割领域取得了领先水平，在相同性能下，速度比当前最好方法快45%以上。

实施语义分割的文章

语义分割：目的，赋予像素级别标签。

从经典的BiSeNET出发，双塔模型，希望将图像语义信息和空间信息分开做提取，空间信息用了三层浅网络
两个问题：空间信息提取，没有显示引导。endocer到底充不充分。分类任务banckbone不一定适合分割任务，可能存在结构性冗余。

从分割原理出发，设计了轻量级backbone。把网络浅层特征来学习encoder

通过设计短时密集链接模块设计短时密集链接网络

设计细节引导模块，更好利用空间信息，而且不产生额外时间消耗

在三个数据集渠道最好结果

快速分割要求去除结构性冗余，分割网络关注大的感受野和浅层
输入输出是固定的M、N
11将为输入大小一半，33提供更丰富的感受野信息
倒数第一fusion不做降维
b加了两个stride，保证整体网络一致性
通过不停1/2chanel的降维，减少结构性冗余

参数量只与输入与输出相关，随block增多，减少
Block=4得到最好的性能。

模块堆叠进行网络设计
6，stdc1关注速度，stdc2关注精度，速度也不慢

SP提取空间信息特征，确实包括边缘、角点特征
缺点：自发学习，没有引导性约束，到底有没有充分表达。
额外分支有着额外的时间消耗

左边蓝色，模型推理框架，沿用CP分支，对stage3进行细节引导训练。
浅绿色只参与训练不参与模型推理，不造成时间损耗。
拉普拉斯卷积
得到边缘焦点信息的ground truth
Stage3网络浅层通过detail head进行降维，

Detail loss和dice loss一起训练，通过浅层特征得到更丰富的细节信息
b是细节分支。
加了细节引导后，浅层特征不只保留了语义信息，还保留了一些空间信息

用backbone直接替换主干，替换后对比，还是比专为分类的主干更好。

1、同样spatial分支下，主干比BiSeNET精度速度更好
2、加spitial path 速度会明显下降
3、detail guidance 细节引导模块

配置
imagenet：随机梯度下降、。。、。。、。。
精度评测方式： top-1 精度
速度测速方法

对比分割专用主干和轻量级主干。STDC1速度最快，STDC2很高的精度还保持高得FPS

cityscapes是很有说服力的数据集。
对比最近的所有方法，之前的改进型方法，我们的方法比较领先。STDC1-seg50达到250FPS，得到了最快。精度更高，速度更快
Sege75达到了非实时语义性能，还达到了接近100FPS
处在最右上角位置。方法在速度精度取得最好结果

带角标d带我们的细节引导模块、
加了之后又更多空间信息，把更小物体预测更好。

本着去除结构化冗余，在多数据取得好结果
backbone在更多方面的应用
网络对于空间边界的信息能不能应用在更多的任务上面

5、论文：Embedded Discriminative Attention Mechanism for Weakly Supervised Semantic Segmentation

讲者 5：吴桐

北理工研二

报告摘要：使用图像级标注的弱监督语义分割通常将分类网络的类别激活图（CAM）视为语义分割的伪标签。然而这些激活图通常仅仅突显局部的具有区分性的区域，而不是语义分割所要求的物体的完整区域。为了生成更加完整的类别激活图，我们提出了Embedded Discriminative Attention Mechanism (EDAM) 将类别激活图的生成直接融合进了分类网络中。具体来说，我们使用了一个Discriminative Activation (DA) 层来生成类别独立的掩膜，并通过这些掩膜提取出各个类别独立的特征。随后我们通过Collaborative Multi-Attention (CMA)机制，聚合图片内和图片间的上下文信息。我们的方法在PASCAL VOC 2012的测试集上取得了70.6%的mIoU，达到了最优性能。

弱监督语义分割
弱监督语义分割目标：右上角，需要图像级标签，比全监督像素级简单许多
弱监督seg最主流：图像及别标签

目前弱监督语义分割通用流程
给出图像及标签和图片，传统方法训练分类网络，CAM生成类别激活图，对像素点上去argmax，得到点对应类别，生成为标签

类别激活图的方法，PLG

得到初始化伪标签，需要对其细化。
找到对应的显著性图片，最为前景背景线索，进行细化

CAM结果往往只会显示最具有区分性的部分，导致CAM关注度集中在脸部，导致前景不完整，无法全覆盖物体

针对这情况，扩大CAM关注区，通过多尺度多特征生成多张CAM，通过叠加方式扩大CAM范围【1】

通过生成子类别的方式，KNN聚类，大类中分出子类，为了分出子类，关注细节区域，增强CAM效果【2】

叠加方式引入特征，细分子类方式又不够直接
想出了新的方法

EDAM–作者方法
三个大部分
1、backbone
选择resnet38
2、负责生成
3、负责聚合图片内和图之间的信息，提高准确度

K是前景类别数量，+1是为了增加一个背景类，增加背景信息
对mask的定义：代表像素点所属各个类别的概率（0~1），需要做一个归一化，L2
norm
fm和mask做乘操作，得到Fk

同一个批次中所有Fk过同一个attention

变为2D序列，符合ateention输入要求

BHW，与同一批次进行信息交换，还会和B-1HW的信息交互，不同图片进行交互
损失：b张图k类别的二分类损失进行平均

作左图目标特点是沙发，右边是壁画，导致图4和图2完全不相关，为了抑制这种情况，引入α和β

椅子不见，但是噪声区域变为前景
如果简单相乘，导致背景凸显，前景被去除

引入阈值β，点的最高置信度大于β，会让他从背景中重新凸显

如果CAM中，点最高置信度小于α，会被归为背景。
经过阈值卡控，得到最后的结果，准确度提高，噪声减少了很多

各种模块相容性试验，加入DA，CMA,DCRF的不同mIoU（语义分割指标）

DA layer效果的可视化
1行原始图片，2行CAM，3行加入DA layer，

加入阈值的效果，阿尔法、贝塔

方法的比较，ECCV2020最高67.8，我们做到了70.6
相同分割网络下全监督准确率在76左右，进一度缩小弱监督全监督的差距

验证集上的效果图。
d是自己的结果，在完整性和细节方面都更好。
DAlayer如何对应不同类生成mask，将feature直接放到 dalayer中，直接预测概率，会经过L2 lom，会被限制到（0~1）之间，那么每个类别的概率都知道了，返程到了fearture map上，得到不同类别特征图。
将一个批次同一类feature map放一起过一个map tach。不同类别聚合上下文没意义，同一个类别聚合比较有意义，更有利于准确率。
DCF是dance CAF
方法已经在github，文章还没发

6、论文：Partial Feature Selection and Alignment for Multi-Source Domain Adaptation

讲者 6：张明

电子科技大学

报告摘要：现有的多源域适应设置和方法常常忽略了两个方面的“部分性”，一是目标域的类别标签空间不完全包含于源域，二是源域特征中只有部分是与目标域高度相关的。我们提出了一个更加一般的多源域适应研究主题，名为多源部分域适应(MSPDA)，同时提出一个部分特征选择和对齐框架网络(PFSA)能够处理传统MSDA问题和新提出的MSPDA问题。框架利用源域和目标域特征之间的相似性对源域特征进行选择，得到源域特征中与目标域更相关的部分。然后通过多种对齐损失实现了类别级别上的对齐。我们的方法在MSDA和MSPDA两个场景中的分类问题上都取得了领先。

无监督预测预适应
N个源域和多个目标域，点不同颜色是不同源域的样本

存在部分性的缺失，多源域的目标类别空间可能是不一致的
体现了部分性
只有部分类别是所有源域共享的
前面的文章只考虑了整体的特征对齐，实际上存在域上差异，导致性能下降

提出多源部分域适应，
三个不同设置
1、多个源域类别空间一致，而目标域是多源域的子集
2、各个源域类别空间不一致，目标域目标类别包含在多源域类别集合的交集
3、各个源域类别空间不一致，目标域包含在多源域的并集之中。（最一般情况，作为研究对象）

贡献：
1、特征选择和xx网络
2、源域目标域特征相似新，从源域中选出更相关的部分
3、设置对其约束，来对选择特征对齐

3个子模块
灰色：CNN特征提取网络
蓝色：特征选择网络
橘色：特征对齐模块

根据源域特征和目标域特征相似性作为依据
用L1作为相似性度量，输入全链接简单网络，将网络得到的结果作为特征选择
1指维度独特征进行选择，0不选择
相当于过滤器

得到被选择后的特征，进一步提高对齐关系，选用了

高阶矩距离
通过最远化距离来对齐
高阶矩的距离、对特征选择L2的正则化

特征对齐模块
各个类别的中心，由属于这个类别的样本特征均值确立，通过分类器对目标样本生成为标签，得到熵，对置信度高的来获得类别中心
各个域类别中心更新，通过栋梁更新获得

1、希望每个域上属于这个类别的样本靠近所处的类别中心，最小化类内距离，聚类更紧凑

2、希望目标域类别中心更靠近源域，能够和源域样本分布靠近

3、各个类别中心距离要最大化

通过三个约束实现特征对齐有利于后续

最小化类别话交叉熵的值，最大化xx

特征提取器，缩小分类器值的差异
固定住特征提取器，训练分类器，预测值差异尽量的大，希望分类器从两个视角对样本进行分类，尽管两个视角
固定两个分类器，训练特征提取器，希望分类器预测值尽量靠近
希望特征提取器在不同视角结果尽量靠近，提高鲁棒性

在多源域适应和xx上进行试验
其中一个域作为目标域，其他作为源域

singel-best，单源域适应，把最好结果作为最终结果
SC，多源域组合为大源域，单元域适应
MS，

MSDA和PDA进行对比
我们的MSPDA取得领先效果

交融实验，去掉关键模块，对人任务性能的影响
去掉特征选择和特征对齐，精确度大为下降，证明模块有用

0-9数字的分布情况
红色为目标域点（样本）
在没有的情况下分散杂乱，聚类效果差
应用后分类很明确

特征选择和特征对齐框架
选择通过L1距离度量，相似性选择出更相关部分
对齐上选择对其损失来约束

文章是听讲座时的随手笔记，很多地方可能不正确还请指正。
见到比自己厉害很多的人的讲座很荣幸，收获很大

大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
还自己一个自律的人生任凭风吹雨打
心里痛苦是我最近心理的真实状态，看了好多书，听了好多专家讲座，观察了好多生活中的成功者……我在观察在思考在总结。以前的我信奉知足者常乐，如今我却相信不满是向上的车轮。生活中我发现好多人都兢兢业业历尽艰辛不辞劳苦的工作，到头来为什么还到头来一场空，没有一点成就感。是因为没有学历？是因为没有能力？还是因为没有尽心尽力？都不是。和那些有所成就的人相比，缺少的是切实可行的目标。也就是有篇文章里所说的野心吧
什么是特征检测和描述，OpenCV中常见的特征检测算法有哪些？ -Max-静- #opencv学习 opencv 算法人工智能
特征检测和描述是计算机视觉中的基本概念，它们在图像识别、对象跟踪、图像拼接等多种任务中发挥着至关重要的作用。特征检测是指识别图像中重要的特定点、区域或结构，这些特征通常具有独特性、可重复性以及对光照变化、旋转和比例变换等变化的鲁棒性。这些特征点可以用作进一步分析的参考。特征描述是基于一定的几何或者颜色信息生成特征点的特征描述符，这种描述应满足欧式空间的仿射不变性和噪声鲁棒性，并且不同特征点的特征描
大数据毕设图像识别-人脸识别与疲劳检测 - python opencv fawubio_A python 算法
文章目录0前言1课题背景2Dlib人脸识别2.1简介2.2Dlib优点2.3相关代码2.4人脸数据库2.5人脸录入加识别效果3疲劳检测算法3.1眼睛检测算法3.2打哈欠检测算法3.3点头检测算法4PyQt54.1简介4.2相关界面代码0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师
2021-02-22 d24362921410
感恩一切通过这次疫情让我们看到了中国传统文化中所讲的大爱付出，同时也提现中国共产党的英明领导。感恩新冠疫情，中国因祸得福。感恩中国共产党的英明领导。感恩白衣天使们，不惧危险，勇往直前。感恩全国人民，响应党的领导，积极配合。感恩所有为新冠疫情所付出的人们。感恩一切！学习讲座第二集的收获:通过儒释道精神，以及能量的取得，进一步说明心的重要性。一切由心起，心生万物。要有一颗大爱心，这样才能让自己成为正能
线性代数在卷积神经网络（CNN）中的体现科学的N次方人工智能线性代数 cnn 人工智能
案例：深度学习中的卷积神经网络（CNN）在图像识别领域，卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一个广泛应用深度学习模型，它在人脸识别、物体识别、医学图像分析等方面取得了显著成效。CNN中的核心操作——卷积，就是一个直接体现线性代数应用的例子。假设我们正在训练一个用于识别猫和狗的图像分类器，原始输入是一幅RGB彩色图片，可以将其视为一个高度、宽度和通道数（R
众里寻他千百度，返镤归真是真理那片绿绿的草
迎着晨风，我们走进容纳一千多人的学术交流大厅，聊听了三位大伽的精彩讲座，可谓收获满满。李镇西老师远近闻名，以前只拜读过他的文章，未见其人，今天有幸近距离聆听他的讲座《用一生的时间寻找那个让自己吃惊的“我"》，心里十分激动，因他的身体状况，故不敢去打扰他，只能用心记录他的精彩之处。从他的多个故事中我悟得做人要给自己一个近期与远期的目标，不断地超越自己，一步，再往前一步，不断挖掘自己的潜能。一个人只有
2019-06-13 徐跃斌
2019-06-13姓名～徐跃斌《六项精进》上海519期反省组学员、合肥524期努力二组志工。【日精进打卡第23天】【知～学习】1.有声背诵《六项精进》大纲至少一遍；OK2.有声背诵《大学》开篇至少一遍。；OK3.看书至少不少于1小时；ok4.学习专家讲座至少不低于1小时；ok【行～实践】一、修身：（对自己个人）1.运动不少于1小时；OK2.即兴演讲3--5分钟；OK3.写一篇读书笔记或杂文；OK
opendronemap集群搭建 Robber2000 云计算容器运维云原生
需求OpenDroneMap（ODM）是一个开源项目，旨在利用无人机采集的图像数据生成地图、模型和其他地理空间数据。它主要解决以下问题：航空摄影数据处理：ODM可以处理无人机拍摄的大量航空图像数据，通过图像处理和计算机视觉技术生成高质量的地图和模型。地图制作与更新：利用ODM，用户可以快速、成本效益地生成地图，并及时更新地理空间数据，有助于城市规划、灾害监测等领域的应用。三维建模：ODM可以生成精
Canny详解 kxg916361108 计算机视觉图像处理人工智能
Canny边缘检测是一种经典的图像处理技术，被广泛应用于计算机视觉和图像处理领域。它由JohnF.Canny在1986年提出，是一种多阶段的边缘检测算法，具有高精度和低错误率的特点。Canny边缘检测的步骤：高斯滤波（GaussianBlur）：Canny边缘检测首先对图像进行高斯平滑处理，以减少图像中的噪声。高斯滤波器将图像中的每个像素与周围像素进行加权平均，从而模糊图像并减少噪声。计算图像梯度
AI人工智能小程序系统开发修行者对666 安卓gradle android adb
开发AI人工智能小程序系统需要以下步骤：1.确定需求：了解客户对人工智能小程序的期望，并分析系统的实际应用场景。2.设计架构：选择合适的技术框架和人工智能算法，进行小程序系统架构的设计。3.数据采集和处理：收集必要的数据，并进行预处理和特征提取，为人工智能算法提供支持。4.开发算法模型：根据需求和设计，开发相应的算法模型，如自然语言处理、图像识别等。5.实现小程序功能：将算法模型集成到小程序系统中
樊登读书《不管教的勇气》常想一二SSZ
昨晚带儿子在饭店吃饭，他的玩具忘那了。早上儿子起的早，我们两个取回玩具。直接去了图书馆。儿子忙着在找小猪佩奇的书，这时候图书管理员说，电子阅览室有一场视频讲座有兴趣的可以去听听。儿子带着借好的书我们一起去了。原来是樊登读书推荐的新书《不管教的勇气》。内容真好，简单摘录如下：批评不可能改变孩子孩子的一生都在做一件事情希望父母关注他人和人的发展节奏不一样青春期的孩子叛逆，大部分因为家里有一个爱唠叨的妈
软件杯深度学习 opencv python 公式识别(图像识别机器视觉) Mr.D学长 python java
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
软件杯基于图像识别的跌倒检测算法 Mr.D学长 python java
前言优质竞赛项目系列，今天要分享的是基于图像识别的跌倒检测算法该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate背景和意义在美国，每年在65岁以上老人中，平均每3人中就有1人发生意外跌倒，每年大约有9500位老年人死于旅行途中或跌倒；而平均年龄在65岁至69岁之间的人每200次跌倒中就
MATLAB图像拼接算法及实现程序员小溪算法 matlab 计算机视觉 MATLAB 人工智能
图像拼接算法及实现（一）论文关键词：图像拼接图像配准图像融合全景图论文摘要：图像拼接(imagemosaic)技术是将一组相互间重叠部分的图像序列进行空间匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计算机图形学等领域有着广泛的应用价值。一般来说,图像拼接的过程由图像获取,图像配准,图像
深度学习，人工智能总结 qq_14827935 人工智能深度学习
1，入门建议少看书，多看csdn上帖子总结（主要就是BP神经网络，CNN，rnn），建立宏观的概念和主要框架，书可以作为进阶补充作为工具书查阅。2,目前的神经网络还处于前牛顿时代，就是实践中图像识别效果很好，但是原理不太清楚3，现在的人工智能有点像通信行业2g时代，从2012年alexnet到openai的chatgpt，未来还有很长的发展潜力。丰田不是汽车的发明者，但现在销量最高。oepnai在
我的小天使师怡
因为忙这次讲座，汐汐好几天没有回家住了，今晚才接回来。晚饭后，我抱她在怀里一起听音乐，期间，她都没有动，也没有发出声音，只是静静的听，时不时跟着哼唱，我们就这样抱在一起听了好长时间，哇，真是好享受。这个过程，我也很享受，心很静很静，我对她说：妈妈怎么这么爱你呢？她回应：我也好爱妈妈。我：不管你变成什么样子，不管你做了什么事情，就算妈妈生气了或者你做错事了，妈妈依然很爱很爱你。她紧紧的抱了抱我，用小
2018-09-29 jw8868
血透突发事件技术培训技术培训包括：1周围环境的熟悉2、疏散通道的熟悉；3、应急疏散程序4、消防器材的使用，燃烧的分类，灭火的注意事项（可联系消防队开讲座）；5、报警电话的拨打；6、电源控制器的位置及切断方法；7、排烟雾设备的启动紧急情况下所需要的支持文件可能包括：应急电话通讯录；建筑物与现场和风险情况地图；资源清单等。应该制定应急疏散程序并明确线路，关键工作的终止或运行程序，医护人员及患者疏散后的
关于教学模式的思考 248广州刘在丽
暑假过大半，读了多本有质量的书（含教育哲学、教学原理、人文社科、家庭教育等），听了多场讲座（含新课标解读、新课标视角下的教学导向、名师读书会等），将所思所想对照我所知的某单位目前追随生本教育模式的课改状态，我只想问：能否不要再膜拜什么教学模式了？一位作家曾说：“在阅读经典作品时，质疑和批判经典作品，是对经典最好的致敬。”那么对于某种教学模式，我们盲目崇拜有必要吗？一所学校有不同年级，一个年级有不同
AI图像识别算法助力安全生产*提升风险监测效率---豌豆云豌豆云人工智能安全
2024年开年来安全生产事故频发，工厂爆炸、工程坍陷等重大安全生产事故的发生再次为我们敲响了警钟。安全生产是企业发展的生命线，而传统的安全监测手段存在盲区和延迟，难以及时发现和应对潜在风险。AI图像识别算法通过利用先进的计算机视觉和深度学习技术，能够有效提高风险监测效率，保障企业的安全生产。AI图像识别算法助力安全生产AI图像识别算法通常部署在本地服务器或边缘服务器，通过分析前端监控摄像头、无人机
互加成长——我们不一样通化410李秀杰
炎炎夏日，能在兴成长互加计划沐浴新课改的洗礼，聆听邱校长的讲座，观摩四川宜宾凉水井中学的小老师带你走进全新课堂，在体育中育心育德……带给我太多的思考，太多的感动。让我重新审视了自己在教育活动过程中的做法，我还有很多要学习和改进的地方。首先我要改变观念。敬业精神与科学的教学方法相结合。必定是成功的保障。我是通化县二密镇葫芦套学校的老师。我校学生少70个，老师26个，看比例老师很多，但其实真正干工作的
深入了解OpenCVSharp中常见的图像处理功能仰望大佬007 图像处理 opencv 计算机视觉 c#
深入了解OpenCVSharp中常见的图像处理功能前言1.图像加载与保存2.图像基本操作3.图像滤波4.边缘检测5.图像分割6.特征检测与描述子7.目标识别与跟踪8.图像融合与拼接9.形状匹配与模板匹配10.颜色空间转换与直方图11.图像转换与绘制12.图像分类与机器学习13.高级图像处理算法14.GPU加速与并行计算前言OpenCVSharp是C#语言中用于图像处理和计算机视觉的开源库，它提供了
线性回归（1） zidea
MachineLearninginMarketing感谢李宏毅《回归-案例研究》部分内容为听取李宏毅老师讲座的笔记，也融入了自己对机器学习理解，个人推荐李宏毅老师的机器学习系列课程，尤其对于初学者强烈推荐。课程设计相对其他课程要容易理解。在机器学习中算法通常分为回归和分类两种，今天我们探讨什么线性回归。以及如何设计一个线性回归模型。什么回归简单理解通过数据最终预测出来一个值。回归问题的实例就是找到
【计算机视觉面经四】基于深度学习的目标检测算法面试必备（RCNN~YOLOv5）旅途中的宽~ 计算机视觉面经总结计算机视觉深度学习目标检测 YOLO RCNN
文章目录一、前言二、两阶段目标检测算法2.1RCNN2.2Fast-RCNN2.3FasterR-CNN三、多阶段目标检测算法3.1CascadeR-CNN四、单阶段目标检测算法4.1编码方式4.1.1基于中心坐标4.1.1.1方案14.1.1.2方案24.1.1.3方案34.2YOLOv14.3SSD4.4YOLOv24.5RetinaNet4.6YOLOv34.7YOLOv44.8YOLOv5
挑战杯基于深度学习的人脸性别年龄识别 - 图像识别 opencv laafeer python
文章目录0前言1课题描述2实现效果3算法实现原理3.1数据集3.2深度学习识别算法3.3特征提取主干网络3.4总体实现流程4具体实现4.1预训练数据格式4.2部分实现代码5最后0前言优质竞赛项目系列，今天要分享的是毕业设计人脸性别年龄识别系统-图像识别opencv该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：3分更多
听《生涯规划—激发孩子学习的内驱力》有感 Z的教育杂说
在席博士的讲座中我又一次强化了这一概念，即教育是自我教育，教育等于目标+动力+方法。这个公式很多人都知道，我们老师也在不遗余力的培养学生的目标意识，但到了实际操作的时候却很不理想。就老师来说，目标的培养究竟应该怎样树立？从席博士的讲座中，我认识到了关键是让学生自己找到目标，这个获得目标感的过程非常重要。在实际教学中，班主任通常的做法是让学生填写目标卡，在自己的卡片里找到自己的目标看起来很滑稽，因为
OpenCV：开源计算机视觉的魔力之门 mikes zhang 计算机视觉
在当今这个信息爆炸的时代，图像和视频已经成为我们获取和传递信息的主要方式之一。从社交媒体上的照片分享，到安防监控、自动驾驶等领域的图像识别与处理，计算机视觉技术正日益改变着我们的生活。而在这场技术革命中，OpenCV（OpenSourceComputerVisionLibrary）这一开源计算机视觉库扮演着举足轻重的角色。本文将带你走进OpenCV的世界，一探其究竟。一、OpenCV简介OpenC
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交