recognition 第21页

简要介绍 | 走向自然的身份认证：步态识别技术简介

走向自然的身份认证：步态识别技术简介GaitRecognitionBasedonDeepLearning:ASurvey|ACMComputingSurveys背景介绍在诸多生物特征识别技术中，步态识别作为一种基于人体运动的识别技术

R.X. NLOS·2023-07-28 02:45

An image is worth 16 x 16 words: transformers for image recognition at a scale

（可能）是第一次大规模的采用纯transformer做cv任务的文章，验证了transformer在cv领域的有效性，大大的挖坑之作。ViT的网络结构其实很简单，就是一个普通的transformer结构，只不过把图像分成了16x16个patch，加上位置编码作为序列化数据输入transformer中。但是技术细节比较多，实验也做的非常充分，是一篇需要仔细阅读细节部分的文章。实验结果其实很有意思，V

nowherespyfly·2023-07-28 00:35

【python】OCR

先看看百度百科对OCR的定义：OCR（OpticalCharacterRecognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程

bryant_meng·2023-07-28 00:18

使用tensorflow和densenet神经网路实现语谱图声纹识别,即说话人识别。

代码地址码云：https://gitee.com/lizhigong/VoiceprintRecognition

zhigongjz·2023-07-27 21:52

OCR的工作原理与应用场景

OCR光学符号识别光学符号识别，即OCR(OpticalCharacterRecognition)，是计算机视觉领域的一个重要分支，主要用于将图像中的文本转换为机器可读的形式。

澳鹏Appen·2023-07-27 12:37

利用百度API进行植物识别

-百度AI开放平台百度AI植物识别,支持识别超过2万种通用植物和近8千种花卉，接口返回植物的名称，并获取百科信息，适用于拍照识图类APP中https://ai.baidu.com/tech/imagerecognition

Wcowin·2023-07-27 08:32

Advanced Machine Learning

Studyofalgorithmsthat•improvetheirperformance•atsometask•withexperienceApplicationSpeechrecognition,NaturallanguageprocessingComputervisionMedicaloutcomesanalysisComputationalbio

薛定喵喵喵·2023-07-26 18:12

SVTR: 使用单一视觉模型进行场景文本识别【论文翻译】

版权:本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连声明:作为全网AI领域干货最多的博主之一，❤️不负光阴不负卿❤️文章目录SVTR:SceneTextRecognitionwithaSingleVisualModelAbstract1Introduction

墨理学AI·2023-07-26 17:59

读yolo_slowfast代码

https://github.com/wufan-tb/yolo_slowfast这个只是应用，没有训练、评估，所以简单一些Namespace(input='D:/wyh/Pytorch-Action-Recognition-master

Mighty_Crane·2023-07-26 15:04

DVT：华为提出动态级联Vision Transformer，性能杠杠的 | NeurIPS 2021

从实验结果来看，性能提升不错来源：晓飞的算法工程笔记公众号论文:NotAllImagesareWorth16x16Words:DynamicTransformersforEfficientImageRecognition

VincentTeddy·2023-07-26 08:07

kaggle新赛：Bengali.AI 语音识别大赛赛题解析

赛题名称：Bengali.AISpeechRecognition赛题链接：https://www.kaggle.com/competitions/bengaliai-speech赛题背景竞赛主办方Bengali.AI

深度之眼·2023-07-26 06:38

深度学习论文分享（三）Look More but Care Less in Video Recognition（NIPS2022）

深度学习论文分享（三）LookMorebutCareLessinVideoRecognition（NIPS2022）前言Abstract1.Introduction2RelatedWork2.1VideoRecognition2.2RedundancyinData

澪mio·2023-07-25 20:58

一文读懂人脸识别1：1/1：N模式

什么是人脸识别人脸识别(FacialRecognition)，即通过视频采集设备获取用户的面部图像，再利用核心的算法对其脸

美仙科技·2023-07-25 17:54

Android开发：通过Tesseract第三方库实现OCR

OCR(OpticalCharacterRecognition，光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程

飞机火车巴雷特·2023-07-25 14:50

GAN在SAR图像仿真中的应用

1.TargetRecognitionofSARImageBasedonCN-GANandCNNinComplexEnvironment文章来源：https://ieeexplore.ieee.org/

Nabhan·2023-07-25 13:43

【Dlib】使用dlib_face_recognition_resnet_model_v1.dat无法实现微调fune-tuning

1、问题描述dlib官方使用resnet训练人脸识别，训练了300万的数据，网络参数保存在dlib_face_recognition_resnet_model_v1.dat中。

郭老二·2023-07-24 23:35

基于whisper的语音转文字（视频字幕）

在寻找了很多的开源仓库，发现了openai早期发布的whisper原仓库链接如下openai/whisper:RobustSpeechRecognitionviaLarge-ScaleWeakSupervision

Helloorld_1·2023-07-24 22:57

C# Yolo+Onnx 号牌识别

platehttps://github.com/ivilson/Yolov7nethttps://github.com/we0091234/Chinese_license_plate_detection_recognition

天天代码码天天·2023-07-24 19:21

第53步深度学习图像识别：Bottleneck Transformer建模（Pytorch）

BottleneckTransformer"BottleneckTransformer"（简称"BotNet"）是一种深度学习模型，在2021年由Google的研究人员在论文"BottleneckTransformersforVisualRecognition

Jet4505·2023-07-24 18:44

图片验证码识别

将图片翻译成文字一般被称为光学文字识别（OpticalCharacterRecognition），简写为OCR。实现OCR的库不是很多，特别是开源的。

洛庚·2023-07-24 11:49

纯生信分析：9+免疫细胞特有marker 肿瘤分析套路

ComputationalrecognitionoflncRNAsignatureoftumor-infiltratingBlymphocyte

音十千寻·2023-07-23 13:41

浅谈OCR之Tesseract

光学字符识别(OCR,OpticalCharacterRecognition)是指对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。

weixin_30360497·2023-07-23 05:25

利用python实现简单的人脸识别

文章目录一，什么是face_recognition?二，编写步骤#前言一，什么是face_recognition?

汝熊·2023-07-22 21:46

LEADTOOLS adds Python support

LEADTOOLSaddsPythonsupportPythondeveloperscannowutilizeLEADTOOLStechnologiesincludingRecognition,MultimediaandImaging.July18,2023

sdk大全·2023-07-22 11:54

CosFace: Large Margin Cosine Loss for Deep Face Recognition - 人脸识别

PapernameCosFace:LargeMarginCosineLossforDeepFaceRecognitionPaperReadingNoteURL:https://arxiv.org/pdf

kebijuelun·2023-07-21 22:15

ArcFace: Additive Angular Margin Loss for Deep Face Recognition - 人脸识别

PapernameArcFace:AdditiveAngularMarginLossforDeepFaceRecognitionPaperReadingNoteURL:https://arxiv.org

kebijuelun·2023-07-21 22:15

欢喜文艺复兴50画（19）｜皮耶罗·德拉·弗朗切斯卡，《真十字架传奇》（下）

7.真十字架的发现与识别FindingandRecognitionoftheTrueCross犹大说出那座藏着三个加略山十字架圣殿后，海伦娜下令摧毁神庙，找到三个十字架。

游世欢喜LatteSunset·2023-07-21 18:23

RNN

RNNmodelRNNcellRNNovermultipletime-stepsRNN资源整理：awesome-rnnGitHub上的RNN项目：AwesomeTensorflowImplementationsLanguageModelingSpeechRecognitionMachineTranslationConversationModeling

maverick7·2023-07-21 04:32

2016Deep Learning for Magnification Independent Breast Cancer Histopathology Image Classification

201623rdInternationalConferenceonPatternRecognition(ICPR)CancúnCenter,Cancún,México,December4-8,2016NeslihanBayramoglu

柒82·2023-07-20 11:34

对比学习论文-系列4

ContrastiveLearningfromUnpairedMedicalImagesandText目标问题来源模型架构SupervisedPrototypicalContrastiveLearningforEmotionRecognitioninConversationPrototypicalContrastiveLearningCurriculumStrategy

YingJingh·2023-07-20 11:45

1 dispose verification code picture

'''1Verificationcoderecognitiontechnologypython-tesseract2add_cookie()'''fromseleniumimportwebdriverdriver

初见_0308·2023-07-20 01:14

【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递（7 月 17 日论文合集）

旅途中的宽~·2023-07-19 12:33

带你读论文系列之计算机视觉--ResNet和ResNeXt

DeepResidualLearningforImageRecognitionhttps://arxiv.org/abs/1512.03385代码：pytorch：https://github.c

进阶媛小吴·2023-07-19 08:24

SPP、SPPF 、 SimSPPF 、 ASPP、 SPPCSPC详解

1.1SPP（SpatialPyramidPooling）SPP模块是何凯大神在2015年的论文《SpatialPyramidPoolinginDeepConvolutionNetworksforVisualRecognition

@BangBang·2023-07-19 06:20

sodner 论文复现

论文：ASpan-BasedModelforJointOverlappedandDiscontinuousNamedEntityRecognition_pepsi_w的博客-CSDN博客因为搞这个复现的环境弄了很久才跑通

pepsi_w·2023-07-18 16:49

NER命名实体识别实战

命名实体识别（NamedEntityRecognition，NER）是自然语言处理领域的一项关键任务，旨在从文本中识别和分类特定的命名实体，如人名、地名、组织机构名等。

会害羞的杨卓越·2023-07-18 09:11

Cross-person activity recognition using reduced kernel extreme learning machine (译)

Abstract：对于发展健康领域，个性化推荐领域，使用手机内嵌入的加速度传感器来进行活动识别已经变得非常重要了。但是，不同用户产生的不同的加速度数据相差非常大。对于一个人进行训练出的模型在另外一个人上面表现就可能变得非常差。为了解决这个问题，我们提出了一个快速而又准确的方法，也就是TransRKELM(TransferlearningReducedKernelExtremeLearningMac

LiuXiaozeeee·2023-07-17 22:02

Table Recognition Metric: 表格识别算法评测工具包及相关评测基准数据集

TableRecognitionMetric该库用于计算TEDS指标，用来评测表格识别算法效果。可与魔搭-表格识别测试集配套使用。

Liekkas Kono·2023-07-17 19:38

辅助驾驶功能开发-功能规范篇(21)-2-XP行泊一体方案功能规范

OuXiang20231314XPilotSafety主动安全系统五、交通标识识别（TrafficSignRecognition）-产品定义通过摄像头和地图信息实现根据车辆当前道路前方标识的提示；交通标识识别是

保持理智+相信未来·2023-07-17 14:10

语音情感识别技术

aipersonal/Speech-Emotion-Recognition:SpeechemotionrecognitionusingLSTM,SVMandMLP|语音情感识别(github.com)

LANWENBING·2023-07-17 14:54

Deep Residual Learning for Image Recognition

2015-ResNet关键词：residualconnectionCV论文：一般在第一页就放一个很“好看”的图从图可以得到的结论：深的网络更难训练（不仅因为过拟合，因为训练时误差都很难降低）网络结构图1*1卷积作用：改变通道数，提出维度匹配方法：1）补零；2）投影projection（1*1卷积）

-小透明-·2023-07-17 10:29

自然语言处理(NLP)-下游任务&数据集：语言模型、机器翻译、问答、文本分类、情感分析、文本生成、自动摘要、命名实体识别、阅读理解、自然语言推理、信息提取、词性标注、共指消解、实体链接【＞200项】

TextClassification【文本分类】SentimentAnalysis【情感分析】TextGeneration【文本生成】TextSummarization【自动摘要】NamedEntityRecognition

u013250861·2023-07-17 05:41

Tesseract-OCR 安装、中文识别与训练字库

简介OCR(OpticalCharacterRecognition)：光学字符识别，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程

搞工程的程序员·2023-07-16 22:44

基于静态和动态特征融合的语音情感识别层次网络

题目HierarchicalNetworkbasedontheFusionofStaticandDynamicFeaturesforSpeechEmotionRecognition时间2021年期刊\会议

uuu_柚子·2023-07-16 13:36

Multimodal emotion recognition with capsule graph convolutional based representation fusion

题目Multimodalemotionrecognitionwithcapsulegraphconvolutionalbasedrepresentationfusion译题基于胶囊图卷积表示融合的多模态情感识别时间