E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
recognition
简要介绍 | 走向自然的身份认证:步态识别技术简介
走向自然的身份认证:步态识别技术简介Gait
Recognition
BasedonDeepLearning:ASurvey|ACMComputingSurveys背景介绍在诸多生物特征识别技术中,步态识别作为一种基于人体运动的识别技术
R.X. NLOS
·
2023-07-28 02:45
#
Deep
Learning
#
简要介绍(水)
步态识别
身份认证
An image is worth 16 x 16 words: transformers for image
recognition
at a scale
(可能)是第一次大规模的采用纯transformer做cv任务的文章,验证了transformer在cv领域的有效性,大大的挖坑之作。ViT的网络结构其实很简单,就是一个普通的transformer结构,只不过把图像分成了16x16个patch,加上位置编码作为序列化数据输入transformer中。但是技术细节比较多,实验也做的非常充分,是一篇需要仔细阅读细节部分的文章。实验结果其实很有意思,V
nowherespyfly
·
2023-07-28 00:35
【python】OCR
先看看百度百科对OCR的定义:OCR(OpticalCharacter
Recognition
,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程
bryant_meng
·
2023-07-28 00:18
Python
python
开发语言
后端
使用tensorflow和densenet神经网路实现语谱图声纹识别,即说话人识别。
代码地址码云:https://gitee.com/lizhigong/Voiceprint
Recognition
zhigongjz
·
2023-07-27 21:52
神经网络
CNN卷积
Tensorflow
Densenet
语谱图
声纹识别
OCR的工作原理与应用场景
OCR光学符号识别光学符号识别,即OCR(OpticalCharacter
Recognition
),是计算机视觉领域的一个重要分支,主要用于将图像中的文本转换为机器可读的形式。
澳鹏Appen
·
2023-07-27 12:37
人工智能与机器学习
训练数据
人工智能
机器学习
ocr
利用百度API进行植物识别
-百度AI开放平台百度AI植物识别,支持识别超过2万种通用植物和近8千种花卉,接口返回植物的名称,并获取百科信息,适用于拍照识图类APP中https://ai.baidu.com/tech/image
recognition
Wcowin
·
2023-07-27 08:32
Python
技术分享
python
开发语言
Advanced Machine Learning
Studyofalgorithmsthat•improvetheirperformance•atsometask•withexperienceApplicationSpeech
recognition
,NaturallanguageprocessingComputervisionMedicaloutcomesanalysisComputationalbio
薛定喵喵喵
·
2023-07-26 18:12
SVTR: 使用单一视觉模型进行场景文本识别【论文翻译】
版权:本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连声明:作为全网AI领域干货最多的博主之一,❤️不负光阴不负卿❤️文章目录SVTR:SceneText
Recognition
withaSingleVisualModelAbstract1Introduction
墨理学AI
·
2023-07-26 17:59
顶会论文翻译
文本识别
计算机视觉
顶会论文翻译
读yolo_slowfast代码
https://github.com/wufan-tb/yolo_slowfast这个只是应用,没有训练、评估,所以简单一些Namespace(input='D:/wyh/Pytorch-Action-
Recognition
-master
Mighty_Crane
·
2023-07-26 15:04
YOLO
DVT:华为提出动态级联Vision Transformer,性能杠杠的 | NeurIPS 2021
从实验结果来看,性能提升不错来源:晓飞的算法工程笔记公众号论文:NotAllImagesareWorth16x16Words:DynamicTransformersforEfficientImage
Recognition
VincentTeddy
·
2023-07-26 08:07
kaggle新赛:Bengali.AI 语音识别大赛赛题解析
赛题名称:Bengali.AISpeech
Recognition
赛题链接:https://www.kaggle.com/competitions/bengaliai-speech赛题背景竞赛主办方Bengali.AI
深度之眼
·
2023-07-26 06:38
kaggle
比赛
人工智能干货
人工智能
kaggle
语音识别
深度学习论文分享(三)Look More but Care Less in Video
Recognition
(NIPS2022)
深度学习论文分享(三)LookMorebutCareLessinVideo
Recognition
(NIPS2022)前言Abstract1.Introduction2RelatedWork2.1Video
Recognition
2.2RedundancyinData
澪mio
·
2023-07-25 20:58
深度学习论文分享
深度学习
人工智能
神经网络
一文读懂人脸识别1:1/1:N模式
什么是人脸识别人脸识别(Facial
Recognition
),即通过视频采集设备获取用户的面部图像,再利用核心的算法对其脸
美仙科技
·
2023-07-25 17:54
Android开发:通过Tesseract第三方库实现OCR
OCR(OpticalCharacter
Recognition
,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程
飞机火车巴雷特
·
2023-07-25 14:50
Android
OCR
Tesseract
GAN在SAR图像仿真中的应用
1.Target
Recognition
ofSARImageBasedonCN-GANandCNNinComplexEnvironment文章来源:https://ieeexplore.ieee.org/
Nabhan
·
2023-07-25 13:43
生成对抗网络
计算机视觉
深度学习
经验分享
【Dlib】使用dlib_face_
recognition
_resnet_model_v1.dat无法实现微调fune-tuning
1、问题描述dlib官方使用resnet训练人脸识别,训练了300万的数据,网络参数保存在dlib_face_
recognition
_resnet_model_v1.dat中。
郭老二
·
2023-07-24 23:35
AI
C++
人脸识别
基于whisper的语音转文字(视频字幕)
在寻找了很多的开源仓库,发现了openai早期发布的whisper原仓库链接如下openai/whisper:RobustSpeech
Recognition
viaLarge-ScaleWeakSupervision
Helloorld_1
·
2023-07-24 22:57
whisper
C# Yolo+Onnx 号牌识别
platehttps://github.com/ivilson/Yolov7nethttps://github.com/we0091234/Chinese_license_plate_detection_
recognition
天天代码码天天
·
2023-07-24 19:21
OpenCV
C#
AI
YOLO
C#yolo号牌识别
第53步 深度学习图像识别:Bottleneck Transformer建模(Pytorch)
BottleneckTransformer"BottleneckTransformer"(简称"BotNet")是一种深度学习模型,在2021年由Google的研究人员在论文"BottleneckTransformersforVisual
Recognition
Jet4505
·
2023-07-24 18:44
《100
Steps
to
Get
ML》—JET学习笔记
深度学习
transformer
pytorch
BotNet
人工智能
图像识别
图片验证码识别
将图片翻译成文字一般被称为光学文字识别(OpticalCharacter
Recognition
),简写为OCR。实现OCR的库不是很多,特别是开源的。
洛庚
·
2023-07-24 11:49
纯生信分析:9+免疫细胞特有marker 肿瘤分析套路
Computational
recognition
oflncRNAsignatureoftumor-infiltratingBlymphocyte
音十千寻
·
2023-07-23 13:41
浅谈OCR之Tesseract
光学字符识别(OCR,OpticalCharacter
Recognition
)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
weixin_30360497
·
2023-07-23 05:25
人工智能
操作系统
利用python实现简单的人脸识别
文章目录一,什么是face_
recognition
?二,编写步骤#前言一,什么是face_
recognition
?
汝熊
·
2023-07-22 21:46
LEADTOOLS adds Python support
LEADTOOLSaddsPythonsupportPythondeveloperscannowutilizeLEADTOOLStechnologiesincluding
Recognition
,MultimediaandImaging.July18,2023
sdk大全
·
2023-07-22 11:54
LEADTOOLS破解版
python
LEADTOOLS
CosFace: Large Margin Cosine Loss for Deep Face
Recognition
- 人脸识别
PapernameCosFace:LargeMarginCosineLossforDeepFace
Recognition
PaperReadingNoteURL:https://arxiv.org/pdf
kebijuelun
·
2023-07-21 22:15
paper_reading
人工智能
人脸识别
机器学习
计算机视觉
ArcFace: Additive Angular Margin Loss for Deep Face
Recognition
- 人脸识别
PapernameArcFace:AdditiveAngularMarginLossforDeepFace
Recognition
PaperReadingNoteURL:https://arxiv.org
kebijuelun
·
2023-07-21 22:15
paper_reading
人脸识别
计算机视觉
人工智能
欢喜文艺复兴50画(19)|皮耶罗·德拉·弗朗切斯卡,《真十字架传奇》(下)
7.真十字架的发现与识别Findingand
Recognition
oftheTrueCross犹大说出那座藏着三个加略山十字架圣殿后,海伦娜下令摧毁神庙,找到三个十字架。
游世欢喜LatteSunset
·
2023-07-21 18:23
RNN
RNNmodelRNNcellRNNovermultipletime-stepsRNN资源整理:awesome-rnnGitHub上的RNN项目:AwesomeTensorflowImplementationsLanguageModelingSpeech
Recognition
MachineTranslationConversationModeling
maverick7
·
2023-07-21 04:32
2016Deep Learning for Magnification Independent Breast Cancer Histopathology Image Classification
201623rdInternationalConferenceonPattern
Recognition
(ICPR)CancúnCenter,Cancún,México,December4-8,2016NeslihanBayramoglu
柒82
·
2023-07-20 11:34
对比学习论文-系列4
ContrastiveLearningfromUnpairedMedicalImagesandText目标问题来源模型架构SupervisedPrototypicalContrastiveLearningforEmotion
Recognition
inConversationPrototypicalContrastiveLearningCurriculumStrategy
YingJingh
·
2023-07-20 11:45
学习
1 dispose verification code picture
'''1Verificationcode
recognition
technologypython-tesseract2add_cookie()'''fromseleniumimportwebdriverdriver
初见_0308
·
2023-07-20 01:14
【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(7 月 17 日论文合集)
文章目录一、分类|识别相关(11篇)1.1MultimodalDistillationforEgocentricAction
Recognition
1.2Dual-QueryMultipleInstanceLearningforDynamicMeta-EmbeddingbasedTumorClassification1.3InteractiveSpatiotemporalTokenAttention
旅途中的宽~
·
2023-07-19 12:33
计算机视觉arxiv最新论文
计算机视觉
分类
人工智能
带你读论文系列之计算机视觉--ResNet和ResNeXt
DeepResidualLearningforImage
Recognition
https://arxiv.org/abs/1512.03385代码:pytorch:https://github.c
进阶媛小吴
·
2023-07-19 08:24
系列论文
机器学习
深度学习
神经网络
人工智能
SPP、SPPF 、 SimSPPF 、 ASPP、 SPPCSPC详解
1.1SPP(SpatialPyramidPooling)SPP模块是何凯大神在2015年的论文《SpatialPyramidPoolinginDeepConvolutionNetworksforVisual
Recognition
@BangBang
·
2023-07-19 06:20
深度学习
面试
计算机视觉
pytorch
深度学习
sodner 论文复现
论文:ASpan-BasedModelforJointOverlappedandDiscontinuousNamedEntity
Recognition
_pepsi_w的博客-CSDN博客因为搞这个复现的环境弄了很久才跑通
pepsi_w
·
2023-07-18 16:49
乱七八糟
NER
论文笔记
NER命名实体识别实战
命名实体识别(NamedEntity
Recognition
,NER)是自然语言处理领域的一项关键任务,旨在从文本中识别和分类特定的命名实体,如人名、地名、组织机构名等。
会害羞的杨卓越
·
2023-07-18 09:11
源码解读
命名体识别
语言模型
pytorch
transformer
自然语言处理
Cross-person activity
recognition
using reduced kernel extreme learning machine (译)
Abstract:对于发展健康领域,个性化推荐领域,使用手机内嵌入的加速度传感器来进行活动识别已经变得非常重要了。但是,不同用户产生的不同的加速度数据相差非常大。对于一个人进行训练出的模型在另外一个人上面表现就可能变得非常差。为了解决这个问题,我们提出了一个快速而又准确的方法,也就是TransRKELM(TransferlearningReducedKernelExtremeLearningMac
LiuXiaozeeee
·
2023-07-17 22:02
AR
Table
Recognition
Metric: 表格识别算法评测工具包及相关评测基准数据集
Table
Recognition
Metric该库用于计算TEDS指标,用来评测表格识别算法效果。可与魔搭-表格识别测试集配套使用。
Liekkas Kono
·
2023-07-17 19:38
RapidAI
工具
算法
表格识别
ocr
辅助驾驶功能开发-功能规范篇(21)-2-XP行泊一体方案功能规范
OuXiang20231314XPilotSafety主动安全系统五、交通标识识别(TrafficSign
Recognition
)-产品定义通过摄像头和地图信息实现根据车辆当前道路前方标识的提示;交通标识识别是
保持理智+相信未来
·
2023-07-17 14:10
#
功能规范篇-预警+控制类
人工智能
自动驾驶
语音情感识别技术
aipersonal/Speech-Emotion-
Recognition
:Speechemotion
recognition
usingLSTM,SVMandMLP|语音情感识别(github.com)
LANWENBING
·
2023-07-17 14:54
语音识别
Deep Residual Learning for Image
Recognition
2015-ResNet关键词:residualconnectionCV论文:一般在第一页就放一个很“好看”的图从图可以得到的结论:深的网络更难训练(不仅因为过拟合,因为训练时误差都很难降低)网络结构图1*1卷积作用:改变通道数,提出维度匹配方法:1)补零;2)投影projection(1*1卷积)
-小透明-
·
2023-07-17 10:29
AI论文精读--李沐
人工智能
自然语言处理(NLP)-下游任务&数据集:语言模型、机器翻译、问答、文本分类、情感分析、文本生成、自动摘要、命名实体识别、阅读理解、自然语言推理、信息提取、词性标注、共指消解、实体链接【>200项】
TextClassification【文本分类】SentimentAnalysis【情感分析】TextGeneration【文本生成】TextSummarization【自动摘要】NamedEntity
Recognition
u013250861
·
2023-07-17 05:41
自然语言处理/NLP
人工智能
自然语言处理
NLP
Transformer
Tesseract-OCR 安装、中文识别与训练字库
简介OCR(OpticalCharacter
Recognition
):光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程
搞工程的程序员
·
2023-07-16 22:44
pytorch
tensorflow
机器学习
神经网络
基于静态和动态特征融合的语音情感识别层次网络
题目HierarchicalNetworkbasedontheFusionofStaticandDynamicFeaturesforSpeechEmotion
Recognition
时间2021年期刊\会议
uuu_柚子
·
2023-07-16 13:36
研究性论文相关笔记
深度学习
神经网络
nlp
Multimodal emotion
recognition
with capsule graph convolutional based representation fusion
题目Multimodalemotion
recognition
withcapsulegraphconvolutionalbasedrepresentationfusion译题基于胶囊图卷积表示融合的多模态情感识别时间
uuu_柚子
·
2023-07-16 13:36
研究性论文相关笔记
深度学习
人工智能
nlp
基于自注意和残差结构的跨模态情感识别融合网络
题目Across-modalfusionnetworkbasedonself-attentionandresidualstructureformultimodalemotion
recognition
译题基于自注意和残差结构的跨模态情感识别融合网络时间
uuu_柚子
·
2023-07-16 13:03
研究性论文相关笔记
网络
【无标题】
:阿里云一句话语音识别语音识别页面{{VoiceText}}{{VoiceTitle}}constrecorderManager=uni.getRecorderManager()constSpeech
Recognition
冬天不会冷lz
·
2023-07-16 06:47
微信小程序
微信小程序
语音识别
前端
javascript
加载、简单预处理数据集数据
有效工作时间6个小时HowtoDevelop1DConvolutionalNeuralNetworkModelsforHumanActivity
Recognition
其中前半部分加载数据处理数据部分。
Sshaylee
·
2023-07-16 06:32
前端实现语音合成
HTML5语音WebSpeechAPIHTML5中和WebSpeech相关的API实际上有两类,一类是“语音识别(Speech
Recognition
)”,另外一个就是“语音合成(SpeechSynthesis
欢欣的膜笛
·
2023-07-15 15:53
CnOCR 使用教程
目录一、简介二、使用教程三、效果展示一、简介CnOCR是Python3下的文字识别(OpticalCharacter
Recognition
,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别
小小晓晓阳
·
2023-07-15 15:59
图像识别
ocr
python
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他