recognition 第3页

建模混淆矩阵以提高语音识别准确率，并应用于构音障碍语音

建模混淆矩阵以提高语音识别准确率，并应用于构音障碍语音原文：Modellingconfusionmatricestoimprovespeechrecognitionaccuracy,withanapplicationtodysarthricspeech

帅小柏·2025-04-07 09:01

人脸考勤管理一体化系统（人脸识别系统，签到打卡）

人脸考勤管理一体化系统项目介绍本项目是基于Flask、SQLAlchemy、face_recognition库的人脸考勤管理一体化系统。

西红柿土豆丶·2025-04-07 07:21

python学习课程（六）

Python语音识别（SpeechRecognition）1.引言Python是当今最流行的编程语言之一，Python语音识别（SpeechRecognition）是开发人员需要掌握的重要技能。

·2025-04-05 10:46

Auto-encoding Variational Bayes 阅读笔记

元气少女wuqh·2025-04-04 03:55

AI算法成长练习第一篇——Task-Adaptive Negative Envision for Few-Shot Open-Set Recognition代码复现

论文代码复现代码结构ArchitecturesAttnClassifier.pyimporttorch.nnasnnimporttorchimporttorch.nn.functionalasFimportnumpyasnpclassClassifier(nn.Module):def__init__(self,args,feat_dim,param_seam,train_weight_base=F

威少的书童·2025-03-27 19:06

python实现语音转文字

一、下载模型地址模型地址两个模型一个小一点，加载快一个大一点，加载慢加载的话每次启动只加载一次二、代码pipinstallspeech_recognitionvosk代码importjsonimportspeech_recognitionassrfromvoskimportModel

张航柯·2025-03-27 07:32

python --face_recognition(人脸识别,检测,特征提取,绘制鼻子,眼睛,嘴巴,眉毛)/活体检测

//blog.csdn.net/weixin_44634704/article/details/141332644环境:python==3.8opencv-python==4.11.0.86face_recognition

像风一样的男人@·2025-03-25 15:34

Sherpa-ONNX：说话人识别与语音识别自动开启（VAD）+ Python API 完整指南

介绍Sherpa-ONNX是一个基于ONNX的轻量级语音识别框架，支持多种语音处理任务，包括说话人识别（SpeakerRecognition）和自动语音识别（AutomaticSpeechRecognition

一只蜗牛儿·2025-03-25 14:26

一个简单的人脸识别demo

使用face_recognition和OpenCV库完成人脸检测和识别任务：#导入必要的库importcv2#OpenCV库，用于图像处理importface_recognition#人脸识别库importnumpyasnp

Rainly2000·2025-03-25 08:10

连接chatgpt的桌面语音助手

以下是一个完整的解决方案和技术实现步骤：所需工具和库语音识别使用speech_recognition库捕获用户的语音输入。需要麦克风支持。

getapi·2025-03-25 01:16

OCR识别常见开源库

OCR（OpticalCharacterRecognition，光学字符识别）技术是一种将印刷体或手写文字转化为可编辑文本的技术。亦即将图像中的文字进行识别，并以文本的形式返回。

yxfamyself·2025-03-23 17:44

人脸识别的一些代码

饿了就干饭·2025-03-22 18:44

车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统

车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。

威哥说编程·2025-03-22 02:48

自动语音识别（ASR）：技术、应用与未来

自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。

ajie1117·2025-03-21 16:17

python离线语音转文本_使用Python将语音转换为文本的方法

如何使用SpeechRecognition库在Python中将语音转换为文本？我们不需要从头开始

weixin_39760619·2025-03-21 11:01

如何在 Python 中将语音转换为文本

在本教程中，您将学习如何使用SpeechRecognition库在Python中

无水先生·2025-03-20 14:17

根据论文复现大模型方法以及出错处理技巧

实现步骤示例1.理解论文和模型架构选择一篇关于ResNet的论文作为示例，例如《DeepResidualLearningforImageRecognition》（Heetal.,2015）。2.

Ai玩家hly·2025-03-20 13:39

python反爬虫处理--处理验证码（Tesseract 库）的安装与使用

以下是一些常用的解决方案：对于简单的文字或数字验证码：如果网站使用的是相对简单的验证码形式，您可以尝试使用OCR(OpticalCharacterRecognition,光学字符识别)技术来自动识别这些验证码

范哥来了·2025-03-19 17:51

AI笔记——语音识别

摘要：语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域的一项重要技术，它将人类的语音信号转换成文字。

Yuki-^_^·2025-03-16 15:07

机器视觉|手势识别：基于YOLOv5的手部检测与MediaPipe的关键点估计

技术背景gesturerecognition作为计算机视觉领域的重要研究方向，在HCI（人机交互）、遥控行为分析、虚

RockLiu@805·2025-03-16 12:39

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.06.25-2024.07.01

AutoCherry-Picker:LearningfromHigh-qualityGenerativeDataDrivenbyLanguage2.BioMNER:ADatasetforBiomedicalMethodEntityRecognition3

小小帅AIGC·2025-03-15 05:10

Python中用SpeechRecognition库和 vosk模型来识别语音

Python中的SpeechRecognition库是一个比较好用的语音识别模块，提供了将语音识别成文字的方法，支持中文识别。

老菜鸟YDZ·2025-03-15 04:01

基于YOLOv5的车牌识别系统：从数据集到UI界面的实现

车牌识别系统（LicensePlateRecognition,LPR）主要用于识别车辆的车牌号码，并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。

深度学习&目标检测实战项目·2025-03-14 01:33

【Python】构建智能语音助手：使用Python实现语音识别与合成的全面指南

本文旨在全面介绍如何利用Python编程语言及其强大的库——SpeechRecognition和gTTS，构建一个基础但功能完备的语音助手。

蒙娜丽宁·2025-03-13 02:41

情感识别（Emotion Recognition）

情感识别（EmotionRecognition）是通过分析人类的多模态数据（如面部表情、语音、文本等）来识别和理解其情感状态的技术。它在人机交互、心理健康、市场分析等领域有广泛应用。

路野yue·2025-03-12 08:10

基于讯飞星火的语音问答

一.简介项目基于讯飞星火api作为核心能力并在其中搭载了WebSpeechAPI中的webkitSpeechRecognition对象来实现语音转文字的功能和TTS(Text-to-Speech)：通过调用百度

哎呦☞ᨐ·2025-03-10 15:45

基于Pytorch的语音情感识别系统

基于Pytorch的语音情感识别系统介绍语音情感识别（SpeechEmotionRecognition,SER）是指通过分析和处理人的语音信号来识别其情感状态。

鱼弦·2025-03-09 15:34

Triplet Loss原理及 Python实现

Tripletloss最初是谷歌在FaceNet:AUnifiedEmbeddingforFaceRecognitionandClustering论文中提出的，可以学到较好的人脸的embeddingTripletLoss

AIGC_ZY·2025-03-08 15:21

Python OCR库：自动化测试验证码识别神器！

在接口自动化工作中，经常需要处理文字识别的任务，而OCR（OpticalCharacterRecognition，光学字符识别）库能够帮助我们将图像中的文字提取出来。

测试大大怪·2025-03-07 17:19

【智能客服】智能客服的核心技术-对话系统

目录一、基本概念二、对话系统的应用场景三、对话系统的常见构建方式四、一般架构AutomaticSpeechRecognition(ASR)NaturalLanguageUnderstanding(NLU

姚瑞南·2025-03-06 12:50

【pyOCR】

pyOCR是什么pyOCR，全称PythonOpticalCharacterRecognition，是一个Python库，用于文本识别。

星星向前看·2025-03-05 02:37

AI视觉觉醒：深度学习如何革新视频标注，释放数据潜力基于深度学习的视频自动标注系统

被忽视的视频数据金矿传统视频标注的困境：效率、成本与瓶颈深度学习：视频自动标注的破局之道深度学习视频自动标注系统架构系统架构图核心技术解析目标检测（ObjectDetection）行为识别（ActionRecognition

海棠AI实验室·2025-03-03 09:54

基于 BERT 的自定义中文命名实体识别实现

基于BERT的自定义中文命名实体识别实现在自然语言处理中，命名实体识别（NamedEntityRecognition，NER）是一项重要的任务，旨在识别文本中的特定实体，如人名、地名、组织机构名等。

风清扬【coder】·2025-03-01 21:04

VOSK语音识别工具包使用教程

VOSK语音识别工具包使用教程voskVOSKSpeechRecognitionToolkit项目地址:https://gitcode.com/gh_mirrors/vo/vosk1.项目介绍VOSK是一个开源的语音识别工具包

邴联微·2025-03-01 15:50

[Github推荐]CVPR2019录用论文下载及可视化论文网站

简介CVPR是IEEEConferenceonComputerVisionandPatternRecognition的缩写，即IEEE国际计算机视觉与模式识别会议。

spearhead_cai·2025-03-01 09:10

使用Python和Vosk库实现语音识别

今天，我们将介绍如何使用Python中的SpeechRecognition库和Vosk模型来实现语音识别。

车载testing·2025-02-27 01:22

人工智能训练师如何做图像数据标注，从情感分析和实体分析两个个场景分析

本指南将详细介绍：情感分析标注（EmotionAnalysis）实体分析标注（EntityRecognition）自动化标注工具Python代码示例数据格式与存储标注数据质量评估1.情感分析（EmotionAnalysis

小宝哥Code·2025-02-23 12:47

基于Python的情感分析与情绪识别技术-从基础到前沿应用

基于Python的情感分析与情绪识别技术-从基础到前沿应用一、情感分析与情绪识别基础概念1.1核心概念区分情感分析（SentimentAnalysis）与情绪识别（EmotionRecognition）

一键难忘·2025-02-22 00:18

用realsense d435i传感器在实际环境中跑ORB_SLAM3，顺带解决一部分编译问题

一个完全依赖于最大后验估计（MAP）的单/双目惯导融合系统高回召的地点识别功能（High-recallplacerecognition）第一个完整的多地图系统（multi-map）一个抽象的相机模型表示论文地址论文细节今天不说

睫力上爬·2025-02-18 12:46

ASR技术与Whisper引擎

一、ASR技术简介ASR英文全称是AutomaticSpeechRecognition，中文叫做自动语音识别，是利用机器对语音信号进行识别和理解并将其转换成相文本和命令的技术。

Catformon·2025-02-17 01:38

【图像处理】使用Python进行实时人脸检测和识别

在本教程中，我们将使用face_recognition库来检测和识别视频流、图像甚至使用网络摄像头实时检测和识别人脸。二、基本概念人脸识别和人脸检测是计算机视觉领域的两个独立任务。

无水先生·2025-02-16 03:22

[实时计算flink]复杂事件处理（CEP）语句

关于ApacheFlinkCEPSQL的基本能力，详情请参见PatternRecognition。使用限制仅实时计算引擎vvr-6.0.2-fl

soso1968·2025-02-11 06:40

语音识别(Speech Recognition) 原理与代码实例讲解

语音识别(SpeechRecognition)-原理与代码实例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming/TextGenWebUILLM语音识别

AI天才研究院·2025-02-10 14:34

CNN-day5-经典神经网络LeNets5

LeNets51998年YannLeCun等提出的第一个用于手写数字识别问题并产生实际商业（邮政行业）价值的卷积神经网络参考：论文笔记：Gradient-BasedLearningAppliedtoDocumentRecognition-CSDN

谢眠·2025-02-10 03:54

使用Python进行语音识别：将音频转为文字

一个常用的库是SpeechRecognition，它提供了一个简单的接口来调用各种语音识别引擎。我们可以使用pip命令来安装Spe

WmqApps·2025-02-08 18:52

开源项目实战：Whisper 环境下的语音识别与说话人分离完全指南

开源项目实战：Whisper环境下的语音识别与说话人分离完全指南whisper-diarizationAutomaticSpeechRecognitionwithSpeakerDiarizationbasedonOpenAIWhisper

唐阔清·2025-02-07 23:40

6个最佳实体检测API，可准确返回实体的名称

命名实体识别（NamedEntityRecognition）也称作实体检测（EntityDetection），是NLP技术手册中的一个重要工具。

·2025-02-07 21:12

OCR - Tesseract的Windows下安装使用及ocr识别

一、光学字符识别技术OCR（OpticalCharacterRecognition），中文是光学字符识别。是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。

坐望云起·2025-02-07 08:32

python实践-实现实时语音转文字

1.本期语音转文字分为两种：1.实时语音转化为文字；2.录音文件转化为文字；2.需要初始化的三方库：pipinstallSpeechRecognitionpipinstallPyAudiopipinstallpipwinpipwininstallpyaudio3

Allen-Steven·2025-02-07 00:08

基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别

YOLOv5模型训练与优化4.1YOLOv5配置文件4.2安装YOLOv5并开始训练4.3模型评估与优化车牌识别与推理5.1加载模型进行推理5.2UI界面设计总结与展望引言车牌识别（LicensePlateRecognition

2025年数学建模美赛·2025-02-05 12:20

推荐频道

recognition