E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
asr
Lily的Scalers Talk第八轮新概念朗读持续力训练Day219 2023-07-05
Lesson13-2ThesearchforoilThegeologistneedstoknowwhatrocksthedrillh
asr
eached,soeverysooftenasampleisobtainedwithacoringbit.Itcutsacleancylinderofrock
草木Lily
·
2025-07-29 11:02
【Appium】selenium.common.exceptions.WebDriverException: Message: The requested resource could not be
selenium.common.exceptions.WebDriverException:Message:Therequestedresourcecouldnotbefound,orarequestw
asr
eceivedusinganHTTPmethodthatisnotsuppo
枫萏
·
2025-07-29 10:45
Appium踩坑达人
appium
VideoChat:开源的数字人实时对话系统,支持自定义数字人的形象和音色
VideoChat支持
ASR
-LLM-T
蚝油菜花
·
2025-07-29 09:36
每日
AI
项目与应用实例
人工智能
开源
TTS
语音识别
浅谈经典开发工具之Visual C++ 6.0
VisualC++6.0(commonlyknownasVC6),whichincludedMFC6.0,w
asr
eleasedin1998.国内许多高
写写闲篇儿
·
2025-07-28 16:55
c++
开发语言
ES6模块详解:核心语法与最佳实践
.*/}//或集中导出constc=2,d=3;export{c,d
asr
enamedD};//`as`支持重命名默认导出:每个模块仅允许一个exportdefault。exportdefault
代码的余温
·
2025-07-28 04:33
es6
javascript
开发语言
2016级计算机C++助教工作(6)OJ上各种返回结果以及代表意思和可能涉及的原因
A:Hereisalistofthejudge'srepliesandtheirmeaning:Received:Thejudgesystemh
asr
eceivedyoursolution,us
GDRetop
·
2025-07-27 01:06
##C++助教
C++助教
python学习DAY22打卡
importwarningswarnings.filterwarnings("ignore")#忽略警告信息#数据处理清洗包importpandasaspdimportnumpyasnpimportrandom
asr
nd
星仔编程
·
2025-07-26 19:48
python学习打卡
学习
2021-08-10
NumberofFullyVaccinatedinGeorgiaExceeded200,000ReadingTime:1minreadphotoThenumberofpeoplefullyvaccinatedagainstCOVID-19inGeorgiah
asr
eached204,234
微笑的旗子萝卜
·
2025-07-26 17:17
口语01-don‘t judge a book by its cover
1themostadvancedthing2stack3right4frantically5beannoyedwithsb6Getyourstuffoffmydesk7ButtodayIcametoclassand==w
asr
unning
·
2025-07-25 21:51
如何构建Fun
ASR
的本地语音识别服务
Fun
ASR
简介Fun
ASR
是阿里巴巴达摩院开源的高性能语音识别工具包,支持离线识别和实时流式识别两种模式。
·
2025-07-23 20:48
语音识别开源项目推荐:GitHub热门仓库盘点
GitHub热门语音识别开源项目全解析:从入门到实战关键词语音识别(
ASR
)、开源项目、GitHub、Whisper、Fun
ASR
、PaddleSpeech、深度学习摘要想象一下:开车时只需说一句话就能自动发消息
AGI大模型与大数据研究院
·
2025-07-23 20:48
AI大模型应用开发实战
语音识别
开源
github
ai
【论文蒸馏】Recent Advances in Speech Language Models: A Survey
直接的方法是
ASR
(语音转文字)+LLM+TTS(文字转语音),但是这样有其固有的限制,而端到端的SpeechLM表现更好,本文及其方法论做了一个概览的综述1.Introduction大语言模型提供了强大的
Greener_Pat
·
2025-07-23 19:45
论文蒸馏
语言模型
人工智能
AudioLM
基于深度学习的语音识别:从音频信号到文本转录
前言语音识别(AutomaticSpeechRecognition,
ASR
)是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本,为人们提供了更加自然和便捷的人机交互方式。
Blossom.118
·
2025-07-23 13:07
机器学习与人工智能
深度学习
语音识别
音视频
人工智能
机器学习
线性代数
计算机视觉
gitlab登录报422的错
用户密码正确,但是登录gitlab报422thechangeyourequestedw
asr
ejected.解决方案:1.检查浏览器所在的电脑的时间2.检查gitlab所在服务器时间3.如果经过了nginx
xiaodaiwang
·
2025-07-23 01:19
GitlabCI
服务器
运维
开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界
这款基于70亿参数架构的模型,首次在单一框架内整合语音识别(
ASR
)、情感分析(SER)、跨语言对话、语音生成(TTS)等十余项任务,并通过12.5Hz混合标记器
开源技术探险家
·
2025-07-22 03:48
开源模型-实际应用落地
开源
音视频
AIGC
agi
Fun
ASR
Paraformer-zh:高效中文端到端语音识别方案全解
项目简介Fun
ASR
是阿里巴巴达摩院开源的端到端语音识别工具箱,集成了多种语音识别、语音活动检测(VAD)、说话人识别等模块。
·
2025-07-21 16:37
ICT模拟零件测试方法--测量参数详解
ICT模拟零件测试方法–测量参数详解文章目录ICT模拟零件测试方法--测量参数详解测量参数调整幅值
ASR
U范围
ASR
U加速电压合规电容补偿检测器等待额外数字增强频率电流变化电流合规直流电流直流偏移反向并联电容合格
可可南木
·
2025-07-21 00:35
ICT(In
Circuit
Tester)在线测试
测试工具
开发语言
pcb工艺
C#,List<T> 与 Vector<T>
AsR
eadOnly()返回当前集合的只读ReadOnlyCollection包装器。BinarySearch(Int32,Int32,T,IComparer)使用指定的比较器
大语言模型掘墓人
·
2025-07-20 02:05
c#
list
开发语言
vector
SIMD
虚拟机中 Linux环境下idea 报Java HotSpot(TM) 64-Bit Server VM warning: ignoring option MaxPermSize=350m;
问题JavaHotSpot(TM)64-BitServerVMwarning:ignoringoptionMaxPermSize=350m;supportw
asr
emovedin8.0无法启动原因在Java8
秋林辉
·
2025-07-19 15:44
JAVA
idea
linux
jdk
intellij
idea
Python之七彩花朵代码实现
importturtleastuimportrandom
asr
aimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
PlutoZuo
·
2025-07-12 18:35
Python
python
开发语言
基于 esp32-s3,结合私有化大模型,集
asr
语音识别、llm大模型、tts语音合成,设计一个技术方案,要求用websocket保持长链接,
以下方案演示了如何基于ESP32-S3,通过私有化大模型组合
ASR
(语音识别)、LLM(语言大模型)和TTS(语音合成)来构建一个语音交互系统,并且通过WebSocket保持与服务器的长连接通讯。
·
2025-07-11 20:03
手机Fun
ASR
识别SIM卡通话占用内存和运行性能分析
手机Fun
ASR
识别SIM卡通话占用内存和运行性能分析--本地AI电话机器人上一篇:手机无网离线使用Fun
ASR
识别SIM卡语音通话内容下一篇:手机通话语音离线
ASR
识别商用和优化方向一、前言书接上一文
·
2025-07-10 14:45
RBDMuteSwitch:一键静音控制工具使用指南
RBDMuteSwitch:一键静音控制工具使用指南RBDMuteSwitchPriortoiOS5itw
asr
elativelystraightforwardtodetectwhetheradevicewasmutedbyusinganaudioroutetodetectplaybacktype
幸生朋Margot
·
2025-07-10 00:45
手机通话语音离线
ASR
识别商用和优化方向
手机通话语音离线
ASR
识别商用和优化方向--本地AI电话机器人上一篇:手机Fun
ASR
识别SIM卡通话占用内存和运行性能分析下一篇:编写中。
limingade
·
2025-07-08 20:10
本地AI电话机器人
手机提取电话的信令和声音
智能手机
FunASR离线识别
Android做ASR
手机断网离线ASR
ASR语音转文字识别
语音识别
【实战】如何训练一个客服语音对话场景VAD模型
VAD在其中扮演着“预处理器”和“过滤器”的关键角色:提升
ASR
效率与准确性:只将检测到的语音片段送入
ASR
引擎,可以避免
ASR
对静音和噪声进行无效识别,减少计算资源浪费,并降低识别错误率。
kakaZhui
·
2025-07-08 17:51
前沿多模态大模型:论文与实战
人工智能
LLM
AIGC
实时音视频
Libigl在编译时常见错误与解决方法
:未找到匹配令牌igl_core错误C2001常量中有换行符igl_core错误C2001常量中有换行符igl_core错误LNK1104无法打开文件“…\lib\Debug\igl.lib”405_
AsR
igidAsPossible
hunjinYang
·
2025-07-07 06:12
C++库配置
windows
剖析AI人工智能领域Whisper的性能指标
剖析AI人工智能领域Whisper的性能指标关键词:Whisper、语音识别、性能指标、
ASR
、AI模型评估、基准测试、语音转文本摘要:本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标
AI大模型应用实战
·
2025-07-06 12:54
人工智能
whisper
xcode
ai
TOO_MANY_REQUESTS/12/disk usage exceeded flood-stage watermark, index has read-only-allow-delete blo
ES插入大量的数据时报错:TOO_MANY_REQUESTS/12/diskusageexceededflood-stagewatermark,indexh
asr
ead-only-allow-deleteblock
@Sadam
·
2025-07-06 06:06
后端
ES
ElasticSearch
TOO_MANY_REQU
disk
usage
exc
read-only-all
Kimi Audio一个通用的音频基础模型处理各种任务如自动语音识别(
ASR
)、音频问答(AQA)、自动音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)和端到端语音对话
主要功能包括:通用功能:处理各种任务,如自动语音识别(
ASR
)、音频问答(AQA)、自动音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)和端到端语音对话。
skywalk8163
·
2025-07-05 03:02
人工智能
xcode
ide
kaggle
Kimi
Audio
JMeter-常用断言方式
AssertJSONPathexists:json表达式,判断所字段是否存在,存在则为True,否则为FalseAdditionallyassertvalue:附加断言字段对应的值,匹配则为True,否则为FalseMatch
asr
egularexpression
无量是空
·
2025-07-05 01:22
JMeter
jmeter
java arthas redefine实现热替换某个类
简单的看下arth
asr
edefine类的效果,需要注意redefine的class不能修改、添加、删除类的field和method,包括方法参数、方法名称及返回值。
master-dragon
·
2025-07-04 16:22
#
java类加载和gc
java
arthas
AI人工智能 语音识别
AI人工智能构建语音识别器语音识别或自动语音识别(
ASR
)是AI机器人等AI项目的关注焦点。没有
ASR
,就不可能想象一个认知机器人与人进行交互。但是,构建语音识别器并不容易。
马里亚纳海沟网
·
2025-07-04 15:45
人工智能
语音识别
python
学习
运维
笔记
科普语音交互所需开源技术方案
以下是
ASR
(自动语音识别)、LLM(大语言模型)和TTS(文本转语音)三者结合的应用场景及开源方案:一、应用场景智能语音助手如百聆(Bailing),支持语音输入、意图理解、任务管理及语音输出,端到端延迟仅
·
2025-07-03 17:45
Kotlin 细节三:集合与泛型
@SinceKotlin("1.1")publicactualtypeali
asR
andomAccess=java.util.RandomAccess@SinceKotlin("1.1")publi
假笑骑士
·
2025-07-02 18:53
Kotlin
基础
(Note)音频向量化表示
这些特征设计依据生理听觉模型,在
ASR
、情感识别等任务中长期有效。但它们仍属浅层特征,无法自动学习更高阶的语言和语音信息,对说话人和环境的鲁棒性有限,通常需配合复杂模型来提高性能。
·
2025-07-01 20:10
Python实现语音识别功能,只需3个步骤!
,然后在文件夹内新建了两个.py文件,分别是get_audio.py和iat_demo.py,并且新建了一个存放录音的文件夹audios,文件夹内存放录音文件input.wav,我的整个文件目录如下:
asr
_SDK
·
2025-06-30 23:27
React Error Boundary
ReactErrorBoundaryimport*
asR
eactfrom'react';import{Component}from'react';import{createRoot}from'react-dom
Happy_Ariel
·
2025-06-29 17:32
react.js
javascript
前端
对话云蝠智能:大模型如何让企业呼叫系统从 “成本中心” 变身 “价值枢纽”?
该架构覆盖语音识别(
ASR
)、自然语言处理(NLP)、语音合成(TTS)及软交换六大层级,实现从基础设施到操作层的闭环设计。这一分
MARS_AI_
·
2025-06-27 16:20
人工智能
自然语言处理
信息与通信
交互
对SPM12的认识(二)
对SPM12的认识(二)四、SegmentDataChannel体积(Volumes)偏差正则化(Bi
asr
egularisation)偏差的FWHM(BiasFWHM)保存偏差校正图像(SaveBiasCorrected
·
2025-06-27 12:28
【造工具-2】用SenceVoice,实现本地的语音转文本小工具
说到语音转文本,有两种说法,自动语音识别(
ASR
,AutomaticSpeechRecognition)和语音转文本(STT,Speech-to-Text),本质上都是通过算法将语音信号转化为可处理的文本形式的技术
zhulangfly
·
2025-06-26 22:46
AI
AI
STT
ASR
使用 Python 的 requests 库实现流式输出
库实现流式输出importrequestsurl='https://api.example.com/stream'#替换为实际的APIURLwithrequests.get(url,stream=True)
asr
liangblog
·
2025-06-26 02:04
拿来就用系列
python
开发语言
通过url生成二维码
查看链接',width:'40%',})二EtObjectCode类importReact,{Component}from'react'importQRCodefrom'qrcodejs2'import*
asr
estfrom
牧小飞
·
2025-06-25 12:45
react.js
利用Fun
ASR
搭建自己的语音转文本服务器(有手就行)
提示:利用阿里巴巴开源的Fun
ASR
工具包,搭建语音转文本服务,通过网页实现免费的语音转文本服务。目录前言一、Fun
ASR
是什么?
·
2025-06-25 07:44
WebRTC 语音激活检测(VAD)算法
通常搭建机器人聊天系统主要包括以下三个方面:语音转文字(
ASR
/STT)语义内容(NLU/NLP)文字转语音(TTS)
u013250861
·
2025-06-25 07:13
Audio
webrtc
算法
语音识别
【使用Unimrcp和Fun
asr
构建呼叫中心语音识别服务端】
使用Unimrcp和Fun
asr
构建呼叫中心语音识别服务端1.编译及运行unimrcp2.新增fun
asr
-recog,支持fun
asr
识别3.启动unimrcp4.启动fun
asr
5.freeswitch
cc_ai_cn
·
2025-06-25 07:11
呼叫中心
语音识别
语音识别
人工智能
开发者注意:鸿蒙APP语音识别常见问题全解析(含可跑Demo)
引言随着语音交互逐渐成为主流,鸿蒙系统也提供了对
ASR
(Automati
·
2025-06-25 01:04
harmonyos
开源(离线)中文语音识别
ASR
(语音转文本)工具整理
开源(离线)中文语音识别
ASR
(语音转文本)工具整理目录文章目录目录@[toc]openai的开源工具:whisperwhisper介绍引用
ASR
T语音识别项目
ASR
T介绍引用微软语音服务(付费)微软语音服务介绍实时语音转文本批量转录自定义语音引用
切糕师学AI
·
2025-06-24 23:47
#
语音识别asr与语音合成STT
语音识别
人工智能
深度学习
微软
ASR
与开源模型分析
一、微软
ASR
核心能力1.支持场景场景功能实时语音转文本低延迟流式识别(会议字幕/直播转录)音频文件转文本支持多种格式(WAV/MP3等),批量处理长音频定制化模型针对特定行业术语(医疗/金融)训练专属模型多语言混合识别中英文混合
老兵发新帖
·
2025-06-24 23:45
microsoft
开源
《Whisper:开启语音识别新时代的钥匙》
Whisper模型:技术革新的基石在当今科技飞速发展的时代,自动语音识别(
ASR
)技术作为人工智能领域的关键分支,正深刻地改变着人们的生活与工作方式。
空云风语
·
2025-06-23 16:10
人工智能
深度学习
神经网络
whisper
语音识别
人工智能
程序代码篇---ESP32-S3小智固件
A1:该系统采用“语音采集→唤醒词检测→
ASR
→NLP→TTS→语音播放”的流水线架构:硬件层:ESP32-S3芯片+麦克风阵列(如INMP441)+扬声器(如MAX98357A)。
Atticus-Orion
·
2025-06-22 23:21
深度学习篇
程序代码篇
上位机知识篇
AI
Esp32-S3
小智
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他