E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Android-(Audio)
AWS WebRTC:根据viewer端拉流日志推算视频帧率和音频帧率
viewer端拉流日志是这样的:07:19:26.263VERBOSEsample
Audio
FrameHandler():
Audio
Framereceived.TrackId:140092278368896
·
2025-07-03 17:48
AWS WebRTC: 判断viewer端拉流是否稳定的算法
音频帧、视频帧的日志打印如下:07:19:26.263VERBOSEsample
Audio
FrameHandler():
Audio
Framereceived.TrackId
Jasper张
·
2025-07-03 17:47
AWS
WebRTC
webrtc
aws
服务器
linux
android 多通道音频,支持多通道录音
可是原生
Audio
Record接口是完全不支持多channel录音数据的采集的,怎么修改,才能让原生进行支持呢?我们就从
Audio
Record的构造函数开始往下研究。无论行不行,都要研究出个所以然来!
虾仁芝麻卷
·
2025-07-03 15:58
android
多通道音频
ReBEL模型的本地部署与运行,用于三元组抽取任务(事件抽取、知识抽取)
condacreate-nrebel_envpython=3.10-ycondaactivaterebel_env#安装PyTorch(建议与CUDA11.7配合)pipinstalltorchtorchvisiontorch
audio
·
2025-07-03 09:46
Android15音频进阶之HIDL与宏代码调试(一百二十五)
简介:CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布:《Android系统多媒体进阶实战》优质专栏:
Audio
工程师进阶系列【原创干货持续更新中……】优质专栏:多媒体系统工程师系列
Android系统攻城狮
·
2025-07-02 08:37
Android
Audio工程师进阶系列
音视频
Android15
Audio
HarmonyOS 创建 create
Audio
Capturer 时候报错误码 6800301
一、错误码6800301的信息错误码6800301,表示包含参数校验异常、权限校验异常、系统处理异常(具体错误查看系统日志)。本人遇到的问题是,申请了麦克风权限,但是未弹出提示用户授权,所以权限校验失败了。二、配置权限src/main/module.json5文件中配置如下内容"requestPermissions":[{"name":"ohos.permission.MICROPHONE","r
chenbin___
·
2025-07-02 08:34
harmonyos
[iOS文档翻译]AVFoundation Programming Guide - About AVFoundation - AVFoundation概述
AboutAVFoundation-AVFoundation概述AVFoundationisoneofseveralframeworksthatyoucanusetoplayandcreatetime-based
audio
visualmedia.ItprovidesanObjective-Cinterfaceyouuset
yofer张耀琦
·
2025-07-01 15:33
iOS
ios
AVFoundati
翻译
中文
【Transformer论文】通过蒙面多模态聚类预测学习视听语音表示
文献题目:LEARNING
AUDIO
-VISUALSPEECHREPRESENTATIONBYMASKEDMULTIMODALCLUSTERPREDICTION发表时间:2022发表期刊:ICLR摘要语音的视频记录包含相关的音频和视觉信息
Wwwilling
·
2025-07-01 13:24
推荐系统论文阅读
Transformer系列论文
transformer
聚类
多模态
iOS开发-进阶:音频播放、录音、视频播放、拍照、视频录制
转自:http://www.cnblogs.com/kenshincui/p/4186022.html#
audio
Record文章太长了,如果我这里写的质量不好,请参考原文;概览随着移动互联网的发展,如今的手机早已不是打电话
nikoLiLol
·
2025-07-01 04:54
FFmpeg:播放音频
函数SDL_Open
Audio
()本身就是用来打开声音设备的。它使用一个叫做SDL_
Audio
Spec结构体作为参数,这个结构体中包含了我们将要输出的音频的所有信息。
奋斗的IT青年
·
2025-07-01 03:23
FFmpeg
FFmpeg
音频
解码
播放
《解锁
Audio
Set:开启音频分析的无限可能》
音频新时代的“密钥”:
Audio
Set登场在科技飞速发展的今天,音频作为信息传播与交互的关键媒介,早已渗透到现代科技的各个角落。
·
2025-07-01 03:52
AAC / G711A / PCM 音频格式解析
Android利用
Audio
Track录制和播放PCM格式音频:publicclassPCMTalk{private
Audio
Record
audio
Record;privateintsampleRate
孤独冰刃
·
2025-07-01 03:18
音频编码解码
Python实现语音识别功能,只需3个步骤!
首先在官网下载了关于语音听写的SDK,然后在文件夹内新建了两个.py文件,分别是get_
audio
.py和iat_demo.py,并且新建了一个存放录音的文件夹
audio
s,文件夹内存放录音文件input.wav
·
2025-06-30 23:27
HTML5的新特性
谷歌浏览器需要添加muted来解决自动播放问题controls:controls向用户显示播放插件loop:loop循环播放poster:imgural加载等待的画面图片muted:muted静音播放2.音频
audio
码哥DFS
·
2025-06-30 14:50
html5
前端
html
QFramework v1.0 Guide: 工具篇2——UIKit,
Audio
Kit,FluentAPI,SingletonKit,FSMKit,PoolKit,TableKit
目录一、UIKit界面管理&快速开发解决方案1、用法(1)界面创建与层级管理(2)代码生成与组件绑定(3)打开与关闭界面(4)自定义界面加载方式2、应用场景3、示例代码二、
Audio
Kit音频管理解决方案
WX呦
·
2025-06-30 04:46
unity
游戏引擎
c#
QFramework
Android的
Audio
子系统
Android边录边播应用AP(ApplicationProcessor主处理器)DSP(Codec)BP(BasebandProcessor基带处理器,猫)一、
Audio
Track播放基本流程1.初始化
雷古拉斯
·
2025-06-29 14:13
移动操作系统之Android
✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案 (保姆级教程)
【CosyVoice2-0.5B实战】Segmentationfault(coredumped)终极解决方案|torch
audio
.save崩溃全流程排查与替代方案(保姆级教程)“运行没报错就是胜利,结果没崩溃就是奇迹
杨靳言先
·
2025-06-29 07:17
语音识别
语音生成
python
人工智能
Pydub音频处理库核心API详解
Pydub音频处理库核心API详解pydubManipulate
audio
withasimpleandeasyhighlevelinterface项目地址:https://gitcode.com/gh_mirrors
滕娴殉
·
2025-06-29 01:38
强化学习 16G实践以下是基于CQL(Conservative Q-Learning)与QLoRA(Quantized Low-Rank Adaptation)结合的方案相关开源项目及资源,【ai技】
TensorFlow的兼容版本建议及环境修复方案:1.版本兼容性表框架兼容CUDA版本推荐安装命令(CUDA11.5)PyTorch11.3/11.6pipinstalltorchtorchvisiontorch
audio
行云流水AI笔记
·
2025-06-28 19:19
开源
人工智能
高通
audio
pal 配置文件
一、PAL配置文件解析1.mixer_paths.xml-硬件控制中枢核心作用:物理通路定义:建立Codec寄存器到音频端点的信号链路动态控制:运行时通过ALSAControlAPI(如amixerset"SpkrLeftPAVolume"25)实时调整参数平台适配:文件命名规则mixer_paths__.xml(如mixer_paths_sm8550-demo.xml)调试技巧:使用tinymi
盼雨落,等风起
·
2025-06-28 06:24
audio
音视频
九、buildroot系统 usb配置
UAC(USB
Audio
Class)UAC通过USB虚拟标准PCM接口给Host设备,实现Device和Host之间音频互传功能。
·
2025-06-28 04:38
Android实时获取声音音量大小
使用
Audio
Record实时获取音量创建一个
Audio
Record实例并持续读取音频数据,计算音量大小。
Audio
Record适用于需要原始音频数据的场景。
泓博
·
2025-06-28 01:25
android
Android15音频进阶之MIC设备通路之间对应关系(一百二十四)
简介:CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布:《Android系统多媒体进阶实战》优质专栏:
Audio
工程师进阶系列【原创干货持续更新中……】优质专栏:多媒体系统工程师系列
Android系统攻城狮
·
2025-06-26 09:17
Android
Audio工程师进阶系列
Android15
AudioReach
音频
高通
torch-gpu版本 anaconda配置教程
教程Pytorch的GPU版本安装,在安装anaconda的前提下安装pytorch_pytorch-gpu-CSDN博客版本对应PyTorch中torch、torchvision、torch
audio
GXYGGYXG
·
2025-06-25 20:43
python
H5新增特性大全
1.2HTML中的新特性用于绘画的canvas元素用于媒介回放的video和
audio
元素对本地离线存储的更好的支持新的特殊内容元素,比如a
小夏啥也不会
·
2025-06-24 18:59
html中的新特性
video
audio
css
html5
前端
Android10 音频系统之HAL分析
一、
Audio
HAL架构分析Android音频架构定义了如何实现音频功能,并指出实现过程中涉及的相关源码Applicationframeworkapplicationframework包括应用程序代码,
@OuYang
·
2025-06-24 05:07
音视频
深度学习Day-38:Pytorch文本分类入门
了解文本分类的基本流程学习常用数据清洗方法学习如何使用jieba实现英文分词学习如何构建文本向量1.前期准备1.1环境安装pipinstalltorchvision==0.15.0pipinstalltorch
audio
Point__Nemo
·
2025-06-23 22:55
深度学习
自然语言处理
人工智能
Ubuntu24.04 ProteinMPNN安装
--nameproteinmpnnpython=3.9condaactivateproteinmpnncondainstallpytorch=1.12.0torchvision=0.13.0torch
audio
cudatoolkit
lamovrevx
·
2025-06-23 15:02
pytorch
人工智能
深度学习
[特殊字符] 一键搭建AI语音助理:基于DashScope+GRadio的智能聊天机器人技术全解
一、项目核心技术架构(图1)交互层核心模块py
audio
实时采集流式响应PCM编码GRadio界面状态控制实时对话展示语音输出历史记录管理ASR回调类ASR语音识别聊天处理引擎GPT大模型处理语音合成回调
来自于狂人
·
2025-06-22 22:10
人工智能
机器人
Qt音频采集:Q
Audio
Input详解与示例
1.简介Q
Audio
Input是QtMultimedia模块中用于音频采集的核心类,能够从麦克风等输入设备实时获取原始音频数据(PCM格式)。
·
2025-06-22 17:08
【音视频】PJSIP库——pjsua命令使用详解
安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulse
audio
-module-jacksudoaptinstalljackdlibjack-jackd2
郭老二
·
2025-06-22 02:03
视频
音视频
Unreal 文件夹命名----理解引擎
在资源文件夹里一般包括:声音(
Audio
)、蓝图(BlueprintBP)、特效(effect)、材质(Materials)、网格(Mesh)、纹理贴图(Textures)等文件,其中一般材质很多时,材质可按布料
坤坤子的世界
·
2025-06-21 23:45
unreal
unreal
Win10/11: Windows
Audio
无法启动 错误 0x80070005:拒绝访问
addnetworkservice,回车在cmd窗口中输入:netlocalgroupAdministrators/addlocalservice,回车右击我的电脑-管理-服务和运用程序-服务,找到Windows
Audio
积跬步至千里PRO
·
2025-06-21 08:39
Windows
windows
鸿蒙AI语音翻译便签应用设计与实现
https://example.com/ai-voice-translator-arch.png系统包含三个核心模块:语音识别模块-使用@ohos.multimedia.
audio
和AI语音识别服
鸿蒙大白
·
2025-06-20 10:11
ui
ArKUI-X
wpf
物联网
HarmonyOS5
仓颉
Unreal Engine:声音设计与音频集成技术教程_2024-07-13_00-24-34.Tex
音频格式WAV(Waveform
Audio
FileFormat)WAV是一种无损音频格式,保留了原始音频的所有数据,适用于编辑和处理阶段,但文件大小较大,不适合游戏中的实时加载。
chenjj4003
·
2025-06-20 04:57
游戏开发
虚幻
音视频
javascript
unity
ar
游戏引擎
网络
HTML5 更新的功能
文章目录前言**一、语义化标签(SemanticElements)****二、多媒体支持(
Audio
&Video)****三、图形与绘图(Canvas&SVG)****1.``****2.SVG内联支持
TE-茶叶蛋
·
2025-06-18 20:11
面试复习系列
html知识
html5
前端
html
pytorch2.6安装
8.6.0.163_cuda11-archivecondacreate-npytorch2.6python=3.10pipinstalltorch==2.6.0+cu118torchvisiontorch
audio
AoDeLuo
·
2025-06-17 04:04
软件安装
深度学习
pytorch
鸿蒙开发实战之
Audio
Kit打造美颜相机沉浸式音效
一、核心音频场景通过
Audio
Kit实现三大声音增强:视频录制音质优化智能降噪(环境噪音降低30dB)声场增强(采样率48kHz/24bit)语音交互升级美颜参数语音控制(支持中英文混合指令)声纹识别解锁高级功能沉浸式播放体验
·
2025-06-16 10:17
harmonyos-next
SayAnything:利用条件视频扩散实现音频驱动的口型同步
论文题目:SayAnything:
Audio
-DrivenLipSynchronizationwithConditionalVideoDiffusion论文链接:https://arxiv.org/abs
楠哥聊AI
·
2025-06-16 04:00
计算机视觉
数字人
神经网络
人工智能
生成对抗网络
扩散模型
diffusion
model
粗略刨析unity引擎源码架构
引擎源码架构设计的全面剖析:1.整体架构概述Unity引擎的源码主要分为以下几个核心模块:核心系统(CoreSystems)渲染系统(RenderingSystem)物理系统(PhysicsSystem)音频系统(
Audio
System
·
2025-06-16 03:20
Step-
Audio
-AQAA 解读:迈向「纯语音」交互的端到端 LALM 新里程
引言:AI从听到说大型音频语言模型(Large
Audio
-LanguageModels,LALMs)正在彻底改变我们与机器交互的方式。
kakaZhui
·
2025-06-15 23:26
前沿多模态大模型:论文与实战
语音识别
人工智能
大模型
音视频
mllms
AIGC
AVCap视频处理成帧和音频脚本
########处理原视频,使其格式和原数据一样importosimportcv2importsubprocessimportjsonfromPILimportImagefrompydubimport
Audio
Segmentimportsysimportshutil
xijiancui
·
2025-06-15 16:11
音视频
【MoodVine】react函数组件中使用useState改变值后立刻获取最新值
我们面临的问题是在React函数组件中,当我们通过useState更新了一个状态(这里是
audio
Url)后,我们希望立刻获取到最新的值来播放语音。
沈春庭
·
2025-06-15 02:38
MoodVine
个人博客
react.js
javascript
前端
其他面经汇总 (
Android-
深入)
解释一下环境变量是什么,作用是什么?环境变量其实就是操作系统或者运行环境在启动时设置的一些变量,它们存储了一些配置或状态信息,用来告诉我们的应用程序在哪些条件下启动或运行。比如说,当我们启动一个应用时,程序可以通过环境变量获取一些外部配置信息,而不必在代码中硬编码这些参数,从而使得程序更加灵活和易于配置。从Android开发的角度来看,虽然我们在应用中并不像服务器那样频繁使用环境变量,但了解它们仍
我也念过晚霞
·
2025-06-14 15:15
面经
android
实时交互流式数字人开源项目推荐
Realtimeinteractivestreamingdigitalhuman,realize
audio
videosynchronousdialogue.Itcanbasicallyachievecommercialeffects
snowfoootball
·
2025-06-13 21:58
其它
开源
python
docker
github
人工智能
机器学习
深度学习
腾讯开源 AniPortrait:音频驱动的逼真肖像动画生成革命
该框架由
Audio
2Lmk和Lmk2Video两大模块构成,形成完整的音频驱动动画生成闭环。
gogoMark
·
2025-06-13 18:35
开源
音视频
Android多媒体——音/视同步锚点更新(二十一)
音视频同步(AVSync)是多媒体处理中的核心问题,而音频锚点时间(
Audio
AnchorTime)的更新机制直接影响同步精度,当音频解码、渲染或动态调整(如变速、跳转)时,需高效修正时间锚点以避免唇音不同步
c小旭
·
2025-06-12 09:37
Android多媒体
android
多媒体
DeepLake 支持的 `htype` 类型一览
DeepLake支持的htype类型一览htype名称描述image图像数据(如JPEG/PNG编码的RGB图像)video视频帧序列
audio
音频波形数据(如WAV格式)text文本字符串jsonJSON
燃灯工作室
·
2025-06-11 19:28
DeepLake
人工智能
pytorch
神经网络
深度学习
机器学习
QT开发技术【ffmpeg + Q
Audio
Output】音乐播放器 完善
一、完善上章的功能,形成一个小工具QT开发技术【ffmpeg+Q
Audio
Output】音乐播放器二、增加歌曲保存类#include"..
增援未来章北海
·
2025-06-11 17:17
QT开发技术
qt
ffmpeg
开发语言
OpenAI SDK 上新 RealtimeAgent;Open
Audio
S1 语音生成模型:语调情感标记,精确控制风格
开发者朋友们大家好:这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。本期编辑:@赵怡岭、@鲍勃01有话题的技术1、OpenAI宣布其AgentsSDK新增TypeS
·
2025-06-11 03:02
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他