Android-(Audio) 第2页

AWS WebRTC：根据viewer端拉流日志推算视频帧率和音频帧率

viewer端拉流日志是这样的：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId:140092278368896

·2025-07-03 17:48

AWS WebRTC: 判断viewer端拉流是否稳定的算法

音频帧、视频帧的日志打印如下：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId

Jasper张·2025-07-03 17:47

android 多通道音频,支持多通道录音

可是原生AudioRecord接口是完全不支持多channel录音数据的采集的，怎么修改，才能让原生进行支持呢?我们就从AudioRecord的构造函数开始往下研究。无论行不行，都要研究出个所以然来！

虾仁芝麻卷·2025-07-03 15:58

ReBEL模型的本地部署与运行，用于三元组抽取任务（事件抽取、知识抽取）

condacreate-nrebel_envpython=3.10-ycondaactivaterebel_env#安装PyTorch（建议与CUDA11.7配合）pipinstalltorchtorchvisiontorchaudio

·2025-07-03 09:46

Android15音频进阶之HIDL与宏代码调试(一百二十五)

简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列

Android系统攻城狮·2025-07-02 08:37

HarmonyOS 创建 createAudioCapturer 时候报错误码 6800301

一、错误码6800301的信息错误码6800301，表示包含参数校验异常、权限校验异常、系统处理异常（具体错误查看系统日志）。本人遇到的问题是，申请了麦克风权限，但是未弹出提示用户授权，所以权限校验失败了。二、配置权限src/main/module.json5文件中配置如下内容"requestPermissions":[{"name":"ohos.permission.MICROPHONE","r

chenbin___·2025-07-02 08:34

[iOS文档翻译]AVFoundation Programming Guide - About AVFoundation - AVFoundation概述

AboutAVFoundation-AVFoundation概述AVFoundationisoneofseveralframeworksthatyoucanusetoplayandcreatetime-basedaudiovisualmedia.ItprovidesanObjective-Cinterfaceyouuset

yofer张耀琦·2025-07-01 15:33

【Transformer论文】通过蒙面多模态聚类预测学习视听语音表示

文献题目：LEARNINGAUDIO-VISUALSPEECHREPRESENTATIONBYMASKEDMULTIMODALCLUSTERPREDICTION发表时间：2022发表期刊：ICLR摘要语音的视频记录包含相关的音频和视觉信息

Wwwilling·2025-07-01 13:24

iOS开发-进阶:音频播放、录音、视频播放、拍照、视频录制

转自:http://www.cnblogs.com/kenshincui/p/4186022.html#audioRecord文章太长了,如果我这里写的质量不好,请参考原文;概览随着移动互联网的发展，如今的手机早已不是打电话

nikoLiLol·2025-07-01 04:54

FFmpeg：播放音频

函数SDL_OpenAudio()本身就是用来打开声音设备的。它使用一个叫做SDL_AudioSpec结构体作为参数，这个结构体中包含了我们将要输出的音频的所有信息。

奋斗的IT青年·2025-07-01 03:23

《解锁AudioSet：开启音频分析的无限可能》

音频新时代的“密钥”：AudioSet登场在科技飞速发展的今天，音频作为信息传播与交互的关键媒介，早已渗透到现代科技的各个角落。

·2025-07-01 03:52

AAC / G711A / PCM 音频格式解析

Android利用AudioTrack录制和播放PCM格式音频：publicclassPCMTalk{privateAudioRecordaudioRecord;privateintsampleRate

孤独冰刃·2025-07-01 03:18

Python实现语音识别功能，只需3个步骤！

首先在官网下载了关于语音听写的SDK，然后在文件夹内新建了两个.py文件，分别是get_audio.py和iat_demo.py，并且新建了一个存放录音的文件夹audios，文件夹内存放录音文件input.wav

·2025-06-30 23:27

HTML5的新特性

谷歌浏览器需要添加muted来解决自动播放问题controls：controls向用户显示播放插件loop：loop循环播放poster:imgural加载等待的画面图片muted:muted静音播放2.音频audio

码哥DFS·2025-06-30 14:50

QFramework v1.0 Guide: 工具篇2——UIKit,AudioKit,FluentAPI,SingletonKit,FSMKit,PoolKit,TableKit

目录一、UIKit界面管理&快速开发解决方案1、用法（1）界面创建与层级管理（2）代码生成与组件绑定（3）打开与关闭界面（4）自定义界面加载方式2、应用场景3、示例代码二、AudioKit音频管理解决方案

WX呦·2025-06-30 04:46

Android的Audio子系统

Android边录边播应用AP（ApplicationProcessor主处理器）DSP（Codec）BP（BasebandProcessor基带处理器，猫）一、AudioTrack播放基本流程1.初始化

雷古拉斯·2025-06-29 14:13

✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案（保姆级教程）

【CosyVoice2-0.5B实战】Segmentationfault(coredumped)终极解决方案|torchaudio.save崩溃全流程排查与替代方案（保姆级教程）“运行没报错就是胜利，结果没崩溃就是奇迹

杨靳言先·2025-06-29 07:17

Pydub音频处理库核心API详解

Pydub音频处理库核心API详解pydubManipulateaudiowithasimpleandeasyhighlevelinterface项目地址:https://gitcode.com/gh_mirrors

滕娴殉·2025-06-29 01:38

强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】

TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio

行云流水AI笔记·2025-06-28 19:19

高通 audio pal 配置文件

一、PAL配置文件解析1.mixer_paths.xml-硬件控制中枢核心作用：物理通路定义：建立Codec寄存器到音频端点的信号链路动态控制：运行时通过ALSAControlAPI（如amixerset"SpkrLeftPAVolume"25）实时调整参数平台适配：文件命名规则mixer_paths__.xml（如mixer_paths_sm8550-demo.xml）调试技巧：使用tinymi

盼雨落，等风起·2025-06-28 06:24

九、buildroot系统 usb配置

UAC（USBAudioClass）UAC通过USB虚拟标准PCM接口给Host设备，实现Device和Host之间音频互传功能。

·2025-06-28 04:38

Android实时获取声音音量大小

使用AudioRecord实时获取音量创建一个AudioRecord实例并持续读取音频数据，计算音量大小。AudioRecord适用于需要原始音频数据的场景。

泓博·2025-06-28 01:25

Android15音频进阶之MIC设备通路之间对应关系(一百二十四)

简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列

Android系统攻城狮·2025-06-26 09:17

torch-gpu版本 anaconda配置教程

教程Pytorch的GPU版本安装，在安装anaconda的前提下安装pytorch_pytorch-gpu-CSDN博客版本对应PyTorch中torch、torchvision、torchaudio

GXYGGYXG·2025-06-25 20:43

H5新增特性大全

1.2HTML中的新特性用于绘画的canvas元素用于媒介回放的video和audio元素对本地离线存储的更好的支持新的特殊内容元素，比如a

小夏啥也不会·2025-06-24 18:59

Android10 音频系统之HAL分析

一、AudioHAL架构分析Android音频架构定义了如何实现音频功能，并指出实现过程中涉及的相关源码Applicationframeworkapplicationframework包括应用程序代码，

@OuYang·2025-06-24 05:07

深度学习Day-38：Pytorch文本分类入门

了解文本分类的基本流程学习常用数据清洗方法学习如何使用jieba实现英文分词学习如何构建文本向量1.前期准备1.1环境安装pipinstalltorchvision==0.15.0pipinstalltorchaudio

Point__Nemo·2025-06-23 22:55

Ubuntu24.04 ProteinMPNN安装

--nameproteinmpnnpython=3.9condaactivateproteinmpnncondainstallpytorch=1.12.0torchvision=0.13.0torchaudiocudatoolkit

lamovrevx·2025-06-23 15:02

[特殊字符] 一键搭建AI语音助理：基于DashScope+GRadio的智能聊天机器人技术全解

一、项目核心技术架构（图1）交互层核心模块pyaudio实时采集流式响应PCM编码GRadio界面状态控制实时对话展示语音输出历史记录管理ASR回调类ASR语音识别聊天处理引擎GPT大模型处理语音合成回调

来自于狂人·2025-06-22 22:10

Qt音频采集：QAudioInput详解与示例

1.简介QAudioInput是QtMultimedia模块中用于音频采集的核心类，能够从麦克风等输入设备实时获取原始音频数据（PCM格式）。

·2025-06-22 17:08

【音视频】PJSIP库——pjsua命令使用详解

安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulseaudio-module-jacksudoaptinstalljackdlibjack-jackd2

郭老二·2025-06-22 02:03

Unreal 文件夹命名----理解引擎

在资源文件夹里一般包括：声音（Audio）、蓝图（BlueprintBP）、特效（effect）、材质（Materials）、网格（Mesh）、纹理贴图（Textures）等文件，其中一般材质很多时，材质可按布料

坤坤子的世界·2025-06-21 23:45

Win10/11: Windows Audio无法启动错误 0x80070005:拒绝访问

addnetworkservice，回车在cmd窗口中输入：netlocalgroupAdministrators/addlocalservice，回车右击我的电脑-管理-服务和运用程序-服务，找到WindowsAudio

积跬步至千里PRO·2025-06-21 08:39

鸿蒙AI语音翻译便签应用设计与实现

https://example.com/ai-voice-translator-arch.png系统包含三个核心模块：语音识别模块-使用@ohos.multimedia.audio和AI语音识别服

鸿蒙大白·2025-06-20 10:11

Unreal Engine：声音设计与音频集成技术教程_2024-07-13_00-24-34.Tex

音频格式WAV(WaveformAudioFileFormat)WAV是一种无损音频格式，保留了原始音频的所有数据，适用于编辑和处理阶段，但文件大小较大，不适合游戏中的实时加载。

chenjj4003·2025-06-20 04:57

HTML5 更新的功能

文章目录前言**一、语义化标签（SemanticElements）****二、多媒体支持（Audio&Video）****三、图形与绘图（Canvas&SVG）****1.``****2.SVG内联支持

TE-茶叶蛋·2025-06-18 20:11

pytorch2.6安装

8.6.0.163_cuda11-archivecondacreate-npytorch2.6python=3.10pipinstalltorch==2.6.0+cu118torchvisiontorchaudio

AoDeLuo·2025-06-17 04:04

鸿蒙开发实战之Audio Kit打造美颜相机沉浸式音效

一、核心音频场景通过AudioKit实现三大声音增强：视频录制音质优化智能降噪（环境噪音降低30dB）声场增强（采样率48kHz/24bit）语音交互升级美颜参数语音控制（支持中英文混合指令）声纹识别解锁高级功能沉浸式播放体验

·2025-06-16 10:17

SayAnything：利用条件视频扩散实现音频驱动的口型同步

论文题目：SayAnything:Audio-DrivenLipSynchronizationwithConditionalVideoDiffusion论文链接：https://arxiv.org/abs

楠哥聊AI·2025-06-16 04:00

粗略刨析unity引擎源码架构

引擎源码架构设计的全面剖析：1.整体架构概述Unity引擎的源码主要分为以下几个核心模块：核心系统（CoreSystems）渲染系统（RenderingSystem）物理系统（PhysicsSystem）音频系统（AudioSystem

·2025-06-16 03:20

Step-Audio-AQAA 解读：迈向「纯语音」交互的端到端 LALM 新里程

引言：AI从听到说大型音频语言模型（LargeAudio-LanguageModels,LALMs）正在彻底改变我们与机器交互的方式。

kakaZhui·2025-06-15 23:26

AVCap视频处理成帧和音频脚本

########处理原视频，使其格式和原数据一样importosimportcv2importsubprocessimportjsonfromPILimportImagefrompydubimportAudioSegmentimportsysimportshutil

xijiancui·2025-06-15 16:11

【MoodVine】react函数组件中使用useState改变值后立刻获取最新值

我们面临的问题是在React函数组件中，当我们通过useState更新了一个状态（这里是audioUrl）后，我们希望立刻获取到最新的值来播放语音。

沈春庭·2025-06-15 02:38

其他面经汇总（Android-深入）

解释一下环境变量是什么，作用是什么？环境变量其实就是操作系统或者运行环境在启动时设置的一些变量，它们存储了一些配置或状态信息，用来告诉我们的应用程序在哪些条件下启动或运行。比如说，当我们启动一个应用时，程序可以通过环境变量获取一些外部配置信息，而不必在代码中硬编码这些参数，从而使得程序更加灵活和易于配置。从Android开发的角度来看，虽然我们在应用中并不像服务器那样频繁使用环境变量，但了解它们仍

我也念过晚霞·2025-06-14 15:15

snowfoootball·2025-06-13 21:58

腾讯开源 AniPortrait：音频驱动的逼真肖像动画生成革命

该框架由Audio2Lmk和Lmk2Video两大模块构成，形成完整的音频驱动动画生成闭环。

gogoMark·2025-06-13 18:35

Android多媒体——音/视同步锚点更新（二十一）

音视频同步（AVSync）是多媒体处理中的核心问题，而音频锚点时间（AudioAnchorTime）的更新机制直接影响同步精度，当音频解码、渲染或动态调整（如变速、跳转）时，需高效修正时间锚点以避免唇音不同步

c小旭·2025-06-12 09:37

DeepLake 支持的 `htype` 类型一览

DeepLake支持的htype类型一览htype名称描述image图像数据（如JPEG/PNG编码的RGB图像）video视频帧序列audio音频波形数据（如WAV格式）text文本字符串jsonJSON

燃灯工作室·2025-06-11 19:28

QT开发技术【ffmpeg + QAudioOutput】音乐播放器完善

一、完善上章的功能，形成一个小工具QT开发技术【ffmpeg+QAudioOutput】音乐播放器二、增加歌曲保存类#include"..

增援未来章北海·2025-06-11 17:17

OpenAI SDK 上新 RealtimeAgent；OpenAudio S1 语音生成模型：语调情感标记，精确控制风格

开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（Real-TimeEngagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。本期编辑：@赵怡岭、@鲍勃01有话题的技术1、OpenAI宣布其AgentsSDK新增TypeS

·2025-06-11 03:02

推荐频道

Android-(Audio)