企业新闻
沈宇科技 > 最新资讯 > 当前位置
摄像头音频和视频混合系统

    在 IP 网络上传输和记录双向高保真音频和视频的功能越来越多地用于许多监控和非安全应用。摄像头音频正在成为电子安全解决方案中的强大工具,但在设计 IP 视频系统时却经常被忽视。我将探索一些音频应用程序以及使其能够成为 IP 视频项目的有用补充的技术。首先考虑IP 视频系统允许通过IP 网络传输全双工、2 路数字音频。这意味着两端同时能够说和听。领先的 IP 视频干扰器制造商在其 IP 摄像机和视频编码器中内置了音频输入/输出功能。

    这允许麦克风和/或扬声器安装在相机/编码器上或附近。通常使用 AAC 压缩标准来压缩音频。这种监控基本的双向音频通常用于对讲应用和公共安全帮助点。对讲机可以仅使用音频,也可以使用视频,以实现功能齐全的视频对讲机。
转向响应功率相变 (SRP-PHAT) 是在噪声和混响环境中运行的声源定位中最可靠的方法之一。到达方向 (DOA) 估计在视频会议、语音屏蔽器增强和语音识别等人机界面中具有重要应用。

    在本论文工作中,在监控摄像头存在噪声和混响的情况下,对排列成 4 行和 4 列的 16 元件麦克风阵列实施了 SRP-PHAT 方法。计算行设置或列设置中每对麦克风的 TDOA,计算广义互相关估计,从而计算源位置,然后通过对行方式获得的 TDOA 值和列方式获得的 TDOA 值进行平均,得到最准确的源位置可以确定。 SRP-PHAT 方法中使用加权重叠相加 (WOLA) 滤波器组来查找频域中的 TDOA。将原始 TDOA 和从 SRP-PHAT 获得的估计 TDOA 进行比较,以分析 SRP-PHAT 方法的性能。计算平均估计误差和干扰屏蔽器标准偏差来确定 TDOA 估计值的准确性。