今天,监视系统无处不在。由于可能失去关注,观看特定领域的实时视频的人类观察者无法有效。另一方面,无人看管的监视系统要求人们在需要搜索一些特定事件时分析录音时间,例如确定负责暴力,盗窃或其他犯罪的人。在许多情况下,摄像头视频中的特定搜索必须在最短的时间内完成。本文提出了MotionFinder,该工具通过计算场景中动作的交互式汇总来执行视频分析。
一旦完成摘要过程,该工具就会实时响应。例如,人类研究人员可以在视频中搜索显示高水平活动或知道发生某些事情的特定区域(例如:财产损坏或被盗)。该工具仅通过显示视频特定区域发生某些活动的场景来做出响应。 尽管在正常情况下使用的视频分析在监视应用程序中表现良好,但在不利的情况下可能无法准确地工作。利用视频和音频的互补方面可以导致更有效的分析框架,从而提高系统鲁棒性。例如,监控声音场景分析可能表明视野外部的潜在安全风险,将相机指向该方向。本文提出了一种强大的低复杂方法,用于两种微光音的声音方向估计。
尽管已经对来源定位问题进行了广泛的研究,但可靠的低复杂解决方案仍然难以捉摸。提出的方向估计基于与相变(GCC-PHAT)方法的广义互相关。我们方法的新方面包括在峰值检测之前对GCC-PHAT目标函数的带选择性处理和框架滤波。监控摄像头音频带宽,麦克风间距,角度分辨率,处理延迟和复杂性均可根据应用程序要求调整。所述算法可以通过结合麦克风对的估计值来用于多微粒构型用于空间声音定位。它已在修改后的TI DM8127 IP摄像头上作为实时演示实现。默认的16 kHz音频采样频率在我们的定点实现中需要大约5个MIPS处理能力。测试结果表明在各种背景噪声条件下进行了强大的声音方向估计。
上一篇:如何检测摄像机的合理亮度
下一篇:摄像头干扰器必备驱动装置