首页> 中国专利> 指向性控制装置、指向性控制方法、存储介质及指向性控制系统

指向性控制装置、指向性控制方法、存储介质及指向性控制系统

摘要

指向性控制装置对由包括多个麦克风的收音部收音到的声音的指向性进行控制。波束形成部在从收音部向与在显示部的图像上指定的位置对应的声源的方向上形成波束。倍率设定部根据输入来设定用于放大或缩小显示部的图像的倍率。而且,波束形成部根据由倍率设定部设定的倍率来变更形成的波束的尺寸。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-30

    授权

    授权

  • 2016-07-20

    实质审查的生效 IPC(主分类):H04R1/40 申请日:20140331

    实质审查的生效

  • 2016-06-22

    公开

    公开

说明书

技术领域

本发明涉及对声音的指向性进行控制的指向性控制装置、指向性 控制方法、存储介质及指向性控制系统。

背景技术

以往,在设置于工厂、店铺(例如小卖店、银行)或者公共的场 所(例如图书馆)的既定位置(例如顶棚面)的监视系统中,经由网 络而连接1个以上的相机装置(例如PTZ相机装置、全方位相机装置), 实现监视对象范围的影像的图像数据(包括静止图像及活动图像。以 下相同)的广角化。

而且,在使用了影像的监视中得到的信息量有限,因此通过除了 1个以上的相机装置以外还使用麦克风阵列装置来得到相机装置的视 场角内存在的特定的监视对象(例如人物)发出的声音数据的监视系 统的要求迫切。在这样的监视系统中,在监视者想要听取特定的监视 对象发出的声音数据的情况下,需要确立由相机装置拍摄到的影像的 图像数据与由麦克风阵列装置收音到的声音的声音数据的同步。

在此,作为确立由相机装置拍摄到的影像的图像数据与由麦克风 阵列装置收音到的声音的声音数据的同步的在先技术,已知有专利文 献1所示的信号处理装置。

专利文献1所示的信号处理装置根据摄影者对被摄体的缩放操作 的结果,算出距由拍摄部拍摄到的被摄体的距离,根据算出的距离, 增强由麦克风单元收音到的声音。而且,信号处理装置根据距摄影者 所拍摄的被摄体的距离,使由拍摄部拍摄到的影像信号或由麦克风单 元收音到的声音信号中的任一信号延迟。由此,即使通过摄影者对被 摄体进行缩放操作,由于信号处理装置根据距被摄体的距离而使影像 信号或声音信号中的任一信号延迟,因此也能够确立影像信号与声音 信号的同步。

专利文献1:日本国特开2009-130767号公报

发明内容

在专利文献1中,通过摄影者的缩放操作,进行由麦克风单元收 音到的声音信号的增强处理。然而,若将专利文献1的结构应用于上 述的监视系统,则通过缩放操作来切换监视者选择的监视范围时,可 能无法适当地形成从麦克风阵列装置对于通过缩放操作而切换的监视 范围的特定的被摄体(例如人物)的声音的指向性。

在监视系统中,若无法适当地形成声音数据的指向性,则即使影 像与声音同步,作为监视对象的特定的被摄体发出的声音也不会传递 给监视者,从而监视者的监视业务的效率劣化。

本发明为了解决上述的现有的课题,目的在于提供即使在由于对 监视对象的缩放处理而切换监视对象的被摄体的情况下也能适当地形 成对于切换后的监视对象的被摄体的声音的指向性并抑制监视者的监 视业务的效率劣化的指向性控制装置、指向性控制方法及指向性控制 系统。

本发明涉及一种指向性控制装置,对由包括多个麦克风的收音部 收音到的声音的指向性进行控制,该指向性控制装置具备:波束形成 部,在从上述收音部向与在显示部的图像上指定的位置对应的声源的 方向上形成波束;及倍率设定部,根据输入来设定用于放大或缩小上 述显示部的图像的倍率,上述波束形成部根据由上述倍率设定部设定 的倍率来变更所形成的上述波束的尺寸。

而且,本发明涉及一种指向性控制方法,是对由包括多个麦克风 的收音部收音到的声音的指向性进行控制的指向性控制装置的指向性 控制方法,该指向性控制方法具有以下步骤:对由包括多个麦克风的 收音部收音到的声音的指向性进行控制;根据输入来设定用于放大或 缩小上述显示部的图像的倍率;及根据所设定的上述倍率来变更所形 成的上述波束的尺寸。

而且,本发明涉及一种存储介质,存储有执行对由包括多个麦克 风的收音部收音到的声音的指向性进行控制的指向性控制装置的处理 的程序,上述存储介质存储有执行如下步骤的程序:对由包括多个麦 克风的收音部收音到的声音的指向性进行控制;根据输入来设定用于 放大或缩小上述显示部的图像的倍率;及根据所设定的上述倍率来变 更所形成的上述波束的尺寸。

此外,本发明涉及一种指向性控制系统,具备:拍摄部,对收音 区域进行拍摄;收音部,包括多个麦克风且对上述收音区域的声音进 行收音;及指向性控制装置,对由上述收音部收音到的声音的指向性 进行控制,上述指向性控制装置具备:显示部,显示由上述拍摄部拍 摄到的上述收音区域的图像;波束形成部,根据对显示于上述显示部 的上述图像的位置的指定,在从上述收音部向与所指定的上述位置对 应的声源的方向上形成波束;及倍率设定部,根据输入来设定用于放 大或缩小上述显示部的图像的倍率,上述波束形成部根据由上述倍率 设定部设定的倍率来变更所形成的上述波束的尺寸。

此外,本发明涉及一种指向性控制系统,具备:拍摄部,对收音 区域进行拍摄;第一收音部,包括多个麦克风且对上述收音区域的声 音进行收音;第二收音部,增设在上述第一收音部的周围;及指向性 控制装置,对由上述第一收音部和第二收音部收音到的声音的指向性 进行控制,上述指向性控制装置具备:显示部,显示由上述拍摄部拍 摄到的上述收音区域的图像;及波束形成部,根据对显示于上述显示 部的上述图像的位置的指定,在从上述第一收音部向与所指定的上述 位置对应的声源的方向上形成波束。

发明效果

根据本发明,通过对监视对象的缩放处理,即使在切换监视对象 的被摄体的情况下,也能够适当地形成对于切换后的监视对象的被摄 体的声音的指向性,抑制监视者的监视业务的效率劣化。

附图说明

图1是表示第一实施方式的指向性控制系统的系统结构的框图。

图2(A)~图2(E)是全方位麦克风阵列装置的框体的外观图。

图3是全方位麦克风阵列装置在方向θ上形成声音数据的指向性 的延迟和方式的简单的说明图。

图4(A)是表示拉远处理时的指向性图案、显示画面、声音缩放 范围及显示画面的显示范围的图,图4(B)是表示拉远处理前及推近 处理前的指向性图案、显示画面、声音缩放范围及显示画面的显示范 围的图,图4(C)是表示推近处理时的指向性图案、显示画面、声音 缩放范围及显示画面的显示范围的图。

图5(A)是表示在屋内的大厅的顶棚面安装有一体地组装的全方 位麦克风阵列装置2及相机装置1的监视范围的图,图5(B)是表示 在全方位图像数据中包含2人的人物91、92的范围g的选择操作的图, 图5(C)是表示变形校正处理后的2人的人物91、92的图像数据显示 于显示器装置且人物91、92交谈的声音数据在扬声器装置中输出的情 况的图,图5(D)是表示在全方位图像数据中包含2人的人物93、94 的范围h的选择操作的图,图5(E)是表示变形校正处理后的2人的 人物93、94的图像数据显示于显示器装置且人物93、94的交谈的声 音数据在扬声器装置中输出的情况的图。

图6是详细说明第一实施方式的指向性控制装置的动作次序的流 程图。

图7(A)是说明作为图6所示的隐私保护处理的第一例的声音隐 私保护处理的动作次序的流程图,图7(B)是说明作为图6所示的隐 私保护处理的第二例的图像隐私保护处理的动作次序的流程图。

图8(A)是表示与变声处理前的音调对应的声音信号的波形的一 例的图,图8(B)是表示与变声处理后的音调对应的声音信号的波形 的一例的图,图8(C)是在检测到的人物的脸部的轮廓内加入晕映的 处理的说明图。

图9是说明第二实施方式的指向性控制装置的动作次序中的与第 一实施方式的指向性控制装置的动作次序不同的动作次序的流程图。

图10(A)是表示在全方位麦克风阵列装置的周围结合增设麦克 风部的第一例(环形结合)的主视图,图10(B)是表示在全方位麦克 风阵列装置的周围结合增设麦克风部的第一例的侧视图。

图11是表示在全方位麦克风阵列装置的周围结合增设麦克风部 的第二例(椭圆环形结合)的主视图。

图12(A)是表示在全方位麦克风阵列装置的周围结合增设麦克 风部的第三例(正方形结合或长方形结合)的主视图,图12(B)是表 示在全方位麦克风阵列装置的周围结合增设麦克风部的第三例(正方 形结合或长方形结合)的侧视图。

图13(A)是表示在全方位麦克风阵列装置的周围结合增设麦克 风部的第四例(蜂窝形结合)的主视图,图13(B)是表示在全方位麦 克风阵列装置的周围结合增设麦克风部的第五例(蜂窝形结合)的主 视图。

图14(A)是表示在全方位麦克风阵列装置的周围结合增设麦克 风部的第六例(棒形结合)的主视图,图14(B)是表示在全方位麦克 风阵列装置的周围结合增设麦克风部的第六例(棒形结合)的侧视图。

图15(A)是表示安装有图14(B)所示的全方位麦克风阵列装 置和顶棚安装金属板的状态的俯视图,图15(B)示出图15(A)的 E-E截面,是表示在图14(B)所示的全方位麦克风阵列装置的周围安 装有增设麦克风部的状态的侧视图。

图16(A)是表示在全方位麦克风阵列装置的周围结合增设麦克 风部的第七例(棒形结合)的主视图,图16(B)是表示在全方位麦克 风阵列装置的周围结合增设麦克风部的第八例(棒形结合)的主视图, 图16(C)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的 第九例(棒形结合)的主视图。

图17(A)是表示在全方位麦克风阵列装置的周围结合增设麦克 风部的第十例(构架形结合)的主视图,图17(B)是表示在全方位麦 克风阵列装置的周围结合增设麦克风部的第十例(构架形结合)的侧 视图,图17(C)是表示在全方位麦克风阵列装置的周围结合增设麦克 风部的第十一例(构架形结合)的主视图,图17(D)是表示在全方 位麦克风阵列装置的周围结合增设麦克风部的第十一例(构架形结合) 的侧视图。

图18(A)是表示增设麦克风部向全方位麦克风阵列装置的周围 结合的结合方法的第一例的主视图,图18(B)是表示增设麦克风部向 全方位麦克风阵列装置的周围结合的结合方法的第二例的主视图。

图19(A)是表示增设麦克风部向全方位麦克风阵列装置的周围 结合的结合方法的第三例的主视图,图19(B)示出图19(A)的E-E 截面,是表示增设麦克风部向全方位麦克风阵列装置的周围结合的结 合方法的第三例的侧视图,图19(C)是表示增设麦克风部向全方位麦 克风阵列装置的周围结合的结合方法的第四例的补充说明图。

图20是表示在全方位麦克风阵列装置的周围结合增设麦克风部 的第十二例(片形结合)的立体图。

图21是表示结合有增设麦克风部的全方位麦克风阵列装置的硬 件结构的一例的框图。

具体实施方式

以下,参照附图,说明本发明的指向性控制装置、指向性控制方 法及指向性控制系统的各实施方式。各实施方式的指向性控制系统被 用作例如在工厂、公共设施(例如图书馆、活动会场)或店铺(例如 小卖店、银行)设置的监控系统(包括有人监控系统及无人监控系统)。

另外,本发明可以表现为用于使计算机即指向性控制装置执行通 过指向性控制方法规定的动作的程序或者记录有使计算机执行通过指 向性控制方法规定的动作的程序的计算机能够读取的记录介质。

(第一实施方式)

图1是表示本实施方式的指向性控制系统10的系统结构的框图。 图1所示的指向性控制系统10包括相机装置1、全方位麦克风阵列装 置2、指向性控制装置3、记录器装置4。相机装置1、全方位麦克风 阵列装置2、指向性控制装置3、记录器装置4经由网络NW而相互连 接。网络NW可以是有线网络(例如内联网、互联网),也可以是无 线网络(例如无线LAN(LocalAreaNetwork)、WiMAX(注册商标)、 无线WAN(WideAreaNetwork))。在图1所示的指向性控制系统 10中,为了简化说明,相机装置1及全方位麦克风阵列装置2仅图示 1个,但是也可以包含多个相机装置及全方位麦克风阵列装置。

以下,对构成指向性控制系统10的各装置进行说明。另外,为了 简化以下的说明,作为将相机装置1的框体与全方位麦克风阵列装置2 的框体一体地安装于同一位置的情况进行说明(参照图5(A)),但 是相机装置1的框体与全方位麦克风阵列装置2的框体也可以分体地 安装于不同的位置。

作为拍摄部的一例的相机装置1例如经由后述的顶棚安装金属板 7z而固定地设置于活动会场的顶棚面8(参照图5(A))。相机装置 1具有例如作为监控系统中的监控相机的功能,通过来自与网络NW连 接的监控控制室(未图示)的远距离操作,使用缩放功能(例如推近 处理、拉远处理),拍摄预定收音区域(例如活动会场内的既定区域) 的全方位的影像。相机装置1将表示收音区域的全方位的影像的图像 数据(即,全方位图像数据)、或者对全方位图像数据实施预定变形 校正处理并进行全景变换而生成的俯视图像数据经由网络NW向指向 性控制装置3或记录器装置4发送。

当通过监控者的手指95在显示于显示器装置35的图像数据之中 指定任意位置时,相机装置1从指向性控制装置3接收图像数据中的 指定位置的坐标数据,算出从相机装置1到与指定位置对应的实际空 间上的声音位置(以下,简称为“声音位置”)的距离、方向(包括 水平角及垂直角。以下相同。)的数据而向指向性控制装置3发送。 另外,由于相机装置1中的距离、方向的数据计算处理是公知技术, 因此省略说明。

另外,相机装置1根据例如相机装置1中的定期的时机或者监控 者的手指95对显示于显示器装置35的图像数据的输入操作,进行图 像数据的推近处理或拉远处理。定期的时机例如为每1小时或每10分 钟1次的程度。与推近处理或拉远处理的倍率相关的信息可以预先指 定,也可以适当变更。相机装置1在进行了推近处理或拉远处理的情 况下,将与推近处理或拉远处理的倍率相关的信息向指向性控制装置3 发送。

作为收音部的一例的全方位麦克风阵列装置2例如经由后述的顶 棚安装金属板7z而固定地设置于活动会场的顶棚面8(参照图5(A))。 全方位麦克风阵列装置2至少包括:以均等的间隔设有多个麦克风单 元22、23(参照图2(A)~(E))的麦克风部;及对麦克风部的各麦 克风单元22、23的动作进行控制的CPU2p(参照图21)。

当电源被接通时,全方位麦克风阵列装置2对由麦克风单元内的 麦克风元件收音到的声音的声音数据实施预定声音信号处理(例如拉 远处理、滤波处理、加法运算处理),并将通过预定声音信号处理而 得到的声音数据经由网络NW向指向性控制装置3或记录器装置4发 送。

在此,参照图2(A)~图2(E),说明全方位麦克风阵列装置2 的框体的外观。图2(A)~图2(E)是全方位麦克风阵列装置2的框 体的外观图。图2(A)~图2(E)所示的全方位麦克风阵列装置2C、 2A、2B、2、2D的外观及多个麦克风单元的配置位置不同,但是全方 位麦克风阵列装置的功能相同。

图2(A)所示的全方位麦克风阵列装置2C具有圆盘状的框体21。 在框体21,呈同心圆状地配置有多个麦克风单元22、23。具体而言, 多个麦克风单元22呈具有与框体21相同的中心的同心圆状且沿着框 体21的圆周配置,多个麦克风单元23呈具于与框体21相同的中心的 同心圆状且配置在框体21的内侧。各个麦克风单元22相互的间隔宽, 直径大,具有适合于低音域的特性。另一方面,各个麦克风单元23相 互的间隔窄,直径小,具有适合于高音域的特性。

图2(B)所示的全方位麦克风阵列装置2A具有圆盘状的框体21。 在框体21上,多个麦克风单元22以均等的间隔沿着纵向和横向这两 个方向配置成十字状,纵向的排列与横向的排列在框体21的中心处相 交。全方位麦克风阵列装置2A将多个麦克风单元22沿纵向和横向这 两个方向直线性地配置,因此能够降低形成声音数据的指向性的情况 下的运算量。另外,在图2(B)所示的全方位麦克风阵列装置2A中, 可以仅沿纵向或横向的1列配置多个麦克风单元22。

图2(C)所示的全方位麦克风阵列装置2B与图2(A)所示的全 方位麦克风阵列装置2相比,具有直径小的圆盘状的框体21B。在框体 21B上,多个麦克风单元22沿着框体21B的圆周以均等的间隔配置。 图2(C)所示的全方位麦克风阵列装置2B由于各个麦克风单元22的 间隔短,因此具有适合于高音域的特性。

图2(D)所示的全方位麦克风阵列装置2具有在框体21C的中心 形成了具有预定直径的开口部21a的环形形状或圈形形状的框体21C。 在本实施方式的指向性控制系统10中,使用例如图2(D)所示的全 方位麦克风阵列装置2。在框体21C中,多个麦克风单元22沿着框体 21C的圆周方向以均等的间隔呈同心圆状地配置。

图2(E)所示的全方位麦克风阵列装置2D具有矩形形状的框体 21D。在框体21D上,多个麦克风单元22沿着框体21D的外周以均等 的间隔配置。在图2(E)所示的全方位麦克风阵列装置2D中,框体 21D为矩形形状,因此例如即使在拐角或壁面处也能够简化全方位麦 克风阵列装置2D的设置。

全方位麦克风阵列装置2的各麦克风单元22、23可以是无指向性 麦克风,也可以是双指向性麦克风、单一指向性麦克风、锐指向性麦 克风、超指向性麦克风(例如枪式麦克风)或它们的组合。

指向性控制装置3可以是例如设置于监控控制室(未图示)的安 置型的PC(PersonalComputer),也可以是监控者能够携带的携带电 话机、PDA(PersonalDigitalAssistant)、平板终端、智能手机等数据 通信终端。

指向性控制装置3是至少包括通信部31、操作部32、图像处理部 33、信号处理部34、显示器装置35、扬声器装置36、存储器37的结 构。信号处理部34至少包括指向方向计算部34a、输出控制部34b、 缩放连动控制部34c。

通信部31接收从相机装置1发送的图像数据或者与推近处理或拉 远处理的倍率相关的信息、或者从全方位麦克风阵列装置2发送的声 音数据而向信号处理部34输出。

操作部32是用于将监控者的输入操作向信号处理部34通知的用 户接口(UI:UserInterface),例如是鼠标、键盘等指点器。而且,操 作部32例如可以使用对应于显示器装置35的显示画面而配置且能够 检测监控者的手指95或指示笔的输入操作的触摸面板来构成。

操作部32将通过监控者的手指95在显示于显示器装置35的图像 数据(即,由相机装置1拍摄到的图像数据)之中指定的指定位置的 坐标数据向信号处理部34输出。而且,操作部32在通过手指95的输 入操作而在显示于显示器装置35的图像数据之中指示了推近处理或拉 远处理的执行的情况下,将推近处理或拉远处理的指示内容向信号处 理部34输出。

图像处理部33根据信号处理部34的指示,对显示于显示器装置 35的图像数据进行预定图像处理(例如人物的脸部检测、人物的移动 检测),并将图像处理结果向信号处理部34输出。

图像处理部33在通过相机装置1进行了推近处理的情况下,根据 信号处理部34的指示,检测推近处理后的显示器装置35的显示区域 上显示的监控对象物(例如人物)的脸部的轮廓,对脸部实施掩蔽处 理。具体而言,图像处理部33进行算出包含检测到的脸部的轮廓的矩 形区域并向矩形区域内加入预定晕映的处理。图像处理部33将通过加 入晕映的处理而生成的图像数据向信号处理部34输出。

信号处理部34例如使用CPU(CentralProcessingUnit)、MPU (MicroProcessingUnit)或DSP(DigitalSignalProcessor)而构成, 进行用于对指向性控制装置3的各部的动作整体性地进行总括的控制 处理、与其他各部之间的数据的输入输出处理、数据的运算(计算) 处理及数据的存储处理。

指向方向计算部34a在指向方向坐标(θMAh,θMAv)的计算时,若 从操作部32取得由监控者的手指95指定的图像数据的指定位置的坐 标数据,则从通信部31向相机装置1发送坐标数据。指向方向计算部 34a从通信部31取得从相机装置1的设置位置到与图像数据的指定位 置对应的实际空间上的声音(声源)位置为止的距离、方向的数据。

指向方向计算部34a使用从相机装置1的设置位置到声音位置为 止的距离、方向的数据,算出从全方位麦克风阵列装置2的设置位置 朝向声音位置的指向方向坐标(θMAh,θMAv)。如本实施方式那样,在 以包围相机装置1的框体的方式一体地安装全方位麦克风阵列装置2 的框体的情况下,可以使用从相机装置1到声音位置的方向(水平角、 垂直角)作为从全方位麦克风阵列装置2到声音位置的指向方向坐标 (θMAh,θMAv)。另外,在相机装置1的框体与全方位麦克风阵列装置 2的框体分离地安装的情况下,指向方向计算部34a使用事先算出的校 准参数的数据和从相机装置1到声音位置的方向(水平角、垂直角) 的数据,算出从全方位麦克风阵列装置2到声音位置的指向方向坐标 (θMAh,θMAv)。另外,校准是算出或取得指向性控制装置3的指向方 向计算部34a为了算出指向方向坐标(θMAh,θMAv)所需的预定校准参 数的动作。

指向方向坐标(θMAh,θMAv)中,θMAh表示从全方位麦克风阵列 装置2的设置位置朝向声音位置的指向方向的水平角,θMav表示从全方 位麦克风阵列装置2的设置位置朝向声音位置的指向方向的垂直角。 在以下的说明中,为了简化说明,相机装置1及全方位麦克风阵列装 置的各水平角的基准方向(0度方向)一致。

输出控制部34b(波束形成部)控制显示器装置35及扬声器装置 36的动作,将从相机装置1发送的图像数据显示于显示器装置35,将 从全方位麦克风阵列装置2发送的声音数据向扬声器装置36输出。而 且,输出控制部34b使用从全方位麦克风阵列装置2发送的声音数据, 在由指向方向计算部34a算出的指向方向坐标(θMAh,θMAv)表示的指 向方向上形成由全方位麦克风阵列装置2收音到的声音的指向性(波 束)。

而且,在通过相机装置1进行了图像数据的推近处理或拉远处理 的情况下,输出控制部34b将推近处理后或拉远处理后的图像数据显 示于显示器装置35,而且,使用由后述的缩放连动控制部34c调整后 的指向方向的波束宽度(尺寸),再形成声音数据的指向性。另外, 在此所说的尺寸没有限定为表示指向性的波束的波束宽度,也可以是 图4(A)、图4(B)、图4(C)所示的指向性图案PT1、PT2、PT3 的纵向的长度。以下同样地可以将波束宽度改读为波束尺寸。

由此,指向性控制装置3能够相对地增大形成有指向性的指向方 向上存在的监控对象物发出的声音的音量等级,能够抑制未形成指向 性的方向的声音而相对地降低音量等级。

在通过相机装置1进行了图像数据的推近处理或拉远处理的情况 下,缩放连动控制部34c(倍率设定部)使用与推近处理或拉远处理的 倍率相关的信息,调整由输出控制部34b形成的指向性(即,指向方 向的波束宽度)和从扬声器装置36输出的声音数据的音量等级中的至 少一方或其两方。另外,波束宽度及音量等级的调整量可以分别是既 定值,也可以是与推近处理或拉远处理的倍率相关的信息所对应的值。

具体而言,在通过相机装置1进行了图像数据的推近处理的情况 下,缩放连动控制部34c使用既定值或与推近处理的倍率相关的信息, 将指向方向的波束宽度调整得较窄,而且,提高声音数据的音量等级 (参照图4(B)及(C))。图4(B)是表示拉远操作前及推近操作 前的指向性图案PT1、显示画面、声音缩放范围SAR及显示画面的显 示范围DAR的图。图4(C)是表示推近处理时的指向性图案PT3、显 示画面、声音缩放范围SAR及显示画面的显示范围DAR的图。

另一方面,在通过相机装置1进行了图像数据的拉远处理的情况 下,缩放连动控制部34c使用既定值或与拉远处理的倍率相关的信息, 将指向方向的波束宽度调整得较宽,而且,维持声音数据的音量等级 (参照图4(A)及(B))。图4(A)是表示拉远处理时的指向性图 案PT2、显示画面,声音缩放范围SAR及显示画面的显示范围DAR 的图。

另外,在此说明进行了相机装置1的推近处理、拉远处理的情况, 但是并不局限于推近处理、拉远处理,在进行图像的放大、缩小处理 的情况下也能够应用同样的次序。例如,在一边将录像的图像重放一 边进行图像的放大、缩小处理的情况下,也可以变更声音的指向性。

在图4(A)~图4(C)中,显示画面的显示范围DAR表示在相 机装置1的视场角(即能够拍摄的区域IAR)内显示于显示器装置35 的图像数据的显示范围。在图4(B)中,声音缩放范围SAR表示形成 声音数据的指向性的范围。

图4(B)所示的指向性图案PT1表示在相机装置1进行推近处理 或拉远处理之前输出控制部34b形成的指向性(指向方向的波束宽度) 的默认状态。

图4(C)所示的指向性图案PT3表示在相机装置1进行了推近处 理之后输出控制部34b形成的指向性(指向方向的波束宽度)。图4 (A)所示的指向性图案PT2表示在相机装置1进行了拉远处理之后输 出控制部34b形成的指向性(指向方向的波束宽度)。

当对图4(B)所示的显示器装置35的图像数据进行推近处理时, 将指向方向的波束宽度调整得较窄,因此形成指向性的声音缩放范围 SAR变窄,指向性的强度上升。在这种情况下,在显示器装置35上, 推近处理后的图像数据、即与声音缩放范围SAR对应的显示范围DAR 内映现的1人的人物被放大显示,该人物发出的声音的音量等级也增 大地输出。

另一方面,当对图4(B)所示的显示器装置35的图像数据进行 拉远处理时,将指向方向的波束宽度调整得较宽,因此形成指向性的 声音缩放范围SAR变宽,指向性的强度下降。在这种情况下,在显示 器装置35上,拉远处理后的图像数据、即与声音缩放范围SAR对应的 显示范围DAR内映现的3人的人物被缩小显示,这3人的人物发出的 声音的音量等级以维持不变的状态输出。

而且,在通过相机装置1进行了推近处理的情况下,缩放连动控 制部34c对由全方位麦克风阵列装置2收音到的声音数据实施变声处 理而向输出控制部34b输出。

作为显示部的一例的显示器装置35使用例如LCD(LiquidCrystal Display)或有机EL(Electroluminescence)而构成,在输出控制部34b 的控制下,显示由相机装置1拍摄到的图像数据。

作为声音输出部的一例的扬声器装置36输出由全方位麦克风阵 列装置2收音到的声音的声音数据或在指向方向坐标(θMAh,θMAv)表 示的指向方向上形成了指向性的声音数据。另外,显示器装置35及扬 声器装置36可以设为与指向性控制装置3分体的结构。

作为存储部的一例的存储器38使用例如RAM(RandomAccess Memory)而构成,作为指向性控制装置3的各部的动作时的工作存储 器发挥功能。另外,存储器38也可以使用硬盘或闪存而构成,在这种 情况下,对记录器装置4中存储的图像数据及声音数据进行存储。

记录器装置4将由相机装置1拍摄到的图像数据与由全方位麦克 风阵列装置2收音到的声音的声音数据建立对应地存储。

图3是全方位麦克风阵列装置2在方向θ上形成声音数据的指向 性的延迟和方式的简单的说明图。为了便于理解说明,麦克风元件 221~22n排列在直线上。在这种情况下,指向性成为面内的二维区域, 但是为了在三维空间内形成指向性,只要将麦克风设为二维排列而进 行相同的处理方法即可。

从声源80发出的声波相对于全方位麦克风阵列装置2的麦克风单 元22、23内置的各麦克风元件221、222、223、…、22(n-1)、22n, 以某一定的角度(入射角=(90-θ)[度])入射。

声源80例如是全方位麦克风阵列装置2的指向方向上存在的监控 对象物(例如图5(A)所示的2人的人物91、92),相对于全方位麦 克风阵列装置2的框体21的面上,存在于预定角度θ的方向。而且, 各麦克风元件221、222、223、…、22(n-1)、22n间的间隔d固定。

从声源80发出的声波首先到达麦克风元件221而被收音,接下来 到达麦克风元件222而被收音,同样地接连不断被收音,最后到达麦 克风元件22n而被收音。

另外,例如在声源80为监控对象物(例如2人的人物91、92) 的交谈时的声音的情况下,从全方位麦克风阵列装置2的各麦克风元 件221、222、223、…、22(n-1)、22n的位置朝向声源80的方向与 从全方位麦克风阵列装置2的各麦克风(麦克风元件)朝向监控者在 显示器装置35上指定的指定位置所对应的声音位置的方向相同。

在此,从声波依次到达麦克风元件221、222、223、…、22(n-1) 的时刻至到达最后的麦克风元件22n的时刻为止,产生到达时间差τ1、 τ2、τ3、…、τ(n-1)。因此,在将各个麦克风元件221、222、223、…、 22(n-1)、22n收音到的声音的声音数据直接相加的情看下,由与以 相位偏移的状态进行加法运算,因此声波的音量等级整体变弱。

另外,τ1是声波到达麦克风元件221的时刻与声波到达麦克风元 件22n的时刻之差的时间,τ2是声波到达麦克风元件222的时刻与声 波到达麦克风元件22n的时刻之差的时间,同样,τ(n-1)是声波到达 麦克风元件22(n-1)的时刻与声波到达麦克风元件22n的时刻之差的 时间。

在本实施方式中,全方位麦克风阵列装置2是具有按照各麦克风 元件221、222、223、…、22(n-1)、22n而对应设置的A/D转换器 241、242、243、…、24(n-1)、24n、延迟器251、252、253、…、 25(n-1)、25n、加法运算器26的结构(参照图3)。

即,全方位麦克风阵列装置2将各麦克风元件221、222、223、…、 22(n-1)、22n收音到的模拟的声音数据在A/D转换器241、242、243、…、 24(n-1)、24n中A/D转换成数字的声音数据。

而且,全方位麦克风阵列装置2在延迟器251、252、253、…、25 (n-1)、25n中,赋予与各个麦克风元件221、222、223、…、22(n-1)、 22n的到达时间差对应的延迟时间而使全部声波的相位对齐之后,在加 法运算器26中将延迟处理后的声音数据相加。由此,全方位麦克风阵 列装置2对于各麦克风元件221、222、223、…、22(n-1)、22n,能 够在预定角度θ的方向上形成声音数据的指向性。

例如在图3中,由延迟器251、252、253、…、25(n-1)、25n 设定的各延迟时间D1、D2、D3、…、D(n-1)、Dn分别相当于到达 时间差τ1、τ2、τ3、…、τ(n-1),由数学式(1)表示。

[数学式1]

D1=L1Vs={d×(n-1)×cosθ}Vs

D2=L2Vs={d×(n-2)×cosθ}Vs

D3=L3Vs={d×(n-3)×cosθ}Vs

,…,

Dn-1=Ln-1Vs={d×1×cosθ}Vs

Dn=0...(1)

L1是麦克风元件221与麦克风元件22n的声波到达距离之差。L2 是麦克风元件222与麦克风元件22n的声波到达距离之差。L3是麦克 风元件223与麦克风元件22n的声波到达距离之差,同样,L(n-1) 是麦克风元件22(n-1)与麦克风元件22n的声波到达距离之差。Vs 是声波的速度(声速)。L1、L2、L3、…、L(n-1)、Vs是已知的值。 在图3中,由延迟器25n设定的延迟时间Dn为0(零)。

这样,全方位麦克风阵列装置2通过变更由延迟器251、252、 253、…、25(n-1)、25n设定的延迟时间D1、D2、D3、…、Dn-1、 Dn,能够简易地形成内置于麦克风单元22、23的各个麦克风元件221、 222、223、…、22(n-1)、22n收音到的声音的声音数据的指向性。

另外,图3所示的指向性的形成处理的说明为了简化说明而以全 方位麦克风阵列装置2进行的情况为前提来记载。但是,指向性控制 装置3的信号处理部34的输出控制部34b是具有与全方位麦克风阵列 装置2的麦克风的个数相同的个数的A/D转换器241~24n及延迟器 251~25n和1个加法运算器26的结构的情况下,指向性控制装置3的 信号处理部34的输出控制部34b可以使用由全方位麦克风阵列装置2 的各麦克风元件收音到的声音的声音数据,进行图3所示的指向性的 形成处理。

图5(A)是表示在屋内的大厅的顶棚面8上安装有一体地组装的 全方位麦克风阵列装置2及相机装置1的监控范围的图。图5(B)是 表示在全方位图像数据中包含2人的人物91、92的范围g的选择操作 的图。图5(C)是表示变形校正处理后的2人的人物91、92的图像数 据显示于显示器装置35且人物91、92的交谈的声音数据在扬声器装 置36中输出的情况的图。图5(D)是表示在全方位图像数据中包含2 人的人物93、94的范围h的选择操作的图。图5(E)是表示变形校正 处理后的2人的人物93、94的图像数据显示于显示器装置35且人物 93、94的交谈的声音数据在扬声器装置36中输出的情况的图。

在图5(A)中,示出在活动会场的顶棚面8设置有环形形状的全 方位麦克风阵列装置2、与全方位麦克风阵列装置2一体形成的相机装 置1、扬声器装置83的情况。而且,在图5(A)中,2人的人物91、 92正在交谈,2人的人物93、94正在交谈,扬声器装置82输出预定 音乐(例如BGM)的声音数据。

在图5(B)中,在显示器装置35的显示画面上显示由相机装置1 拍摄到的与收音区域的全方位相关的图像数据(全方位图像数据)。 监控者在例如显示器装置35的显示画面上显示的4人的人物91、92、 93、94的图像数据中,利用手指95对左上附近(具体而言附图标记g 的范围)进行触摸&拖动。相机装置1从指向性控制装置3取得表示手 指95通过触摸&拖动而指定的范围的坐标数据,并以使附图标记g的 范围成为中心的方式对全方位图像数据进行变形校正处理及全景变 换,由此生成平面图像数据而向指向性控制装置3发送。另外,范围g 由手指95的触摸点自动地生成。

在图5(C)中,通过相机装置1生成的平面图像数据显示在显示 器装置35上。而且,在通过手指95的触摸&拖动而指定了附图标记g 的范围的情况下,输出控制部34b在从全方位麦克风阵列装置2朝向 附图标记g的范围的中心位置所对应的声音位置的方向上形成声音数 据的指向性,因此将2人的人物91、92的交谈声音(Hello)的音量等 级比周围的声音的音量等级增大地输出(参照图5(B)及图5(C))。 另一方面,虽然设置在比2人的人物91、92更接近全方位麦克风阵列 装置2的距离处但是不包含于通过监控者指定的附图标记g的范围内 的扬声器装置82输出的音乐(参照图5(A)所示的(音符)) 未从扬声器装置36增强地输出,以比2人的人物91、92的交谈声音 的音量等级小的音量等级输出。

在图5(D)中,与图5(B)同样,在显示器装置35的显示画面 上显示由相机装置1拍摄到的与收音区域的全方位相关的图像数据(全 方位图像数据)。监控者在例如显示器装置35的显示画面上显示的4 人的人物91、92、93、94的图像数据中,利用手指95对右下附近(具 体而言附图标记h的范围)进行触摸&拖动。相机装置1从指向性控制 装置3取得表示手指95通过触摸&拖动而指定的范围的坐标数据,并 以使附图标记h的范围成为中心的方式对全方位图像数据进行变形校 正处理及全景变换,由此生成平面图像数据而向指向性控制装置3发 送。

在图5(E)中,通过相机装置1生成的平面图像数据显示在显示 器装置35上。而且,在通过手指95的触摸&拖动而指定了附图标记h 的范围的情况下,输出控制部34b在从全方位麦克风阵列装置2朝向 附图标记h的范围的中心位置所对应的声音位置的方向上形成声音数 据的指向性,因此2人的人物93、94的交谈声音(Hi!!)的音量等级 比周围的声音的音量等级增大地输出(参照图5(D)及图5(E))。 另一方面,虽然设置在比2人的人物93、94更接近全方位麦克风阵列 装置2的距离处但是不包含于通过监控者指定的附图标记h的范围内 的扬声器装置82输出的音乐(参照图5(A)所示的(音符)) 未从扬声器装置36增强地输出,以比2人的人物93、94的交谈声音 的音量等级小的音量等级输出。另外,范围h由手指95的触摸点自动 地生成。

接下来,参照图6,说明本实施方式的指向性控制系统10的详细 的动作次序。图6是详细说明第一实施方式的指向性控制装置3的动 作次序的流程图。作为图6的说明的前提,指向性控制装置3通过监 控者的手指95,指定显示器装置35上显示的图像数据中的任意位置, 算出从全方位麦克风阵列装置2朝向指95的指定位置所对应的实际空 间上的声音位置的指向方向。

在图6中,缩放连动控制部34c判定缩放连动标志是否为接通, 该缩放连动标志表示是否与相机装置1的推近处理或拉远处理连动地 调整声音数据的指向性(指向方向的波束宽度)及音量等级(S1)。 缩放连动控制部34c将缩放连动标志的内容存储在缩放连动控制部34c 自身或存储器37中,由此判定缩放连动标志是接通还是断开。在判定 为缩放连动标志是断开的情况下(S1为“否”),图6所示的指向性 控制装置3的动作结束。

另一方面,在判定为缩放连动标志是接通的情况下(S1为“是”), 输出控制部34b在从全方位麦克风阵列装置2朝向显示器装置35上显 示的图像数据中的指定位置所对应的实际空间上的声音位置的指向方 向上形成声音数据的指向性(S2)。

在步骤S2之后,通过相机装置1的定期的时机或监控者的输入操 作,指示显示器装置35上显示的图像数据的推近处理或拉远处理的执 行。相机装置1根据推近处理或拉远处理的执行的指示,进行显示器 装置35上显示的图像数据的推近处理或拉远处理。相机装置1在推近 处理或拉远处理之后,将与推近处理或拉远处理的倍率相关的信息和 推近处理或拉远处理后的图像数据经由网络NW向指向性控制装置3 发送。缩放连动控制部34c从通信部31取得与推近处理或拉远处理的 倍率相关的信息(缩放信息)及推近处理或拉远处理后的图像数据 (S3)。

缩放连动控制部34c使用推近处理或拉远处理后的图像数据,使 图像处理部33执行预定图像处理。图像处理部33按照来自缩放连动 控制部34c的指示,对显示器装置35上显示的推近处理或拉远处理后 的图像数据进行预定图像处理(例如人物的脸部检测、人物的移动检 测),并将图像处理结果向缩放连动控制部34c输出(S4)。

根据步骤S4中的图像处理结果,在显示器装置35上显示的推近 处理或拉远处理后的图像数据中未检测到人物的情况下(S5为“否”), 无论推近处理或拉远处理如何,缩放连动控制部34c都判定为不调整 而维持声音数据的指向性,而且,也不调整而维持声音数据的音量等 级。输出控制部34b在维持了推近处理或拉远处理之前的声音数据的 指向性的状态下,输出由全方位麦克风阵列装置2收音到的声音数据 (S6)。在步骤S6之后,图6所示的指向性控制装置3的动作结束。

另一方面,根据步骤S4中的图像处理结果,在显示器装置35上 显示的推近处理或拉远处理后的图像数据中检测到人物的情况下(S5 为“是”),缩放连动控制部34c基于在步骤S3中取得的与推近处理 或拉远处理的倍率相关的信息,判定是否通过相机装置1进行了推近 处理(S7)。

在判定为通过相机装置1进行了推近处理的情况下(S7为“是”), 缩放连动控制部34c进行与图像及声音相关的预定隐私保护处理(S8)。 在此,参照图7(A)、图7(B)、图8(A)~图8(C),说明预定 隐私保护处理的动作。

图7(A)是说明作为图6所示的隐私保护处理的第一例的声音隐 私保护处理的动作次序的流程图。图7(B)是说明作为图6所示的隐 私保护处理的第二例的图像隐私保护处理的动作次序的流程图。图8 (A)是表示与变声处理前的音调对应的声音信号的波形的一例的图。 图8(B)是表示与变声处理后的音调对应的声音信号的波形的一例的 图。图8(C)是在检测到的人物的脸部的轮廓内加入晕映的处理的说 明图。另外,在与图像及声音相关的预定隐私保护处理的说明中,为 了使说明便于理解,将附图分开来说明图7(A)所示的图像隐私保护 处理和图7(B)所示的声音隐私保护处理,但是指向性控制装置3也 可以连续地进行图7(A)所示的动作与图7(B)所示的动作。

在图7(A)中,缩放连动控制部34c判定声音隐私保护设定是否 为接通(S8-1)。缩放连动控制部34c通过将声音隐私保护设定的内容 存储于缩放连动控制部34c自身或存储器37,来判定声音隐私保护设 定是接通还是断开。在判定为声音隐私保护设定是断开的情况下(S8-1 为“否”),图7(A)所示的声音隐私保护处理结束。

另一方面,在判定为声音隐私保护设定是接通的情况下(S8-1为 “是”),缩放连动控制部34c对显示器装置35上显示的图像数据进 行推近处理之后,对扬声器装置36输出的声音数据实施变声处理 (S8-2)。在步骤S8-2之后,图7(A)所示的声音隐私保护处理结束。

作为变声处理的一例,缩放连动控制部34c例如将由全方位麦克 风阵列装置2收音到的声音的声音数据或者通过输出控制部34b形成 了指向性的声音数据的波形的音调增大或减小(例如参照图8(A)及 图8(B))。由此,缩放连动控制部34c使由全方位麦克风阵列装置 2收音到的声音或者形成了指向性的声音数据是谁发出的声音的确定 变得困难,从而能够有效地保护通过推近处理进行了切换的监控对象 物(例如人物)的隐私。

而且,在图7(B)中,缩放连动控制部34c判定图像隐私保护设 定是否为接通(S8-3)。缩放连动控制部34c通过将图像隐私保护设定 的内容存储于缩放连动控制部34c自身或存储器37,来判定图像隐私 保护设定是接通还是断开。在判定为图像隐私保护设定是断开的情况 下(S8-3为“否”),输出控制部34b将推近处理后的图像数据直接 显示于显示器装置35(S8-6)。

另一方面,在判定为图像隐私保护设定是接通的情况下(S8-3为 “是”),图像处理部33按照缩放连动控制部34c的指示,检测(提 取)推近处理后的显示器装置35的显示区域上显示的监控对象物(例 如人物TRG)的脸部的轮廓DTL(S8-4),并对脸部的轮廓DTL实施 掩蔽处理(S8-5)。具体而言,图像处理部33算出包含检测到的脸部 的轮廓DTL的矩形区域,进行向矩形区域内加入预定晕映的处理(参 照图8(C))。图像处理部33将通过加入晕映的处理而生成的图像数 据向输出控制部34b输出。

由此,图像处理部33使推近处理后的监控对象的被摄体(例如特 定的人物)是谁难以分辨,从而能够有效地保护被摄体的图像上的隐 私。输出控制部34b将推近处理后的图像数据显示于显示器装置35 (S8-6)。在步骤S8-6之后,图7(B)所示的图像隐私保护处理结束。

在图6中,缩放连动控制部34c在进行了步骤S8的隐私保护处理 之后,使用既定值或与推近处理的倍率相关的信息,将指向方向的波 束宽度调整得较窄,而且,提升声音数据的音量等级(S9)。此外, 输出控制部34b根据缩放连动控制部34c的调整后的指向方向的波束 宽度,再形成声音数据的指向性(S9)。在步骤S9之后,指向性控制 装置3的动作进入步骤S6。

另一方面,在判定为通过相机装置1进行了拉远处理的情况下 (S10为“是”),缩放连动控制部34c使用既定值或与拉远处理的倍 率相关的信息,将指向方向的波束宽度调整得较宽,而且,维持声音 数据的音量等级,或者在当前的音量等级充分大的情况下降低音量等 级(S11)。此外,输出控制部34b根据缩放连动控制部34c的调整后 的指向方向的波束宽度,再形成声音数据的指向性(S11)。在步骤S11 之后,指向性控制装置3的动作进入步骤S6。

由此,在本实施方式的指向性控制系统10中,在通过相机装置1 对于显示器装置35上显示的监控对象(例如人物)的缩放处理而切换 了监控对象的被摄体的情况下,指向性控制装置3根据缩放处理来调 整声音数据的指向性的强度(即,指向方向的波束宽度),而且,对 应于调整后的波束宽度而再形成指向性,因此能够适当地形成对于切 换后的监控对象的被摄体的声音数据的指向性,能够抑制监控者的监 控业务的效率劣化。

例如,在图像数据的缩放处理为推近处理的情况下,指向性控制 装置3能够将指向方向的波束宽度调整得较窄,并能够将切换后的监 控对象的被摄体(例如特定的人物)发出的声音比被摄体的周围的声 音更显著地输出,因此能够提高监控者的监控业务效率。

而且,例如,在图像数据的缩放处理为拉远处理的情况下,指向 性控制装置3能够将指向方向的波束宽度调整得较宽,并能够将切换 后的监控对象的被摄体(例如多个人物)发出的声音网罗性地输出, 因此能够提高监控者的监控业务效率。

而且,在通过对监控对象的缩放处理而切换了监控对象的被摄体 的情况下,指向性控制装置3判定是否需要声音数据的音量等级的调 整,因此,能够根据缩放处理的内容,并对应于切换后的监控对象相 对于显示部的显示区域的大小,没有不适感地输出声音。

例如,在图像数据的缩放处理为推近处理的情况下,指向性控制 装置3能够提升声音数据的音量等级,并能够将切换后的监控对象的 被摄体(例如特定的人物)发出的声音以比被摄体的周围的声音大的 音量输出,因此能够提高监控者的监控业务效率。

而且,例如,即使图像数据的缩放处理为拉远处理,指向性控制 装置3也能够维持声音数据的音量等级,因此能够将切换后的监控对 象的被摄体(例如多个人物)发出的声音与被摄体的周围的声音同等 地输出,通过拉远处理也能够使监控者没有不适感地执行监控业务。

而且,在通过图像处理部判断为在图像数据中未检测到人物的情 况下,指向性控制装置3维持指向方向的波束宽度,因此在图像数据 中未检测到人物的情况下,不调整声音数据的指向性的强弱,能够消 除在人物未映入的状况下收音区域的周围的环境音发生变动这样的不 适感。

(第二实施方式)

在第一实施方式的指向性控制系统10中,指向性控制装置3根据 相机装置1的推近处理或拉远处理,将指向方向的波束宽度调整得较 窄或较宽,而且,在推近处理的情况下,提升声音数据的音量等级。

然而,在第一实施方式的指向性控制系统10中,可考虑如下情况: 由于内置在全方位麦克风阵列装置2内的麦克风的配置数为既定,因 此即使在根据推近处理或拉远处理而调整了指向方向的波束宽度或音 量等级的情况下,例如由于收音区域的环境的不同而指向方向的声音 数据的增强也可能并不充分。

因此,在第二实施方式中,说明在即使根据推近处理或拉远处理 而调整了指向方向的波束宽度或音量等级、但是指向方向的声音数据 的增强也并不充分的情况下在全方位麦克风阵列装置2的周围结合有 增设麦克风部的指向性控制系统。第二实施方式的指向性控制系统的 系统结构中的后述的增设麦克风部以外的结构与第一实施方式的指向 性控制系统10相同,因此简化或省略关于同一内容的说明,对不同内 容进行说明。

接下来,参照图9,说明本实施方式的指向性控制装置3的动作 次序。图9是说明第二实施方式的指向性控制装置3的动作次序中的 与第一实施方式的指向性控制装置3的动作次序不同的动作次序的流 程图。在本实施方式的指向性控制装置3的动作次序的说明中,说明 与第一实施方式的指向性控制装置3的动作次序不同的动作次序。作 为图9的说明的前提,说明增设麦克风部与全方位麦克风阵列装置2 的周围结合之前的状态。

在图9中,缩放连动控制部34c在进行了步骤S8的隐私保护处理 之后,使用既定值或与推近处理的倍率相关的信息,将指向方向的波 束宽度调整得较窄,而且,提升声音数据的音量等级(S9)。此外, 输出控制部34b根据缩放连动控制部34c的调整后的指向方向的波束 宽度,再形成声音数据的指向性(S9)。

在步骤S9之后,缩放连动控制部34c向监控者询问步骤S9中的 通过指向性的再形成及调整后的声音数据的音量等级而输出的声音数 据的声音增强是否充分(S21)。例如,缩放连动控制部34c使显示器 装置35显示用于询问声音增强是否充分的弹出画面,接受监控者的与 询问相关的回答的输入操作。在输入了声音增强充分的回答的情况下 (S21为“是”),指向性控制装置3的动作进入步骤S6。

另一方面,在输入了声音增强不充分的回答的情况下(S21为 “否”),在当前的设有全方位麦克风阵列装置2的指向性控制系统 10的结构中,由于指向方向的声音增强不充分,因此在将全方位麦克 风阵列装置2或者全方位麦克风阵列装置2及增设麦克风部的电源切 断之后(S22),按照后述的安装方法,在全方位麦克风阵列装置2的 周围重新结合增设麦克风部(S23)。在增设麦克风部对于全方位麦克 风阵列装置2的周围的结合结束的情况下(S24为“是”),将全方位 麦克风阵列装置2或者全方位麦克风阵列装置2及增设麦克风部的电 源接通(S25)。然后,缩放连动控制部34c再次向监控者询问步骤S9 中的通过指向性的再形成及调整后的声音数据的音量等级而输出的声 音数据的声音增强是否充分(S21)。

接下来,参照附图,说明在本实施方式中作为第一收音部的全方 位麦克风阵列装置2的周围结合的各种增设麦克风部。

图10(A)是表示在全方位麦克风阵列装置2的周围结合增设麦 克风部2z1a的第一例(环形结合)的主视图。图10(B)是表示在全 方位麦克风阵列装置2的周围结合增设麦克风部2z1a的第一例的侧视 图。

在图10(A)中,作为第二收音部的一例的增设麦克风部的第一 例,示出具有将全方位麦克风阵列装置2的周围包围的程度的开口部 且具有与全方位麦克风阵列装置2呈同心圆状的框体(环状框体)的 增设麦克风部2z1a。具体而言,增设麦克风部2z1a与全方位麦克风阵 列装置2未结合在同一平面上,而如图10(B)所示沿高度方向(铅垂 方向)分离地设置。

作为结合方法,首先从顶棚面8将全方位麦克风阵列装置2及相 机装置1拆卸,将增设麦克风部2z1a安装于顶棚面8并经由螺丝孔 7eb1、7eb2通过螺丝41来固定,之后,将全方位麦克风阵列装置2安 装成与增设麦克风部2z1a沿高度方向分离,全方位麦克风阵列装置2 与增设麦克风部2z1a经由螺丝孔7ea1、7ea2通过螺丝41来固定。另 外,也可以是全方位麦克风阵列装置2及相机装置1和增设麦克风部 2z1a分别固定地安装于顶棚面8,并分别经由螺丝孔7ea1、7ea2通过 螺丝41进行固定。而且,增设麦克风部2z1a优选将增设麦克风部2z1a 的框体通过顶棚安装配件7r固定于顶棚面8。而且,从补强强度的观 点出发,在全方位麦克风阵列装置2的框体设置的螺丝孔7eb1、7eb2 优选设置在图10(A)所示的比容限线SPL靠外侧的位置。而且,在 此,作为结合方法,说明了通过使用了螺丝41的螺丝紧固进行固定的 例子,但是也可以使用公知的卡止构造进行固定,以下同样。

因此,通过图10(A)所示的增设麦克风部2z1a的结合,本实施 方式的指向性控制系统10在增设麦克风部2z1a的圆周上均等地配置多 个麦克风元件,由此,与单独使用全方位麦克风阵列装置2的情况的 声音的收音特性相比,能够均等地进一步提高相对于全方位的声音的 收音特性。而且,指向性控制系统10将全方位麦克风阵列装置2与增 设麦克风部2z1a沿高度方向分离地设置,因此能够提高垂直方向(铅 垂方向)的收音性能。

图11是表示在全方位麦克风阵列装置2的周围结合增设麦克风部 2z2的第二例(椭圆环形结合)的主视图。

在图11中,作为增设麦克风部的第二例,示出具有将全方位麦克 风阵列装置2的周围包围的程度的开口部且具有椭圆形状的框体的增 设麦克风部2z2。增设麦克风部2z2的安装方法与图10(B)所示的增 设麦克风部2z1a的安装方法同样,经由螺丝孔7ec1、7ec2通过螺丝41 来固定,其他说明(例如全方位麦克风阵列装置2及相机装置1的固 定方法、设置在比容限线SPL靠外侧的位置的螺丝孔7ea1、7ea2。以 下同样。)相同,因此省略说明。

因此,通过图11所示的增设麦克风部2z2的结合,本实施方式的 指向性控制系统10例如在增设麦克风部2z2的椭圆形状的长度方向上 能够配置比椭圆形状的长度方向以外的方向更多的麦克风元件,与单 独使用全方位麦克风阵列装置2的情况的声音的收音特性相比,能够 均匀地提高声音的收音特性,而且,能够更进一步提高相对于椭圆形 状的长度方向的声音的收音特性。而且,指向性控制系统10由于将全 方位麦克风阵列装置2与增设麦克风部2z2沿高度方向分离地设置, 因此能够提高垂直方向(铅垂方向)的收音性能。

图12(A)是表示在全方位麦克风阵列装置2的周围结合增设麦 克风部2z3的第三例(正方形结合或长方形结合)的主视图。图12(B) 是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z3的第 三例(正方形结合或长方形结合)的侧视图。

在图12(A)中,作为增设麦克风部的第三例,示出具有将全方 位麦克风阵列装置2的周围包围的程度的开口部且具有矩形形状的框 体(例如正方形形状或长方形形状的框体)的增设麦克风部2z3。具体 而言,增设麦克风部2z3与全方位麦克风阵列装置2未结合在同一平 面上,而如图12(B)所示,沿高度方向(铅垂方向)分离地设置。

作为结合方法,首先从顶棚面8将全方位麦克风阵列装置2及相 机装置1拆卸,将增设麦克风部2z3安装于顶棚面8而经由螺丝孔7ed1、 7ed2通过螺丝41来固定,然后,将全方位麦克风阵列装置2安装成与 增设麦克风部2z3沿高度方向分离,全方位麦克风阵列装置2和增设 麦克风部2z3经由螺丝孔7ea1、7ea2通过螺丝41来固定。另外,全方 位麦克风阵列装置2和增设麦克风部2z3也可以分别固定地安装于顶 棚面8,并分别经由螺丝孔7ea1、7ea2通过螺丝41来固定。

因此,通过图12(A)所示的增设麦克风部2z3的结合,本实施 方式的指向性控制系统10在增设麦克风部2z3的开口部的周围均等地 配置多个麦克风元件,由此,与单独使用全方位麦克风阵列装置2的 情况的声音的收音特性相比,能够均等地进一步提高对于全方位的声 音的收音特性,而且,能够灵活地设置增设麦克风部2z3。而且,指向 性控制系统10由于将全方位麦克风阵列装置2与增设麦克风部2z3沿 高度方向分离地设置,因此能够提高垂直方向(铅垂方向)的收音性 能。

图13(A)是表示在全方位麦克风阵列装置2的周围结合增设麦 克风部2z4的第四例(蜂窝形结合)的主视图。图13(B)是表示在全 方位麦克风阵列装置2s的周围结合增设麦克风部2z4的第五例(蜂窝 形结合)的主视图。

在图13(A)中,作为增设麦克风部的第四例,示出具有将全方 位麦克风阵列装置2的周围包围的程度的开口部且具有蜂窝形状的框 体的增设麦克风部2z4。增设麦克风部2z4的安装方法与图10(B)所 示的增设麦克风部2z1a的安装方法同样,经由螺丝孔7ee1、7ee2通过 螺丝41来固定,由于其他说明相同,因此省略说明。另外,蜂窝形状 的增设麦克风部2z4的安装数并不局限于1个,根据需要也可以为2 个以上。

而且,在图13(B)中,作为增设麦克风部的第五例,示出具有 与图13(A)所示的蜂窝形状相同的蜂窝形状的框体的增设麦克风部 2z4a,全方位麦克风阵列装置2s的框体的形状与全方位麦克风阵列装 置2的框体的形状不同,为矩形形状。增设麦克风部2z4a未形成图13 (A)所示的增设麦克风部2z4的开口部。而且,在全方位麦克风阵列 装置2s的中心安装使用了鱼眼透镜的鱼眼相机(相机装置)1s。增设 麦克风部2z4a的安装方法与图10(B)所示的增设麦克风部2z1a的安 装方法同样,经由螺丝孔7ef1、7ef2通过螺丝41来固定,而且,全方 位麦克风阵列装置2s也同样经由螺丝孔7ea3、7ea4通过螺丝41来固 定,由于其他说明相同,因此省略说明。

因此,通过图13(A)或图13(B)所示的增设麦克风部2z4、2z4a 的结合,本实施方式的指向性控制系统10沿着增设麦克风部2z4的开 口部或增设麦克风部2z4a的轮廓而均等地配置多个麦克风元件,由此, 与单独使用全方位麦克风阵列装置2的情况的声音的收音特性相比, 能够均等地进一步提高对于全方位的声音的收音特性,而且,能够灵 活地设置增设麦克风部2z4、2z4a,根据增设麦克风部2z4、2z4a的增 设方向,能够使收音性能带有差别。而且,指向性控制系统10由于将 全方位麦克风阵列装置2与增设麦克风部2z4、2z4a沿高度方向分离地 设置,因此能够提高垂直方向(铅垂方向)的收音性能。

图14(A)是表示在全方位麦克风阵列装置2的周围结合增设麦 克风部2z5a、2z5b、2z5c、2z5d的第六例(棒形结合)的主视图。图 14(B)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部 2z5a、2z5b、2z5c、2z5d的第六例(棒形结合)的侧视图。

在图14(A)中,作为增设麦克风部的第六例,在全方位麦克风 阵列装置2的周围示出具有一方向长的棒形状的框体的增设麦克风部 2z5a、2z5b、2z5c、2z5d。具体而言,增设麦克风部2z5a、2z5b、2z5c、 2z5d与全方位麦克风阵列装置2可以结合在同一平面上,也可以沿高 度方向(铅垂方向)分离地设置。

作为结合方法,首先从顶棚面8将全方位麦克风阵列装置2拆卸, 将已设的顶棚安装金属板7z的端部和用于安装增设麦克风部(例如增 设麦克风部2z5a、2z5c)的增设用安装金属板7z1、7z2的端部分别嵌 入并卡止,通过螺丝41进行固定。而且,全方位麦克风阵列装置2及 相机装置1安装于顶棚安装金属板7z而通过螺丝41固定,之后,将 增设麦克风部(例如增设麦克风部2z5a、2z5c)安装于增设用安装金 属板7z1、7z2而通过螺丝41进行固定。

因此,通过图14(A)所示的增设麦克风部2z5a、2z5b、2z5c、 2z5d的结合,本实施方式的指向性控制系统10沿着增设麦克风部2z5a、 2z5b、2z5c、2z5d的长度方向均等地配置多个麦克风元件,由此,与 单独使用全方位麦克风阵列装置2的情况的声音的收音特性相比,能 够进一步提高相对于棒形状的长度方向的声音的收音特性。

在此,关于图14(B)所示的全方位麦克风阵列装置2及相机装 置1相对于顶棚安装金属板7z的安装构造、增设麦克风部2z5a、2z5c 相对于增设用安装金属板7z1、7z2的安装构造、顶棚安装金属板7z 与增设用安装金属板7z1、7z2的卡止构造,参照图15(A)及图15(B) 进行说明。图15(A)是表示安装有图14(B)所示的全方位麦克风阵 列装置2和顶棚安装金属板7z的状态的俯视图。图15(B)示出图15 (A)的E-E截面,是表示在图14(B)所示的全方位麦克风阵列装置 2的周围安装有增设麦克风部2z5a、2z5c的状态的侧视图。

图15(A)示出从顶棚安装金属板7z的表面观察的情况、即从顶 棚面8观察图15(B)所示的下方向的情况的全方位麦克风阵列装置2 及相机装置1的安装构造。顶棚安装金属板7z是表面具有凹凸的形成 为大致圆盘状的金属制的部件,但也可以取代而使用陶瓷制或合成树 脂(例如塑料或弹性体)制的部件。

在与顶棚面8相对的顶棚安装金属板7z的表面上,沿同轴i方向 突出且用于安装固定相机装置1的卡止片7a形成于同心圆上的三个部 位。而且,在顶棚安装金属板7z的表面上,沿同轴i方向突出且用于 安装固定全方位麦克风阵列装置2的卡止片7b形成于比形成有卡止片 7a的同心圆大的直径的同心圆上的三个部位。

与设于相机装置1的底面的固定销43卡合的卡合孔71呈一端部 的直径比另一端部的直径大的大致葫芦状地形成于卡止片7a。同样, 与设于全方位麦克风阵列装置2的底面的固定销45卡合的卡合孔73 呈一端部的直径比另一端部的直径大的大致葫芦状地形成于卡止片 7b。

固定销43、45分别由具有卡合孔71、73的一端部与另一端部之 间的粗细(直径)的头部和比头部细的躯干部构成。

在顶棚安装金属板7z的表面上,扇形的孔部7c、7d分别以向卡 止片7a及卡止片7b的外侧扩展的方式形成于三个部位。在顶棚安装 金属板7z安装有全方位麦克风阵列装置2及相机装置1的情况下,以 使全方位麦克风阵列装置2及相机装置1的各水平角的基准方向一致 的方式设计上述的扇形的孔部7c、7d的形状及位置。

在顶棚安装金属板7z的表面的中央部,供螺丝41插通的螺丝孔 7e形成于三个部位。经由螺丝孔7e而使螺丝41与顶棚面8螺合,由 此顶棚安装金属板7z固定于顶棚面8。

在全方位麦克风阵列装置2及相机装置1安装于顶棚安装金属板 7z的情况下,首先,将相机装置1安装于顶棚安装金属板7z。在这种 情况下,使固定销43与形成于卡止片7a的卡合孔71卡合。

即,将向相机装置1的底面突出的固定销43向卡合孔71的直径 大的一端部侧插入。并且,在固定销43的头部从卡合孔71突出的状 态下,通过使相机装置1向右方向或左方向旋转而使固定销43在卡合 孔71中移动(旋转锁定方式)。并且,在固定销43的头部移动到卡 合孔71的另一端部侧的状态下,固定销43与卡合孔71卡合,相机装 置1沿同轴i方向被固定。

在将相机装置1安装于顶棚安装金属板7z之后,以使相机装置1 从全方位麦克风阵列装置2的开口部21a的内侧露出的方式将全方位 麦克风阵列装置2安装于顶棚安装金属板7z。在这种情况下,使固定 销45与形成于卡止片7b的卡合孔73卡合。另外,将固定销45固定 于卡合孔73的次序与将固定销43固定于卡合孔71的次序相同。

图16(A)是表示在全方位麦克风阵列装置2的周围结合增设麦 克风部2z5a、2z5b、2z5c、2z5d、2z5e、2z5f、2z5g、2z5h的第七例(棒 形结合)的主视图。图16(B)是表示在全方位麦克风阵列装置2的周 围结合增设麦克风部2z5c、2z5f、2z5h的第八例(棒形结合)的主视 图。图16(C)是表示在全方位麦克风阵列装置2的周围结合增设麦克 风部2z5a、2z5e的第九例(棒形结合)的主视图。

在图16(A)~图16(C)中,若除去增设麦克风部的个数,则各 个增设麦克风部的安装方法及安装增设麦克风部产生的效果与图14 (A)所示的增设麦克风部2z5a、2z5b、2z5c、2z5d的安装方法及安装 增设麦克风部产生的效果相同,因此省略说明。

图17(A)是表示在全方位麦克风阵列装置2的周围结合增设麦 克风部m1、m2、m3、m4的第十例(构架形结合)的主视图。图17 (B)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部m1、 m2、m3、m4的第十例(构架形结合)的侧视图。图17(C)是表示 在全方位麦克风阵列装置2的周围结合增设麦克风部m1、m2、m3、 m4、m5、m6、m7、m8的第十一例(构架形结合)的主视图。图17 (D)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部m1、 m2、m3、m4、m5、m6、m7、m8的第十一例(构架形结合)的侧视 图。

在图17(A)中,作为增设麦克风部的第十例,在全方位麦克风 阵列装置2的框体的相向的四个部位设置的连接器部c1、c2、c3、c4, 经由麦克风线收容管n1、n2、n3、n4而结合增设麦克风部m1、m2、 m3、m4。

作为结合方法,首先,在全方位麦克风阵列装置2的框体的相向 的四个部位设置的连接器部c1、c2、c3、c4上连接麦克风线收容管n1、 n2、n3、n4。麦克风线收容管n1、n2、n3、n4例如通过树脂成型来制 造,在内部收容有用于传送由增设麦克风部m1、m2、m3、m4收音到 的声音的声音数据的信号线。在连接了麦克风线收容管n1、n2、n3、 n4之后,将增设麦克风部m1、m2、m3、m4与麦克风线收容管n1、 n2、n3、n4连接,增设麦克风部m1、m2、m3、m4的结合结束。

因此,通过图17(A)所示的增设麦克风部m1、m2、m3、m4的 结合,本实施方式的指向性控制系统10不需要上述的用于收容增设麦 克风部内的麦克风元件的框体,能够将由框体引起的声音(声波)的 旋入排除而对声音进行收音,因此不需要将全方位麦克风阵列装置2 与增设麦克风部m1、m2、m3、m4沿高度方向分离地设置。而且,指 向性控制系统10经由麦克风线收容管n1、n2、n3、n4,能够将设置在 全方位麦克风阵列装置2的周围的连接器部c1、c2、c3、c4与增设麦 克风部m1、m2、m3、m4简易地连接,而且,与在全方位麦克风阵列 装置2增设具有预定形状的框体的增设麦克风部的情况相比,能够使 增设麦克风部轻量化,因此能够进一步提高增设麦克风部内的麦克风 元件的收音特性。

而且,在图17(C)中,也是若除去增设麦克风部的个数,则各 个增设麦克风部的安装方法与图17(A)所示的增设麦克风部m1、m2、 m3、m4的安装方法相同,因此省略说明。关于效果,通过追加增设麦 克风部m1、m2、m3、m4和高度不同的增设麦克风部m5、m6、m7、 m8,与仅结合增设麦克风部m1、m2、m3、m4的第十例相比,能够提 高垂直方向(铅垂方向)的收音性能。

图18(A)是表示具有将全方位麦克风阵列装置2的周围包围的 开口部且具有与全方位麦克风阵列装置2呈同心圆状的框体(环框体) 的增设麦克风部2z1的结合方法的第一例的主视图。图18(B)是表示 增设麦克风部2z1向全方位麦克风阵列装置2的周围的结合方法的第 二例的主视图。

在图18(A)所示的结合方法中,将全方位麦克风阵列装置2及 相机装置1预先连接于放大顶棚安装金属板7y,在结合增设麦克风部 2z1的情况下,以包围全方位麦克风阵列装置2的周围的方式连接于放 大顶棚安装金属板7y。

在图18(B)所示的结合方法中,从已设的顶棚安装金属板7z将 全方位麦克风阵列装置2及相机装置1拆卸,在顶棚安装金属板7z上 固定例如4个固定部f1、f2、f3、f4,而且,在将增设麦克风部2z1安 装于顶棚安装金属板7z的情况下,在4个固定部f1、f2、f3、f4分别 紧固固定螺丝41。之后,以收纳于增设麦克风部2z1的开口部的方式 安装全方位麦克风阵列装置2及相机装置1。

图19(A)是表示增设麦克风部2z1向全方位麦克风阵列装置2f 的周围的结合方法的第三例的主视图。图19(B)示出图19(A)的 E-E截面,是表示增设麦克风部2z1向全方位麦克风阵列装置2f的周 围的结合方法的第三例的侧视图。图19(C)是表示增设麦克风部2z1 向全方位麦克风阵列装置2的周围的结合方法的第四例的补充说明图。 在图19(A)及图19(B)所示的例子中,在全方位麦克风阵列装置 2f的框体的圆周设置能够供例如2个钩部f5、f7卡止的凹部u1、u2。

在图19(A)及图19(B)所示的结合方法中,从已设的顶棚安 装金属板7z将全方位麦克风阵列装置2f及相机装置1拆卸,在顶棚安 装金属板7z上,使设置在增设麦克风部2z1的开口部的相向的四个部 位的钩部f5、f6、f7、f8卡止而固定于凹部u1、u2,进而,安装全方 位麦克风阵列装置2f及相机装置1。

在图19(C)所示的结合方法中,已设的顶棚安装金属板7z更换 为例如设有3个钩部f9、f10、f11的放大顶棚安装金属板7y。在放大 顶棚安装金属板7y上依次通过旋转锁定方式(参照图15(A))而连 接增设麦克风部2z1、全方位麦克风阵列装置2及相机装置1,由此增 设麦克风部2z1相对于全方位麦克风阵列装置2而结合。

图20是表示在全方位麦克风阵列装置2s1的周围结合增设麦克风 部2zs1的第十二例(片形结合)的立体图。全方位麦克风阵列装置2s1 的框体为矩形形状,在中央设置能够收容包含鱼眼透镜的鱼眼相机1s 或者与鱼眼相机1s相同大小的盖的圆状连结部jg3,在中间边部设置形 成有半圆状的凹面的中间边连结部jg2,而且,在两端部设置形成有1/4 圆状的凹面的两端连结部jg1。

在图20所示的结合方法中,增设麦克风部2zs1与全方位麦克风 阵列装置2s1的框体的周围相邻,而且以成为同一平面上的方式通过粘 结等结合并固定。另外,在图20所示的结合方法中,1个或多个增设 麦克风部2zs1能够与全方位麦克风阵列装置2s1结合,鱼眼相机1s移 设于全方位麦克风阵列装置2s1及增设麦克风部的结合后的框体的中 央。

因此,通过图20所示的增设麦克风部2zs1的结合,本实施方式 的指向性控制系统10在全方位麦克风阵列装置2s1的周围能够容易地 连结增设麦克风部2zs1,根据增设麦克风部2zs1的连结数,能够将全 方位麦克风阵列装置2s1的框体的中心设置的鱼眼相机1s对应于连结 后(结合后)的全方位麦克风阵列装置2s1及增设麦克风部2zs1的框 体形状,而简易地移设于连结后(结合后)的全方位麦克风阵列装置 2s1及增设麦克风部2zs1的框体形状的中心位置。

最后,参照图21,简单地说明上述的本实施方式的增设麦克风部 相对于全方位麦克风阵列装置2而结合的情况下的全方位麦克风阵列 装置2及增设麦克风部的硬件结构。图21是表示增设麦克风部2z1所 结合的全方位麦克风阵列装置2的硬件结构的一例的框图。另外,在 图21中,省略向图1所示的网络NW的连接线的图示。

增设麦克风部2z1是包括至少多个(例如m个)麦克风元件22 (n+1)~22(n+m)和与麦克风元件同数的ADC24(n+1)~24(n+m) 的结构。增设麦克风部2z1经由结合部CN2而能够与全方位麦克风阵 列装置2结合。由增设麦克风部2z1的麦克风元件22(n+1)~22(n+m) 收音到的模拟的声音信号在ADC24(n+1)~24(n+m)中被转换成数 字的声音信号,向全方位麦克风阵列装置2的I/F部2if输入。CPU2p 将由全方位麦克风阵列装置2内的麦克风元件221~22n和增设麦克风 部22(n+1)~22(n+m)收音到的声音信号从未图示的通信I/F部向指 向性控制装置3发送。

以下,说明上述的本发明的指向性控制装置、指向性控制方法及 指向性控制系统的结构、作用及效果。

本发明的一实施方式涉及指向性控制装置,对由包括多个麦克风 的收音部收音到的声音的指向性进行控制,该指向性控制装置具备: 波束形成部,在从所述收音部向与在显示部的图像上指定的位置对应 的声源的方向上形成波束;及倍率设定部,根据输入来设定用于放大 或缩小所述显示部的图像的倍率,所述波束形成部根据由所述倍率设 定部设定的倍率来变更所述形成的波束的尺寸。

在该结构中,指向性控制装置对由包括多个麦克风的收音部收音 到的声音的指向性进行控制,在从收音部向与在显示部的图像上指定 的位置对应的声源的方向上形成波束,根据输入来设定用于放大或缩 小显示部的图像的倍率,而且,根据设定的倍率来变更波束的尺寸。

由此,指向性控制装置在对于监控对象通过对显示部的图像上的 输入操作(例如缩放处理)来切换监控对象的被摄体的情况下,根据 缩放处理来调整声音数据的指向性的强度(即,指向方向的尺寸(例 如波束宽度)),而且,对应于调整后的波束宽度来形成指向性。因 此,指向性控制装置能够适当地形成对于切换后的监控对象的被摄体 的声音数据的指向性,能够抑制监控者的监控业务的效率劣化。

而且,本发明的一实施方式涉及指向性控制装置,其中,在通过 所述倍率设定部设定倍率以放大所述图像的情况下,所述波束形成部 减小所述波束的尺寸。

根据该结构,在图像数据的缩放处理为推近处理的情况下,指向 性控制装置设定倍率(例如缩放倍率)以放大显示部的图像,因此能 够对应于设定的倍率而将指向方向的波束宽度调整得较窄,能够将切 换后的监控对象的被摄体(例如特定的人物)发出的声音比被摄体的 周围的声音更显著地输出,因此能够提高监控者的监控业务效率。

而且,本发明的一实施方式涉及指向性控制装置,其中,在通过 所述倍率设定部设定倍率以缩小所述图像的情况下,所述波束形成部 增大所述波束的尺寸。

根据该结构,在图像数据的缩放处理为拉远处理的情况下,指向 性控制装置设定倍率(例如缩放倍率)以缩小显示部的图像,因此能 够对应于设定的倍率而将指向方向的波束宽度调整得较宽,能够将切 换后的监控对象的被摄体(例如多个人物)发出的声音网罗性地输出, 因此能够提高监控者的监控业务效率。

而且,本发明的一实施方式涉及指向性控制装置,其中,所述波 束形成部根据由所述倍率设定部设定的倍率来判定是否需要调整所述 声音的音量等级。

在该结构中,指向性控制装置根据设定的倍率来判定是否需要调 整由收音部收音到的声音的音量等级。

由此,在根据对于监控对象的通过缩放处理设定的倍率而切换了 监控对象的被摄体的情况下,指向性控制装置判定是否需要调整声音 数据的音量等级,因此根据缩放处理的内容,能够对应于切换后的监 控对象相对于显示部的显示区域的大小而没有不适感地输出声音。

而且,本发明的一实施方式涉及指向性控制装置,其中,在通过 所述倍率设定部设定倍率以放大所述图像的情况下,所述波束形成部 提升所述声音的音量等级。

根据该结构,在图像数据的缩放处理为推近处理的情况下,指向 性控制装置设定倍率以放大显示部的图像,因此能够对应于设定的倍 率而提升声音数据的音量等级,能够将切换后的监控对象的被摄体(例 如特定的人物)发出的声音以比被摄体的周围的声音大的音量输出, 因此能够提高监控者的监控业务效率。

而且,本发明的一实施方式涉及指向性控制装置,其中,在通过 所述倍率设定部设定倍率以缩小所述图像的情况下,所述波束形成部 维持或降低所述声音的音量等级。

根据该结构,指向性控制装置即使图像数据的缩放处理为拉远处 理也能够维持声音数据的音量等级,因此能够将切换后的监控对象的 被摄体(例如多个人物)发出的声音与被摄体的周围的声音同等地输 出,或者在音量等级充分大的情况下降低音量等级,因此即便是拉远 处理也能够使监控者没有不适感地执行监控业务。

而且,本发明的一实施方式涉及指向性控制装置,其中,还具备 对显示于所述显示部的所述图像进行处理的图像处理部,在通过所述 图像处理部在所述图像中未检测到人物的情况下,所述波束形成部维 持所述波束的尺寸。

在该结构中,在通过图像处理部判断为在图像数据中未检测到人 物的情况下,波束形成部维持指向方向的波束的尺寸(例如波束宽度)。

由此,在图像数据中未检测到人物的情况下,指向性控制装置不 调整声音数据的指向性的强弱,因此能够消除在人物未映入的状况下 收音区域的周围的环境音发生变动的不适感。

而且,本发明的一实施方式涉及指向性控制装置,其中,在通过 所述倍率设定部设定倍率以放大所述图像的情况下,所述波束形成部 对所述声音进行变声处理。

根据该结构,在设定倍率以放大图像的情况下,指向性控制装置 对由收音部收音到的声音数据进行变声处理,因此切换后的监控对象 的被摄体(例如特定的人物)发出的声音是谁的声音难以分辨,由此 能够有效地保护被摄体的声音上的隐私。

而且,本发明的一实施方式涉及指向性控制装置,其中,在通过 所述倍率设定部设定倍率以放大所述图像的情况下,所述图像处理部 对所述图像中的人物的一部分进行掩蔽处理。

根据该结构,在设定倍率以放大图像的情况下,指向性控制装置 对推近处理后的图像数据中的人物的一部分(例如脸部)进行掩蔽处 理,因此切换后的监控对象的被摄体(例如特定的人物)是谁难以分 辨,由此能够有效地保护被摄体的图像上的隐私。

而且,本发明的一实施方式涉及指向性控制方法,是对由包括多 个麦克风的收音部收音到的声音的指向性进行控制的指向性控制装置 的指向性控制方法,该指向性控制方法具有以下步骤:对由包括多个 麦克风的收音部收音到的声音的指向性进行控制;根据输入来设定用 于放大或缩小所述显示部的图像的倍率;及根据所设定的所述倍率来 变更所形成的所述波束的尺寸。

在该方法中,指向性控制装置对由包括多个麦克风的收音部收音 到的声音的指向性进行控制,在从收音部向与在显示部的图像上指定 的位置对应的声源的方向上形成波束,根据输入来设定用于放大或缩 小显示部的图像的倍率,而且,根据设定的倍率来变更波束的尺寸。

由此,在对于监控对象通过对显示部的图像上的输入操作(例如 缩放处理)而切换了监控对象的被摄体的情况下,指向性控制装置根 据缩放处理来调整声音数据的指向性的强度(即,指向方向的尺寸(例 如波束宽度)),而且,对应于调整后的波束宽度而形成指向性。因 此,指向性控制装置能够适当地形成对于切换后的监控对象的被摄体 的声音数据的指向性,能够抑制监控者的监控业务的效率劣化。

而且,本发明的一实施方式涉及存储介质,存储有执行对由包括 多个麦克风的收音部收音到的声音的指向性进行控制的指向性控制装 置的处理的程序,所述存储介质存储有执行如下步骤的程序:对由包 括多个麦克风的收音部收音到的声音的指向性进行控制;根据输入来 设定用于放大或缩小所述显示部的图像的倍率;及根据所设定的所述 倍率来变更所形成的所述波束的尺寸。

在该结构中,在记录介质中存储有使计算机(例如指向性控制装 置)执行如下步骤的程序:对由包括多个麦克风的收音部收音到的声 音的指向性进行控制;在从收音部向与在显示部的图像上指定的位置 对应的声源的方向上形成波束;根据输入来设定用于放大或缩小显示 部的图像的倍率;及根据设定的倍率来变更波束的尺寸。

由此,从记录介质安装有能够执行的程序的计算机(例如指向性 控制装置)在对于监控对象通过对显示部的图像上的输入操作(例如 缩放处理)而切换了监控对象的被摄体的情况下,根据缩放处理来调 整声音数据的指向性的强度(即,指向方向的尺寸(例如波束宽度)), 而且,对应于调整后的波束宽度而形成指向性。因此,指向性控制装 置能够适当地形成对于切换后的监控对象的被摄体的声音数据的指向 性,能够抑制监控者的监控业务的效率劣化。

而且,本发明的一实施方式涉及指向性控制系统,具备:拍摄部, 对收音区域进行拍摄;第一收音部,包括多个麦克风且对所述收音区 域的声音进行收音;及指向性控制装置,对由所述第一收音部收音到 的声音的指向性进行控制,所述指向性控制装置具备:显示部,显示 由所述拍摄部拍摄到的所述收音区域的图像;波束形成部,根据对显 示于所述显示部的所述图像的位置的指定,在从所述第一收音部向与 所指定的所述位置对应的声源的方向上形成波束;及倍率设定部,根 据输入来设定用于放大或缩小所述显示部的图像的倍率,所述波束形 成部根据由所述倍率设定部设定的倍率来变更所形成的所述波束的尺 寸。

在该结构中,指向性控制装置对由包括多个麦克风的第一收音部 收音到的声音的指向性进行控制,在从第一收音部向由拍摄部拍摄到 的图像显示于显示部的情况下与在图像上指定的位置对应的声源的方 向上形成波束,根据输入来设定用于放大或缩小显示部的图像的倍率, 而且,根据设定的倍率来变更波束的尺寸。

由此,在指向性控制系统中,在对于监控对象通过对显示部的图 像上的输入操作(例如缩放处理)而切换了监控对象的被摄体的情况 下,指向性控制装置根据缩放处理来调整声音数据的指向性的强度 (即,指向方向的尺寸(例如波束宽度)),进而,对应于调整后的 波束宽度来形成指向性。因此,在指向性控制系统中,指向性控制装 置能够适当地形成对于切换后的监控对象的被摄体的声音数据的指向 性,能够抑制监控者的监控业务的效率劣化。

而且,本发明的一实施方式涉及指向性控制系统,其中,还设有 第二收音部,该第二收音部具有将所述第一收音部的周围包围的开口 部且具有与所述第一收音部呈同心圆状的框体。

根据该结构,指向性控制系统还设置具有与第一收音部呈同心圆 状的框体的第二收音部,因此在第二收音部的圆周上均等地配置多个 收音元件(麦克风元件),由此,与单独使用第一收音部的情况下的 声音的收音特性相比,能够均等地进一步提高对于全方位的声音的收 音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,还设有 第二收音部,该第二收音部具有将所述第一收音部的周围包围的开口 部且具有椭圆形状的框体。

根据该结构,指向性控制系统还设置具有椭圆形状的框体的第二 收音部,因此例如能够在第二收音部的椭圆形状的长度方向上配置比 椭圆形状的长度方向以外的方向更多的收音元件(麦克风元件),与 单独使用第一收音部的情况下的声音的收音特性相比,能够均匀地提 高声音的收音特性,而且,能够更进一步提高相对于椭圆形状的长度 方向的声音的收音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,还设有 第二收音部,该第二收音部具有将所述第一收音部的周围包围的开口 部且具有矩形形状的框体。

根据该结构,指向性控制系统还设置具有矩形形状的框体的第二 收音部,因此在第二收音部的开口部的周围均等地配置多个收音元件 (麦克风元件),由此,与单独使用第一收音部的情况下的声音的收 音特性相比,能够均等地进一步提高对于全方位的声音的收音特性, 而且,能够灵活地设置第二收音部。

而且,本发明的一实施方式涉及指向性控制系统,其中,还设有 第二收音部,该第二收音部具有将所述第一收音部的周围包围的开口 部且具有蜂窝形状的框体。

根据该结构,指向性控制系统还设置具有蜂窝形状的框体的第二 收音部,因此在第二收音部的开口部的周围均等地配置多个收音元件 (麦克风元件),由此,与单独使用第一收音部的情况下的声音的收 音特性相比,能够均等地进一步提高对于全方位的声音的收音特性, 而且,能够灵活地设置第二收音部,能够根据第二收音部的增设方向 使收音性能带有差别。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 一收音部与所述第二收音部沿着所述第一收音部及所述第二收音部的 高度方向分离地设置。

根据该结构,指向性控制系统由于将第一收音部与第二收音部沿 高度方向分离地设置,因此能够提高垂直方向(铅垂方向)的收音性 能。

而且,本发明的一实施方式涉及指向性控制系统,其中,在所述 第一收音部的周围还设置具有至少一个棒形状的框体的第二收音部。

根据该结构,指向性控制系统还设置具有至少1个棒形状的框体 的第二收音部,因此沿着第二收音部的长度方向均等地配置多个收音 元件(麦克风元件),由此,与单独使用第一收音部的情况下的声音 的收音特性相比,能够进一步提高相对于棒形状的长度方向的声音的 收音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,在所述 第一收音部的周围还设置至少一个第二收音部,所述第二收音部经由 预定信号线收容管而与设于所述第一收音部的周围的连接器部连接。

根据该结构,指向性控制系统不需要用于收容增设麦克风部内的 收音元件(麦克风元件)的框体,能够将由框体引起的声音(声波) 的旋入排除而对声音进行收音,因此不需要将第一收音部与第二收音 部沿着高度方向分离地设置。而且,指向性控制系统经由信号线收容 管能够将设置在第一收音部的周围的连接器部与第二收音部简易地连 接,而且,与在第一收音部增设具有预定形状的框体的第二收音部的 情况相比,能够使增设麦克风部轻量化,因此能够进一步提高增设麦 克风部内的收音元件(麦克风元件)的收音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,还设有 第二收音部,该第二收音部具有与所述第一收音部相同的矩形形状的 框体,所述第一收音部及所述第二收音部的框体在中间边部设置形成 有半圆状的凹面的中间边连结部,在两端部设置形成有1/4圆状的凹面 的两端连结部。

根据该结构,指向性控制系统在第一收音部的周围能够容易地连 结第二收音部,根据第二收音部的连结数,对应于连结后的第一收音 部及第二收音部的框体形状,能够将设置在第一收音部的框体的中心 的拍摄部向连结后的第一收音部及第二收音部的框体形状的中心位置 简易地移设。

而且,本发明的一实施方式涉及指向性控制系统,具备:拍摄部, 对收音区域进行拍摄;第一收音部,包括多个麦克风且对所述收音区 域的声音进行收音;第二收音部,增设在所述第一收音部的周围;及 指向性控制装置,对由所述第一收音部和第二收音部收音到的声音的 指向性进行控制,所述指向性控制装置具备:显示部,显示由所述拍 摄部拍摄到的所述收音区域的图像;及波束形成部,根据对显示于所 述显示部的所述图像的位置的指定,在从所述第一收音部向与所指定 的所述位置对应的声源的方向上形成波束。

在该结构中,指向性控制装置根据对显示于显示部的收音区域的 图像的位置的指定,在从第一收音部朝向与图像的指定位置对应的声 源的指向方向上形成由第一收音部收音到的声音数据的指向性的声音 的增强等级不充分的情况下,在所述第一收音部的周围增设第二收音 部。

由此,在指向性控制系统中,指向性控制装置即使在声音数据的 指向性的强度(即,指向方向的波束宽度)不充分时,通过增设的第 二收音部,也能够进一步提高声音数据的指向性的强度,能够抑制监 控者的监控业务的效率劣化。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 二收音部具有将所述第一收音部的周围包围的开口部且具有与所述第 一收音部呈同心圆状的框体。

根据该结构,指向性控制系统还设置具有与第一收音部呈同心圆 状的框体的第二收音部,因此在第二收音部的圆周上均等地配置多个 收音元件(麦克风元件),由此,与单独使用第一收音部的情况下的 声音的收音特性相比,能够均等地进一步提高对于全方位的声音的收 音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 二收音部具有将所述第一收音部的周围包围的开口部且具有椭圆形状 的框体。

根据该结构,指向性控制系统还设置具有椭圆形状的框体的第二 收音部,因此例如在第二收音部的椭圆形状的长度方向上,能够配置 比椭圆形状的长度方向以外的方向更多的收音元件(麦克风元件), 与单独使用第一收音部的情况下的声音的收音特性相比,能够均匀地 提高声音的收音特性,而且,能够进一步提高相对于椭圆形状的长度 方向的声音的收音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 二收音部具有将所述第一收音部的周围包围的开口部且具有矩形形状 的框体。

根据该结构,指向性控制系统还设置具有矩形形状的框体的第二 收音部,因此在第二收音部的开口部的周围均等地配置多个收音元件 (麦克风元件),由此,与单独使用第一收音部的情况下的声音的收 音特性相比,能够均等地进一步提高对于全方位的声音的收音特性, 而且,能够灵活地设置第二收音部。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 二收音部具有将所述第一收音部的周围包围的开口部且具有蜂窝形状 的框体。

根据该结构,指向性控制系统还设置具有蜂窝形状的框体的第二 收音部,因此在第二收音部的开口部的周围均等地配置多个收音元件 (麦克风元件),由此,与单独使用第一收音部的情况下的声音的收 音特性相比,能够均等地进一步提高对于全方位的声音的收音特性, 而且,能够灵活地设置第二收音部,能够根据第二收音部的增设方向 使收音性能带有差别。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 一收音部与所述第二收音部沿着所述第一收音部及所述第二收音部的 高度方向分离地设置。

根据该结构,指向性控制系统由于将第一收音部与第二收音部沿 高度方向分离地设置,因此能够提高垂直方向(铅垂方向)的收音性 能。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 二收音部在所述第一收音部的周围具有至少一个棒形状的框体。

根据该结构,指向性控制系统还设置具有至少1个棒形状的框体 的第二收音部,因此沿着第二收音部的长度方向均等地配置多个收音 元件(麦克风元件),由此,与单独使用第一收音部的情况下的声音 的收音特性相比,能够进一步提高相对于棒形状的长度方向的声音的 收音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,增设至 少一个所述第二收音部,所述第二收音部经由预定信号线收容管而与 设于所述第一收音部的周围的连接器部连接。

根据该结构,指向性控制系统不需要用于收容增设麦克风部内的 收音元件(麦克风元件)的框体,能够将由框体引起的声音(声波) 的旋入排除而对声音进行收音,因此不需要将第一收音部与第二收音 部沿高度方向分离地设置。而且,指向性控制系统经由信号线收容管 而能够将设置在第一收音部的周围的连接器部与第二收音部简易地连 接,而且,与在第一收音部增设具有规定形状的框体的第二收音部的 情况相比,能够实现增设麦克风部的轻量化,因此能够进一步提高增 设麦克风部内的收音元件(麦克风元件)的收音特性。

而且,本发明的一实施方式涉及指向性控制系统,其中,所述第 二收音部具有与所述第一收音部相同的矩形形状的框体,所述第一收 音部及所述第二收音部的框体在中间边部设置形成有半圆状的凹面的 中间边连结部,在两端部设置形成有1/4圆状的凹面的两端连结部。

根据该结构,指向性控制系统能够在第一收音部的周围容易地连 结第二收音部,根据第二收音部的连结数,对应于连结后的第一收音 部及第二收音部的框体形状,能够将设置在第一收音部的框体的中心 的拍摄部向连结后的第一收音部及第二收音部的框体形状的中心位置 简易地移设。

以上,参照附图而说明了各种实施方式,但是本发明当然没有限 定于上述例子。只要是本领域技术人员,就可知在权利要求书记载的 范畴内能想到各种变更例或校正例,并可知这些当然也属于本发明的 技术范围。

另外,在上述的实施方式中,说明了使用与推近处理或拉远处理 的倍率相关的信息来调整指向方向的波束宽度的例子,但是没有限定 于波束宽度,只要能调整波束的尺寸(或波束的大小),就可以任意。 例如,可以不调整波束宽度而调整波束的高度(与指向方向正交的方 向的波束宽度)。

工业实用性

本发明作为通过对监控对象的缩放处理即使在监控对象的被摄体 切换的情况下也能适当地形成对于切换后的监控对象的被摄体的声音 的指向性并且能抑制监控者的监控业务的效率劣化的指向性控制装 置、指向性控制方法及指向性控制系统是有用的。

附图标记说明

1、1s相机装置

2、2A、2B、2C、2D、2f、2s、2s1全方位麦克风阵列装置

2z1、2z1a、2z2、2z3、2z4、2z4a、2z5a、2z5b、2z5c、2z5d、2z5e、 2z5f、2z5g、2z5h、2zs1、m1、m2、m3、m4增设麦克风部

3指向性控制装置

4记录器装置

7z顶棚安装金属板

7y放大顶棚安装金属板

7z1、7z2增设用安装金属板

8顶棚面

10指向性控制系统

31通信部

32操作部

33图像处理部

34信号处理部

34a指向方向计算部

34b输出控制部

34c缩放连动控制部

35显示器装置

36扬声器装置

37存储器

c1、c2、c3、c4、c5、c6、c7、c8连接器部

n1、n2、n3、n4麦克风线收容管

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号