首页> 中国专利> 指向性控制装置、指向性控制方法、存储介质及指向性控制系统

指向性控制装置、指向性控制方法、存储介质及指向性控制系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

指向性控制装置对由包括多个麦克风的收音部收音到的声音的指向性进行控制。波束形成部在从收音部向与在显示部的图像上指定的位置对应的声源的方向上形成波束。倍率设定部根据输入来设定用于放大或缩小显示部的图像的倍率。而且，波束形成部根据由倍率设定部设定的倍率来变更形成的波束的尺寸。

著录项

公开/公告号CN105706462A

专利类型发明专利
公开/公告日2016-06-22

原文格式PDF
申请/专利权人松下知识产权经营株式会社;
展开▼

申请/专利号CN201480045463.8
发明设计人重永信一;渡边周一;牧直史;泉昭年;林和典;德田肇道;松尾正治郎;泽裕隆;
展开▼

申请日2014-03-31
分类号H04R1/40;H04R1/02;H04R3/00;
代理机构中原信达知识产权代理有限责任公司;
代理人穆德骏
地址日本大阪
入库时间 2023-12-18 15:41:19

法律信息

法律状态公告日

法律状态信息

法律状态
2018-11-30

授权

授权
2016-07-20

实质审查的生效 IPC(主分类):H04R1/40 申请日:20140331

实质审查的生效
2016-06-22

公开

公开

说明书

技术领域

本发明涉及对声音的指向性进行控制的指向性控制装置、指向性控制方法、存储介质及指向性控制系统。

背景技术

以往，在设置于工厂、店铺(例如小卖店、银行)或者公共的场所(例如图书馆)的既定位置(例如顶棚面)的监视系统中，经由网络而连接1个以上的相机装置(例如PTZ相机装置、全方位相机装置)，实现监视对象范围的影像的图像数据(包括静止图像及活动图像。以下相同)的广角化。

而且，在使用了影像的监视中得到的信息量有限，因此通过除了 1个以上的相机装置以外还使用麦克风阵列装置来得到相机装置的视场角内存在的特定的监视对象(例如人物)发出的声音数据的监视系统的要求迫切。在这样的监视系统中，在监视者想要听取特定的监视对象发出的声音数据的情况下，需要确立由相机装置拍摄到的影像的图像数据与由麦克风阵列装置收音到的声音的声音数据的同步。

在此，作为确立由相机装置拍摄到的影像的图像数据与由麦克风阵列装置收音到的声音的声音数据的同步的在先技术，已知有专利文献1所示的信号处理装置。

专利文献1所示的信号处理装置根据摄影者对被摄体的缩放操作的结果，算出距由拍摄部拍摄到的被摄体的距离，根据算出的距离，增强由麦克风单元收音到的声音。而且，信号处理装置根据距摄影者所拍摄的被摄体的距离，使由拍摄部拍摄到的影像信号或由麦克风单元收音到的声音信号中的任一信号延迟。由此，即使通过摄影者对被摄体进行缩放操作，由于信号处理装置根据距被摄体的距离而使影像信号或声音信号中的任一信号延迟，因此也能够确立影像信号与声音信号的同步。

专利文献1：日本国特开2009-130767号公报

发明内容

在专利文献1中，通过摄影者的缩放操作，进行由麦克风单元收音到的声音信号的增强处理。然而，若将专利文献1的结构应用于上述的监视系统，则通过缩放操作来切换监视者选择的监视范围时，可能无法适当地形成从麦克风阵列装置对于通过缩放操作而切换的监视范围的特定的被摄体(例如人物)的声音的指向性。

在监视系统中，若无法适当地形成声音数据的指向性，则即使影像与声音同步，作为监视对象的特定的被摄体发出的声音也不会传递给监视者，从而监视者的监视业务的效率劣化。

本发明为了解决上述的现有的课题，目的在于提供即使在由于对监视对象的缩放处理而切换监视对象的被摄体的情况下也能适当地形成对于切换后的监视对象的被摄体的声音的指向性并抑制监视者的监视业务的效率劣化的指向性控制装置、指向性控制方法及指向性控制系统。

本发明涉及一种指向性控制装置，对由包括多个麦克风的收音部收音到的声音的指向性进行控制，该指向性控制装置具备：波束形成部，在从上述收音部向与在显示部的图像上指定的位置对应的声源的方向上形成波束；及倍率设定部，根据输入来设定用于放大或缩小上述显示部的图像的倍率，上述波束形成部根据由上述倍率设定部设定的倍率来变更所形成的上述波束的尺寸。

而且，本发明涉及一种指向性控制方法，是对由包括多个麦克风的收音部收音到的声音的指向性进行控制的指向性控制装置的指向性控制方法，该指向性控制方法具有以下步骤：对由包括多个麦克风的收音部收音到的声音的指向性进行控制；根据输入来设定用于放大或缩小上述显示部的图像的倍率；及根据所设定的上述倍率来变更所形成的上述波束的尺寸。

而且，本发明涉及一种存储介质，存储有执行对由包括多个麦克风的收音部收音到的声音的指向性进行控制的指向性控制装置的处理的程序，上述存储介质存储有执行如下步骤的程序：对由包括多个麦克风的收音部收音到的声音的指向性进行控制；根据输入来设定用于放大或缩小上述显示部的图像的倍率；及根据所设定的上述倍率来变更所形成的上述波束的尺寸。

此外，本发明涉及一种指向性控制系统，具备：拍摄部，对收音区域进行拍摄；收音部，包括多个麦克风且对上述收音区域的声音进行收音；及指向性控制装置，对由上述收音部收音到的声音的指向性进行控制，上述指向性控制装置具备：显示部，显示由上述拍摄部拍摄到的上述收音区域的图像；波束形成部，根据对显示于上述显示部的上述图像的位置的指定，在从上述收音部向与所指定的上述位置对应的声源的方向上形成波束；及倍率设定部，根据输入来设定用于放大或缩小上述显示部的图像的倍率，上述波束形成部根据由上述倍率设定部设定的倍率来变更所形成的上述波束的尺寸。

此外，本发明涉及一种指向性控制系统，具备：拍摄部，对收音区域进行拍摄；第一收音部，包括多个麦克风且对上述收音区域的声音进行收音；第二收音部，增设在上述第一收音部的周围；及指向性控制装置，对由上述第一收音部和第二收音部收音到的声音的指向性进行控制，上述指向性控制装置具备：显示部，显示由上述拍摄部拍摄到的上述收音区域的图像；及波束形成部，根据对显示于上述显示部的上述图像的位置的指定，在从上述第一收音部向与所指定的上述位置对应的声源的方向上形成波束。

发明效果

根据本发明，通过对监视对象的缩放处理，即使在切换监视对象的被摄体的情况下，也能够适当地形成对于切换后的监视对象的被摄体的声音的指向性，抑制监视者的监视业务的效率劣化。

附图说明

图1是表示第一实施方式的指向性控制系统的系统结构的框图。

图2(A)～图2(E)是全方位麦克风阵列装置的框体的外观图。

图3是全方位麦克风阵列装置在方向θ上形成声音数据的指向性的延迟和方式的简单的说明图。

图4(A)是表示拉远处理时的指向性图案、显示画面、声音缩放范围及显示画面的显示范围的图，图4(B)是表示拉远处理前及推近处理前的指向性图案、显示画面、声音缩放范围及显示画面的显示范围的图，图4(C)是表示推近处理时的指向性图案、显示画面、声音缩放范围及显示画面的显示范围的图。

图5(A)是表示在屋内的大厅的顶棚面安装有一体地组装的全方位麦克风阵列装置2及相机装置1的监视范围的图，图5(B)是表示在全方位图像数据中包含2人的人物91、92的范围g的选择操作的图，图5(C)是表示变形校正处理后的2人的人物91、92的图像数据显示于显示器装置且人物91、92交谈的声音数据在扬声器装置中输出的情况的图，图5(D)是表示在全方位图像数据中包含2人的人物93、94 的范围h的选择操作的图，图5(E)是表示变形校正处理后的2人的人物93、94的图像数据显示于显示器装置且人物93、94的交谈的声音数据在扬声器装置中输出的情况的图。

图6是详细说明第一实施方式的指向性控制装置的动作次序的流程图。

图7(A)是说明作为图6所示的隐私保护处理的第一例的声音隐私保护处理的动作次序的流程图，图7(B)是说明作为图6所示的隐私保护处理的第二例的图像隐私保护处理的动作次序的流程图。

图8(A)是表示与变声处理前的音调对应的声音信号的波形的一例的图，图8(B)是表示与变声处理后的音调对应的声音信号的波形的一例的图，图8(C)是在检测到的人物的脸部的轮廓内加入晕映的处理的说明图。

图9是说明第二实施方式的指向性控制装置的动作次序中的与第一实施方式的指向性控制装置的动作次序不同的动作次序的流程图。

图10(A)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第一例(环形结合)的主视图，图10(B)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第一例的侧视图。

图11是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第二例(椭圆环形结合)的主视图。

图12(A)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第三例(正方形结合或长方形结合)的主视图，图12(B)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第三例(正方形结合或长方形结合)的侧视图。

图13(A)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第四例(蜂窝形结合)的主视图，图13(B)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第五例(蜂窝形结合)的主视图。

图14(A)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第六例(棒形结合)的主视图，图14(B)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第六例(棒形结合)的侧视图。

图15(A)是表示安装有图14(B)所示的全方位麦克风阵列装置和顶棚安装金属板的状态的俯视图，图15(B)示出图15(A)的 E-E截面，是表示在图14(B)所示的全方位麦克风阵列装置的周围安装有增设麦克风部的状态的侧视图。

图16(A)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第七例(棒形结合)的主视图，图16(B)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第八例(棒形结合)的主视图，图16(C)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第九例(棒形结合)的主视图。

图17(A)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第十例(构架形结合)的主视图，图17(B)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第十例(构架形结合)的侧视图，图17(C)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第十一例(构架形结合)的主视图，图17(D)是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第十一例(构架形结合) 的侧视图。

图18(A)是表示增设麦克风部向全方位麦克风阵列装置的周围结合的结合方法的第一例的主视图，图18(B)是表示增设麦克风部向全方位麦克风阵列装置的周围结合的结合方法的第二例的主视图。

图19(A)是表示增设麦克风部向全方位麦克风阵列装置的周围结合的结合方法的第三例的主视图，图19(B)示出图19(A)的E-E 截面，是表示增设麦克风部向全方位麦克风阵列装置的周围结合的结合方法的第三例的侧视图，图19(C)是表示增设麦克风部向全方位麦克风阵列装置的周围结合的结合方法的第四例的补充说明图。

图20是表示在全方位麦克风阵列装置的周围结合增设麦克风部的第十二例(片形结合)的立体图。

图21是表示结合有增设麦克风部的全方位麦克风阵列装置的硬件结构的一例的框图。

具体实施方式

以下，参照附图，说明本发明的指向性控制装置、指向性控制方法及指向性控制系统的各实施方式。各实施方式的指向性控制系统被用作例如在工厂、公共设施(例如图书馆、活动会场)或店铺(例如小卖店、银行)设置的监控系统(包括有人监控系统及无人监控系统)。

另外，本发明可以表现为用于使计算机即指向性控制装置执行通过指向性控制方法规定的动作的程序或者记录有使计算机执行通过指向性控制方法规定的动作的程序的计算机能够读取的记录介质。

(第一实施方式)

图1是表示本实施方式的指向性控制系统10的系统结构的框图。图1所示的指向性控制系统10包括相机装置1、全方位麦克风阵列装置2、指向性控制装置3、记录器装置4。相机装置1、全方位麦克风阵列装置2、指向性控制装置3、记录器装置4经由网络NW而相互连接。网络NW可以是有线网络(例如内联网、互联网)，也可以是无线网络(例如无线LAN(LocalAreaNetwork)、WiMAX(注册商标)、无线WAN(WideAreaNetwork))。在图1所示的指向性控制系统 10中，为了简化说明，相机装置1及全方位麦克风阵列装置2仅图示 1个，但是也可以包含多个相机装置及全方位麦克风阵列装置。

以下，对构成指向性控制系统10的各装置进行说明。另外，为了简化以下的说明，作为将相机装置1的框体与全方位麦克风阵列装置2 的框体一体地安装于同一位置的情况进行说明(参照图5(A))，但是相机装置1的框体与全方位麦克风阵列装置2的框体也可以分体地安装于不同的位置。

作为拍摄部的一例的相机装置1例如经由后述的顶棚安装金属板 7z而固定地设置于活动会场的顶棚面8(参照图5(A))。相机装置 1具有例如作为监控系统中的监控相机的功能，通过来自与网络NW连接的监控控制室(未图示)的远距离操作，使用缩放功能(例如推近处理、拉远处理)，拍摄预定收音区域(例如活动会场内的既定区域) 的全方位的影像。相机装置1将表示收音区域的全方位的影像的图像数据(即，全方位图像数据)、或者对全方位图像数据实施预定变形校正处理并进行全景变换而生成的俯视图像数据经由网络NW向指向性控制装置3或记录器装置4发送。

当通过监控者的手指95在显示于显示器装置35的图像数据之中指定任意位置时，相机装置1从指向性控制装置3接收图像数据中的指定位置的坐标数据，算出从相机装置1到与指定位置对应的实际空间上的声音位置(以下，简称为“声音位置”)的距离、方向(包括水平角及垂直角。以下相同。)的数据而向指向性控制装置3发送。另外，由于相机装置1中的距离、方向的数据计算处理是公知技术，因此省略说明。

另外，相机装置1根据例如相机装置1中的定期的时机或者监控者的手指95对显示于显示器装置35的图像数据的输入操作，进行图像数据的推近处理或拉远处理。定期的时机例如为每1小时或每10分钟1次的程度。与推近处理或拉远处理的倍率相关的信息可以预先指定，也可以适当变更。相机装置1在进行了推近处理或拉远处理的情况下，将与推近处理或拉远处理的倍率相关的信息向指向性控制装置3 发送。

作为收音部的一例的全方位麦克风阵列装置2例如经由后述的顶棚安装金属板7z而固定地设置于活动会场的顶棚面8(参照图5(A))。全方位麦克风阵列装置2至少包括：以均等的间隔设有多个麦克风单元22、23(参照图2(A)～(E))的麦克风部；及对麦克风部的各麦克风单元22、23的动作进行控制的CPU2p(参照图21)。

当电源被接通时，全方位麦克风阵列装置2对由麦克风单元内的麦克风元件收音到的声音的声音数据实施预定声音信号处理(例如拉远处理、滤波处理、加法运算处理)，并将通过预定声音信号处理而得到的声音数据经由网络NW向指向性控制装置3或记录器装置4发送。

在此，参照图2(A)～图2(E)，说明全方位麦克风阵列装置2 的框体的外观。图2(A)～图2(E)是全方位麦克风阵列装置2的框体的外观图。图2(A)～图2(E)所示的全方位麦克风阵列装置2C、 2A、2B、2、2D的外观及多个麦克风单元的配置位置不同，但是全方位麦克风阵列装置的功能相同。

图2(A)所示的全方位麦克风阵列装置2C具有圆盘状的框体21。在框体21，呈同心圆状地配置有多个麦克风单元22、23。具体而言，多个麦克风单元22呈具有与框体21相同的中心的同心圆状且沿着框体21的圆周配置，多个麦克风单元23呈具于与框体21相同的中心的同心圆状且配置在框体21的内侧。各个麦克风单元22相互的间隔宽，直径大，具有适合于低音域的特性。另一方面，各个麦克风单元23相互的间隔窄，直径小，具有适合于高音域的特性。

图2(B)所示的全方位麦克风阵列装置2A具有圆盘状的框体21。在框体21上，多个麦克风单元22以均等的间隔沿着纵向和横向这两个方向配置成十字状，纵向的排列与横向的排列在框体21的中心处相交。全方位麦克风阵列装置2A将多个麦克风单元22沿纵向和横向这两个方向直线性地配置，因此能够降低形成声音数据的指向性的情况下的运算量。另外，在图2(B)所示的全方位麦克风阵列装置2A中，可以仅沿纵向或横向的1列配置多个麦克风单元22。

图2(C)所示的全方位麦克风阵列装置2B与图2(A)所示的全方位麦克风阵列装置2相比，具有直径小的圆盘状的框体21B。在框体 21B上，多个麦克风单元22沿着框体21B的圆周以均等的间隔配置。图2(C)所示的全方位麦克风阵列装置2B由于各个麦克风单元22的间隔短，因此具有适合于高音域的特性。

图2(D)所示的全方位麦克风阵列装置2具有在框体21C的中心形成了具有预定直径的开口部21a的环形形状或圈形形状的框体21C。在本实施方式的指向性控制系统10中，使用例如图2(D)所示的全方位麦克风阵列装置2。在框体21C中，多个麦克风单元22沿着框体 21C的圆周方向以均等的间隔呈同心圆状地配置。

图2(E)所示的全方位麦克风阵列装置2D具有矩形形状的框体 21D。在框体21D上，多个麦克风单元22沿着框体21D的外周以均等的间隔配置。在图2(E)所示的全方位麦克风阵列装置2D中，框体 21D为矩形形状，因此例如即使在拐角或壁面处也能够简化全方位麦克风阵列装置2D的设置。

全方位麦克风阵列装置2的各麦克风单元22、23可以是无指向性麦克风，也可以是双指向性麦克风、单一指向性麦克风、锐指向性麦克风、超指向性麦克风(例如枪式麦克风)或它们的组合。

指向性控制装置3可以是例如设置于监控控制室(未图示)的安置型的PC(PersonalComputer)，也可以是监控者能够携带的携带电话机、PDA(PersonalDigitalAssistant)、平板终端、智能手机等数据通信终端。

指向性控制装置3是至少包括通信部31、操作部32、图像处理部 33、信号处理部34、显示器装置35、扬声器装置36、存储器37的结构。信号处理部34至少包括指向方向计算部34a、输出控制部34b、缩放连动控制部34c。

通信部31接收从相机装置1发送的图像数据或者与推近处理或拉远处理的倍率相关的信息、或者从全方位麦克风阵列装置2发送的声音数据而向信号处理部34输出。

操作部32是用于将监控者的输入操作向信号处理部34通知的用户接口(UI：UserInterface)，例如是鼠标、键盘等指点器。而且，操作部32例如可以使用对应于显示器装置35的显示画面而配置且能够检测监控者的手指95或指示笔的输入操作的触摸面板来构成。

操作部32将通过监控者的手指95在显示于显示器装置35的图像数据(即，由相机装置1拍摄到的图像数据)之中指定的指定位置的坐标数据向信号处理部34输出。而且，操作部32在通过手指95的输入操作而在显示于显示器装置35的图像数据之中指示了推近处理或拉远处理的执行的情况下，将推近处理或拉远处理的指示内容向信号处理部34输出。

图像处理部33根据信号处理部34的指示，对显示于显示器装置 35的图像数据进行预定图像处理(例如人物的脸部检测、人物的移动检测)，并将图像处理结果向信号处理部34输出。

图像处理部33在通过相机装置1进行了推近处理的情况下，根据信号处理部34的指示，检测推近处理后的显示器装置35的显示区域上显示的监控对象物(例如人物)的脸部的轮廓，对脸部实施掩蔽处理。具体而言，图像处理部33进行算出包含检测到的脸部的轮廓的矩形区域并向矩形区域内加入预定晕映的处理。图像处理部33将通过加入晕映的处理而生成的图像数据向信号处理部34输出。

信号处理部34例如使用CPU(CentralProcessingUnit)、MPU (MicroProcessingUnit)或DSP(DigitalSignalProcessor)而构成，进行用于对指向性控制装置3的各部的动作整体性地进行总括的控制处理、与其他各部之间的数据的输入输出处理、数据的运算(计算) 处理及数据的存储处理。

指向方向计算部34a在指向方向坐标(θ_MAh，θ_MAv)的计算时，若从操作部32取得由监控者的手指95指定的图像数据的指定位置的坐标数据，则从通信部31向相机装置1发送坐标数据。指向方向计算部 34a从通信部31取得从相机装置1的设置位置到与图像数据的指定位置对应的实际空间上的声音(声源)位置为止的距离、方向的数据。

指向方向计算部34a使用从相机装置1的设置位置到声音位置为止的距离、方向的数据，算出从全方位麦克风阵列装置2的设置位置朝向声音位置的指向方向坐标(θ_MAh，θ_MAv)。如本实施方式那样，在以包围相机装置1的框体的方式一体地安装全方位麦克风阵列装置2 的框体的情况下，可以使用从相机装置1到声音位置的方向(水平角、垂直角)作为从全方位麦克风阵列装置2到声音位置的指向方向坐标 (θ_MAh，θ_MAv)。另外，在相机装置1的框体与全方位麦克风阵列装置 2的框体分离地安装的情况下，指向方向计算部34a使用事先算出的校准参数的数据和从相机装置1到声音位置的方向(水平角、垂直角) 的数据，算出从全方位麦克风阵列装置2到声音位置的指向方向坐标 (θ_MAh，θ_MAv)。另外，校准是算出或取得指向性控制装置3的指向方向计算部34a为了算出指向方向坐标(θ_MAh，θ_MAv)所需的预定校准参数的动作。

指向方向坐标(θ_MAh，θ_MAv)中，θ_MAh表示从全方位麦克风阵列装置2的设置位置朝向声音位置的指向方向的水平角，θ_Mav表示从全方位麦克风阵列装置2的设置位置朝向声音位置的指向方向的垂直角。在以下的说明中，为了简化说明，相机装置1及全方位麦克风阵列装置的各水平角的基准方向(0度方向)一致。

输出控制部34b(波束形成部)控制显示器装置35及扬声器装置 36的动作，将从相机装置1发送的图像数据显示于显示器装置35，将从全方位麦克风阵列装置2发送的声音数据向扬声器装置36输出。而且，输出控制部34b使用从全方位麦克风阵列装置2发送的声音数据，在由指向方向计算部34a算出的指向方向坐标(θ_MAh，θ_MAv)表示的指向方向上形成由全方位麦克风阵列装置2收音到的声音的指向性(波束)。

而且，在通过相机装置1进行了图像数据的推近处理或拉远处理的情况下，输出控制部34b将推近处理后或拉远处理后的图像数据显示于显示器装置35，而且，使用由后述的缩放连动控制部34c调整后的指向方向的波束宽度(尺寸)，再形成声音数据的指向性。另外，在此所说的尺寸没有限定为表示指向性的波束的波束宽度，也可以是图4(A)、图4(B)、图4(C)所示的指向性图案PT1、PT2、PT3 的纵向的长度。以下同样地可以将波束宽度改读为波束尺寸。

由此，指向性控制装置3能够相对地增大形成有指向性的指向方向上存在的监控对象物发出的声音的音量等级，能够抑制未形成指向性的方向的声音而相对地降低音量等级。

在通过相机装置1进行了图像数据的推近处理或拉远处理的情况下，缩放连动控制部34c(倍率设定部)使用与推近处理或拉远处理的倍率相关的信息，调整由输出控制部34b形成的指向性(即，指向方向的波束宽度)和从扬声器装置36输出的声音数据的音量等级中的至少一方或其两方。另外，波束宽度及音量等级的调整量可以分别是既定值，也可以是与推近处理或拉远处理的倍率相关的信息所对应的值。

具体而言，在通过相机装置1进行了图像数据的推近处理的情况下，缩放连动控制部34c使用既定值或与推近处理的倍率相关的信息，将指向方向的波束宽度调整得较窄，而且，提高声音数据的音量等级 (参照图4(B)及(C))。图4(B)是表示拉远操作前及推近操作前的指向性图案PT1、显示画面、声音缩放范围SAR及显示画面的显示范围DAR的图。图4(C)是表示推近处理时的指向性图案PT3、显示画面、声音缩放范围SAR及显示画面的显示范围DAR的图。

另一方面，在通过相机装置1进行了图像数据的拉远处理的情况下，缩放连动控制部34c使用既定值或与拉远处理的倍率相关的信息，将指向方向的波束宽度调整得较宽，而且，维持声音数据的音量等级 (参照图4(A)及(B))。图4(A)是表示拉远处理时的指向性图案PT2、显示画面，声音缩放范围SAR及显示画面的显示范围DAR 的图。

另外，在此说明进行了相机装置1的推近处理、拉远处理的情况，但是并不局限于推近处理、拉远处理，在进行图像的放大、缩小处理的情况下也能够应用同样的次序。例如，在一边将录像的图像重放一边进行图像的放大、缩小处理的情况下，也可以变更声音的指向性。

在图4(A)～图4(C)中，显示画面的显示范围DAR表示在相机装置1的视场角(即能够拍摄的区域IAR)内显示于显示器装置35 的图像数据的显示范围。在图4(B)中，声音缩放范围SAR表示形成声音数据的指向性的范围。

图4(B)所示的指向性图案PT1表示在相机装置1进行推近处理或拉远处理之前输出控制部34b形成的指向性(指向方向的波束宽度) 的默认状态。

图4(C)所示的指向性图案PT3表示在相机装置1进行了推近处理之后输出控制部34b形成的指向性(指向方向的波束宽度)。图4 (A)所示的指向性图案PT2表示在相机装置1进行了拉远处理之后输出控制部34b形成的指向性(指向方向的波束宽度)。

当对图4(B)所示的显示器装置35的图像数据进行推近处理时，将指向方向的波束宽度调整得较窄，因此形成指向性的声音缩放范围 SAR变窄，指向性的强度上升。在这种情况下，在显示器装置35上，推近处理后的图像数据、即与声音缩放范围SAR对应的显示范围DAR 内映现的1人的人物被放大显示，该人物发出的声音的音量等级也增大地输出。

另一方面，当对图4(B)所示的显示器装置35的图像数据进行拉远处理时，将指向方向的波束宽度调整得较宽，因此形成指向性的声音缩放范围SAR变宽，指向性的强度下降。在这种情况下，在显示器装置35上，拉远处理后的图像数据、即与声音缩放范围SAR对应的显示范围DAR内映现的3人的人物被缩小显示，这3人的人物发出的声音的音量等级以维持不变的状态输出。

而且，在通过相机装置1进行了推近处理的情况下，缩放连动控制部34c对由全方位麦克风阵列装置2收音到的声音数据实施变声处理而向输出控制部34b输出。

作为显示部的一例的显示器装置35使用例如LCD(LiquidCrystal Display)或有机EL(Electroluminescence)而构成，在输出控制部34b 的控制下，显示由相机装置1拍摄到的图像数据。

作为声音输出部的一例的扬声器装置36输出由全方位麦克风阵列装置2收音到的声音的声音数据或在指向方向坐标(θ_MAh，θ_MAv)表示的指向方向上形成了指向性的声音数据。另外，显示器装置35及扬声器装置36可以设为与指向性控制装置3分体的结构。

作为存储部的一例的存储器38使用例如RAM(RandomAccess Memory)而构成，作为指向性控制装置3的各部的动作时的工作存储器发挥功能。另外，存储器38也可以使用硬盘或闪存而构成，在这种情况下，对记录器装置4中存储的图像数据及声音数据进行存储。

记录器装置4将由相机装置1拍摄到的图像数据与由全方位麦克风阵列装置2收音到的声音的声音数据建立对应地存储。

图3是全方位麦克风阵列装置2在方向θ上形成声音数据的指向性的延迟和方式的简单的说明图。为了便于理解说明，麦克风元件 221～22n排列在直线上。在这种情况下，指向性成为面内的二维区域，但是为了在三维空间内形成指向性，只要将麦克风设为二维排列而进行相同的处理方法即可。

从声源80发出的声波相对于全方位麦克风阵列装置2的麦克风单元22、23内置的各麦克风元件221、222、223、…、22(n-1)、22n，以某一定的角度(入射角＝(90-θ)[度])入射。

声源80例如是全方位麦克风阵列装置2的指向方向上存在的监控对象物(例如图5(A)所示的2人的人物91、92)，相对于全方位麦克风阵列装置2的框体21的面上，存在于预定角度θ的方向。而且，各麦克风元件221、222、223、…、22(n-1)、22n间的间隔d固定。

从声源80发出的声波首先到达麦克风元件221而被收音，接下来到达麦克风元件222而被收音，同样地接连不断被收音，最后到达麦克风元件22n而被收音。

另外，例如在声源80为监控对象物(例如2人的人物91、92) 的交谈时的声音的情况下，从全方位麦克风阵列装置2的各麦克风元件221、222、223、…、22(n-1)、22n的位置朝向声源80的方向与从全方位麦克风阵列装置2的各麦克风(麦克风元件)朝向监控者在显示器装置35上指定的指定位置所对应的声音位置的方向相同。

在此，从声波依次到达麦克风元件221、222、223、…、22(n-1) 的时刻至到达最后的麦克风元件22n的时刻为止，产生到达时间差τ1、 τ2、τ3、…、τ(n-1)。因此，在将各个麦克风元件221、222、223、…、 22(n-1)、22n收音到的声音的声音数据直接相加的情看下，由与以相位偏移的状态进行加法运算，因此声波的音量等级整体变弱。

另外，τ1是声波到达麦克风元件221的时刻与声波到达麦克风元件22n的时刻之差的时间，τ2是声波到达麦克风元件222的时刻与声波到达麦克风元件22n的时刻之差的时间，同样，τ(n-1)是声波到达麦克风元件22(n-1)的时刻与声波到达麦克风元件22n的时刻之差的时间。

在本实施方式中，全方位麦克风阵列装置2是具有按照各麦克风元件221、222、223、…、22(n-1)、22n而对应设置的A/D转换器 241、242、243、…、24(n-1)、24n、延迟器251、252、253、…、 25(n-1)、25n、加法运算器26的结构(参照图3)。

即，全方位麦克风阵列装置2将各麦克风元件221、222、223、…、 22(n-1)、22n收音到的模拟的声音数据在A/D转换器241、242、243、…、 24(n-1)、24n中A/D转换成数字的声音数据。

而且，全方位麦克风阵列装置2在延迟器251、252、253、…、25 (n-1)、25n中，赋予与各个麦克风元件221、222、223、…、22(n-1)、 22n的到达时间差对应的延迟时间而使全部声波的相位对齐之后，在加法运算器26中将延迟处理后的声音数据相加。由此，全方位麦克风阵列装置2对于各麦克风元件221、222、223、…、22(n-1)、22n，能够在预定角度θ的方向上形成声音数据的指向性。

例如在图3中，由延迟器251、252、253、…、25(n-1)、25n 设定的各延迟时间D1、D2、D3、…、D(n-1)、Dn分别相当于到达时间差τ1、τ2、τ3、…、τ(n-1)，由数学式(1)表示。

[数学式1]

$D 1 = \frac{L 1}{V s} = \frac{{d \times (n - 1) \times c o s θ}}{V s}$

$D 2 = \frac{L 2}{V s} = \frac{{d \times (n - 2) \times c o s θ}}{V s}$

$D 3 = \frac{L 3}{V s} = \frac{{d \times (n - 3) \times c o s θ}}{V s}$

，…，

$D n - 1 = \frac{L n - 1}{V s} = \frac{{d \times 1 \times c o s θ}}{V s}$

Dn＝0...(1)

L1是麦克风元件221与麦克风元件22n的声波到达距离之差。L2 是麦克风元件222与麦克风元件22n的声波到达距离之差。L3是麦克风元件223与麦克风元件22n的声波到达距离之差，同样，L(n-1) 是麦克风元件22(n-1)与麦克风元件22n的声波到达距离之差。Vs 是声波的速度(声速)。L1、L2、L3、…、L(n-1)、Vs是已知的值。在图3中，由延迟器25n设定的延迟时间Dn为0(零)。

这样，全方位麦克风阵列装置2通过变更由延迟器251、252、 253、…、25(n-1)、25n设定的延迟时间D1、D2、D3、…、Dn-1、 Dn，能够简易地形成内置于麦克风单元22、23的各个麦克风元件221、 222、223、…、22(n-1)、22n收音到的声音的声音数据的指向性。

另外，图3所示的指向性的形成处理的说明为了简化说明而以全方位麦克风阵列装置2进行的情况为前提来记载。但是，指向性控制装置3的信号处理部34的输出控制部34b是具有与全方位麦克风阵列装置2的麦克风的个数相同的个数的A/D转换器241～24n及延迟器 251～25n和1个加法运算器26的结构的情况下，指向性控制装置3的信号处理部34的输出控制部34b可以使用由全方位麦克风阵列装置2 的各麦克风元件收音到的声音的声音数据，进行图3所示的指向性的形成处理。

图5(A)是表示在屋内的大厅的顶棚面8上安装有一体地组装的全方位麦克风阵列装置2及相机装置1的监控范围的图。图5(B)是表示在全方位图像数据中包含2人的人物91、92的范围g的选择操作的图。图5(C)是表示变形校正处理后的2人的人物91、92的图像数据显示于显示器装置35且人物91、92的交谈的声音数据在扬声器装置36中输出的情况的图。图5(D)是表示在全方位图像数据中包含2 人的人物93、94的范围h的选择操作的图。图5(E)是表示变形校正处理后的2人的人物93、94的图像数据显示于显示器装置35且人物 93、94的交谈的声音数据在扬声器装置36中输出的情况的图。

在图5(A)中，示出在活动会场的顶棚面8设置有环形形状的全方位麦克风阵列装置2、与全方位麦克风阵列装置2一体形成的相机装置1、扬声器装置83的情况。而且，在图5(A)中，2人的人物91、 92正在交谈，2人的人物93、94正在交谈，扬声器装置82输出预定音乐(例如BGM)的声音数据。

在图5(B)中，在显示器装置35的显示画面上显示由相机装置1 拍摄到的与收音区域的全方位相关的图像数据(全方位图像数据)。监控者在例如显示器装置35的显示画面上显示的4人的人物91、92、 93、94的图像数据中，利用手指95对左上附近(具体而言附图标记g 的范围)进行触摸&拖动。相机装置1从指向性控制装置3取得表示手指95通过触摸&拖动而指定的范围的坐标数据，并以使附图标记g的范围成为中心的方式对全方位图像数据进行变形校正处理及全景变换，由此生成平面图像数据而向指向性控制装置3发送。另外，范围g 由手指95的触摸点自动地生成。

在图5(C)中，通过相机装置1生成的平面图像数据显示在显示器装置35上。而且，在通过手指95的触摸&拖动而指定了附图标记g 的范围的情况下，输出控制部34b在从全方位麦克风阵列装置2朝向附图标记g的范围的中心位置所对应的声音位置的方向上形成声音数据的指向性，因此将2人的人物91、92的交谈声音(Hello)的音量等级比周围的声音的音量等级增大地输出(参照图5(B)及图5(C))。另一方面，虽然设置在比2人的人物91、92更接近全方位麦克风阵列装置2的距离处但是不包含于通过监控者指定的附图标记g的范围内的扬声器装置82输出的音乐(参照图5(A)所示的(音符)) 未从扬声器装置36增强地输出，以比2人的人物91、92的交谈声音的音量等级小的音量等级输出。

在图5(D)中，与图5(B)同样，在显示器装置35的显示画面上显示由相机装置1拍摄到的与收音区域的全方位相关的图像数据(全方位图像数据)。监控者在例如显示器装置35的显示画面上显示的4 人的人物91、92、93、94的图像数据中，利用手指95对右下附近(具体而言附图标记h的范围)进行触摸&拖动。相机装置1从指向性控制装置3取得表示手指95通过触摸&拖动而指定的范围的坐标数据，并以使附图标记h的范围成为中心的方式对全方位图像数据进行变形校正处理及全景变换，由此生成平面图像数据而向指向性控制装置3发送。

在图5(E)中，通过相机装置1生成的平面图像数据显示在显示器装置35上。而且，在通过手指95的触摸&拖动而指定了附图标记h 的范围的情况下，输出控制部34b在从全方位麦克风阵列装置2朝向附图标记h的范围的中心位置所对应的声音位置的方向上形成声音数据的指向性，因此2人的人物93、94的交谈声音(Hi！！)的音量等级比周围的声音的音量等级增大地输出(参照图5(D)及图5(E))。另一方面，虽然设置在比2人的人物93、94更接近全方位麦克风阵列装置2的距离处但是不包含于通过监控者指定的附图标记h的范围内的扬声器装置82输出的音乐(参照图5(A)所示的(音符)) 未从扬声器装置36增强地输出，以比2人的人物93、94的交谈声音的音量等级小的音量等级输出。另外，范围h由手指95的触摸点自动地生成。

接下来，参照图6，说明本实施方式的指向性控制系统10的详细的动作次序。图6是详细说明第一实施方式的指向性控制装置3的动作次序的流程图。作为图6的说明的前提，指向性控制装置3通过监控者的手指95，指定显示器装置35上显示的图像数据中的任意位置，算出从全方位麦克风阵列装置2朝向指95的指定位置所对应的实际空间上的声音位置的指向方向。

在图6中，缩放连动控制部34c判定缩放连动标志是否为接通，该缩放连动标志表示是否与相机装置1的推近处理或拉远处理连动地调整声音数据的指向性(指向方向的波束宽度)及音量等级(S1)。缩放连动控制部34c将缩放连动标志的内容存储在缩放连动控制部34c 自身或存储器37中，由此判定缩放连动标志是接通还是断开。在判定为缩放连动标志是断开的情况下(S1为“否”)，图6所示的指向性控制装置3的动作结束。

另一方面，在判定为缩放连动标志是接通的情况下(S1为“是”)，输出控制部34b在从全方位麦克风阵列装置2朝向显示器装置35上显示的图像数据中的指定位置所对应的实际空间上的声音位置的指向方向上形成声音数据的指向性(S2)。

在步骤S2之后，通过相机装置1的定期的时机或监控者的输入操作，指示显示器装置35上显示的图像数据的推近处理或拉远处理的执行。相机装置1根据推近处理或拉远处理的执行的指示，进行显示器装置35上显示的图像数据的推近处理或拉远处理。相机装置1在推近处理或拉远处理之后，将与推近处理或拉远处理的倍率相关的信息和推近处理或拉远处理后的图像数据经由网络NW向指向性控制装置3 发送。缩放连动控制部34c从通信部31取得与推近处理或拉远处理的倍率相关的信息(缩放信息)及推近处理或拉远处理后的图像数据 (S3)。

缩放连动控制部34c使用推近处理或拉远处理后的图像数据，使图像处理部33执行预定图像处理。图像处理部33按照来自缩放连动控制部34c的指示，对显示器装置35上显示的推近处理或拉远处理后的图像数据进行预定图像处理(例如人物的脸部检测、人物的移动检测)，并将图像处理结果向缩放连动控制部34c输出(S4)。

根据步骤S4中的图像处理结果，在显示器装置35上显示的推近处理或拉远处理后的图像数据中未检测到人物的情况下(S5为“否”)，无论推近处理或拉远处理如何，缩放连动控制部34c都判定为不调整而维持声音数据的指向性，而且，也不调整而维持声音数据的音量等级。输出控制部34b在维持了推近处理或拉远处理之前的声音数据的指向性的状态下，输出由全方位麦克风阵列装置2收音到的声音数据 (S6)。在步骤S6之后，图6所示的指向性控制装置3的动作结束。

另一方面，根据步骤S4中的图像处理结果，在显示器装置35上显示的推近处理或拉远处理后的图像数据中检测到人物的情况下(S5 为“是”)，缩放连动控制部34c基于在步骤S3中取得的与推近处理或拉远处理的倍率相关的信息，判定是否通过相机装置1进行了推近处理(S7)。

在判定为通过相机装置1进行了推近处理的情况下(S7为“是”)，缩放连动控制部34c进行与图像及声音相关的预定隐私保护处理(S8)。在此，参照图7(A)、图7(B)、图8(A)～图8(C)，说明预定隐私保护处理的动作。

图7(A)是说明作为图6所示的隐私保护处理的第一例的声音隐私保护处理的动作次序的流程图。图7(B)是说明作为图6所示的隐私保护处理的第二例的图像隐私保护处理的动作次序的流程图。图8 (A)是表示与变声处理前的音调对应的声音信号的波形的一例的图。图8(B)是表示与变声处理后的音调对应的声音信号的波形的一例的图。图8(C)是在检测到的人物的脸部的轮廓内加入晕映的处理的说明图。另外，在与图像及声音相关的预定隐私保护处理的说明中，为了使说明便于理解，将附图分开来说明图7(A)所示的图像隐私保护处理和图7(B)所示的声音隐私保护处理，但是指向性控制装置3也可以连续地进行图7(A)所示的动作与图7(B)所示的动作。

在图7(A)中，缩放连动控制部34c判定声音隐私保护设定是否为接通(S8-1)。缩放连动控制部34c通过将声音隐私保护设定的内容存储于缩放连动控制部34c自身或存储器37，来判定声音隐私保护设定是接通还是断开。在判定为声音隐私保护设定是断开的情况下(S8-1 为“否”)，图7(A)所示的声音隐私保护处理结束。

另一方面，在判定为声音隐私保护设定是接通的情况下(S8-1为 “是”)，缩放连动控制部34c对显示器装置35上显示的图像数据进行推近处理之后，对扬声器装置36输出的声音数据实施变声处理 (S8-2)。在步骤S8-2之后，图7(A)所示的声音隐私保护处理结束。

作为变声处理的一例，缩放连动控制部34c例如将由全方位麦克风阵列装置2收音到的声音的声音数据或者通过输出控制部34b形成了指向性的声音数据的波形的音调增大或减小(例如参照图8(A)及图8(B))。由此，缩放连动控制部34c使由全方位麦克风阵列装置 2收音到的声音或者形成了指向性的声音数据是谁发出的声音的确定变得困难，从而能够有效地保护通过推近处理进行了切换的监控对象物(例如人物)的隐私。

而且，在图7(B)中，缩放连动控制部34c判定图像隐私保护设定是否为接通(S8-3)。缩放连动控制部34c通过将图像隐私保护设定的内容存储于缩放连动控制部34c自身或存储器37，来判定图像隐私保护设定是接通还是断开。在判定为图像隐私保护设定是断开的情况下(S8-3为“否”)，输出控制部34b将推近处理后的图像数据直接显示于显示器装置35(S8-6)。

另一方面，在判定为图像隐私保护设定是接通的情况下(S8-3为 “是”)，图像处理部33按照缩放连动控制部34c的指示，检测(提取)推近处理后的显示器装置35的显示区域上显示的监控对象物(例如人物TRG)的脸部的轮廓DTL(S8-4)，并对脸部的轮廓DTL实施掩蔽处理(S8-5)。具体而言，图像处理部33算出包含检测到的脸部的轮廓DTL的矩形区域，进行向矩形区域内加入预定晕映的处理(参照图8(C))。图像处理部33将通过加入晕映的处理而生成的图像数据向输出控制部34b输出。

由此，图像处理部33使推近处理后的监控对象的被摄体(例如特定的人物)是谁难以分辨，从而能够有效地保护被摄体的图像上的隐私。输出控制部34b将推近处理后的图像数据显示于显示器装置35 (S8-6)。在步骤S8-6之后，图7(B)所示的图像隐私保护处理结束。

在图6中，缩放连动控制部34c在进行了步骤S8的隐私保护处理之后，使用既定值或与推近处理的倍率相关的信息，将指向方向的波束宽度调整得较窄，而且，提升声音数据的音量等级(S9)。此外，输出控制部34b根据缩放连动控制部34c的调整后的指向方向的波束宽度，再形成声音数据的指向性(S9)。在步骤S9之后，指向性控制装置3的动作进入步骤S6。

另一方面，在判定为通过相机装置1进行了拉远处理的情况下 (S10为“是”)，缩放连动控制部34c使用既定值或与拉远处理的倍率相关的信息，将指向方向的波束宽度调整得较宽，而且，维持声音数据的音量等级，或者在当前的音量等级充分大的情况下降低音量等级(S11)。此外，输出控制部34b根据缩放连动控制部34c的调整后的指向方向的波束宽度，再形成声音数据的指向性(S11)。在步骤S11 之后，指向性控制装置3的动作进入步骤S6。

由此，在本实施方式的指向性控制系统10中，在通过相机装置1 对于显示器装置35上显示的监控对象(例如人物)的缩放处理而切换了监控对象的被摄体的情况下，指向性控制装置3根据缩放处理来调整声音数据的指向性的强度(即，指向方向的波束宽度)，而且，对应于调整后的波束宽度而再形成指向性，因此能够适当地形成对于切换后的监控对象的被摄体的声音数据的指向性，能够抑制监控者的监控业务的效率劣化。

例如，在图像数据的缩放处理为推近处理的情况下，指向性控制装置3能够将指向方向的波束宽度调整得较窄，并能够将切换后的监控对象的被摄体(例如特定的人物)发出的声音比被摄体的周围的声音更显著地输出，因此能够提高监控者的监控业务效率。

而且，例如，在图像数据的缩放处理为拉远处理的情况下，指向性控制装置3能够将指向方向的波束宽度调整得较宽，并能够将切换后的监控对象的被摄体(例如多个人物)发出的声音网罗性地输出，因此能够提高监控者的监控业务效率。

而且，在通过对监控对象的缩放处理而切换了监控对象的被摄体的情况下，指向性控制装置3判定是否需要声音数据的音量等级的调整，因此，能够根据缩放处理的内容，并对应于切换后的监控对象相对于显示部的显示区域的大小，没有不适感地输出声音。

例如，在图像数据的缩放处理为推近处理的情况下，指向性控制装置3能够提升声音数据的音量等级，并能够将切换后的监控对象的被摄体(例如特定的人物)发出的声音以比被摄体的周围的声音大的音量输出，因此能够提高监控者的监控业务效率。

而且，例如，即使图像数据的缩放处理为拉远处理，指向性控制装置3也能够维持声音数据的音量等级，因此能够将切换后的监控对象的被摄体(例如多个人物)发出的声音与被摄体的周围的声音同等地输出，通过拉远处理也能够使监控者没有不适感地执行监控业务。

而且，在通过图像处理部判断为在图像数据中未检测到人物的情况下，指向性控制装置3维持指向方向的波束宽度，因此在图像数据中未检测到人物的情况下，不调整声音数据的指向性的强弱，能够消除在人物未映入的状况下收音区域的周围的环境音发生变动这样的不适感。

(第二实施方式)

在第一实施方式的指向性控制系统10中，指向性控制装置3根据相机装置1的推近处理或拉远处理，将指向方向的波束宽度调整得较窄或较宽，而且，在推近处理的情况下，提升声音数据的音量等级。

然而，在第一实施方式的指向性控制系统10中，可考虑如下情况：由于内置在全方位麦克风阵列装置2内的麦克风的配置数为既定，因此即使在根据推近处理或拉远处理而调整了指向方向的波束宽度或音量等级的情况下，例如由于收音区域的环境的不同而指向方向的声音数据的增强也可能并不充分。

因此，在第二实施方式中，说明在即使根据推近处理或拉远处理而调整了指向方向的波束宽度或音量等级、但是指向方向的声音数据的增强也并不充分的情况下在全方位麦克风阵列装置2的周围结合有增设麦克风部的指向性控制系统。第二实施方式的指向性控制系统的系统结构中的后述的增设麦克风部以外的结构与第一实施方式的指向性控制系统10相同，因此简化或省略关于同一内容的说明，对不同内容进行说明。

接下来，参照图9，说明本实施方式的指向性控制装置3的动作次序。图9是说明第二实施方式的指向性控制装置3的动作次序中的与第一实施方式的指向性控制装置3的动作次序不同的动作次序的流程图。在本实施方式的指向性控制装置3的动作次序的说明中，说明与第一实施方式的指向性控制装置3的动作次序不同的动作次序。作为图9的说明的前提，说明增设麦克风部与全方位麦克风阵列装置2 的周围结合之前的状态。

在图9中，缩放连动控制部34c在进行了步骤S8的隐私保护处理之后，使用既定值或与推近处理的倍率相关的信息，将指向方向的波束宽度调整得较窄，而且，提升声音数据的音量等级(S9)。此外，输出控制部34b根据缩放连动控制部34c的调整后的指向方向的波束宽度，再形成声音数据的指向性(S9)。

在步骤S9之后，缩放连动控制部34c向监控者询问步骤S9中的通过指向性的再形成及调整后的声音数据的音量等级而输出的声音数据的声音增强是否充分(S21)。例如，缩放连动控制部34c使显示器装置35显示用于询问声音增强是否充分的弹出画面，接受监控者的与询问相关的回答的输入操作。在输入了声音增强充分的回答的情况下 (S21为“是”)，指向性控制装置3的动作进入步骤S6。

另一方面，在输入了声音增强不充分的回答的情况下(S21为 “否”)，在当前的设有全方位麦克风阵列装置2的指向性控制系统 10的结构中，由于指向方向的声音增强不充分，因此在将全方位麦克风阵列装置2或者全方位麦克风阵列装置2及增设麦克风部的电源切断之后(S22)，按照后述的安装方法，在全方位麦克风阵列装置2的周围重新结合增设麦克风部(S23)。在增设麦克风部对于全方位麦克风阵列装置2的周围的结合结束的情况下(S24为“是”)，将全方位麦克风阵列装置2或者全方位麦克风阵列装置2及增设麦克风部的电源接通(S25)。然后，缩放连动控制部34c再次向监控者询问步骤S9 中的通过指向性的再形成及调整后的声音数据的音量等级而输出的声音数据的声音增强是否充分(S21)。

接下来，参照附图，说明在本实施方式中作为第一收音部的全方位麦克风阵列装置2的周围结合的各种增设麦克风部。

图10(A)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z1a的第一例(环形结合)的主视图。图10(B)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z1a的第一例的侧视图。

在图10(A)中，作为第二收音部的一例的增设麦克风部的第一例，示出具有将全方位麦克风阵列装置2的周围包围的程度的开口部且具有与全方位麦克风阵列装置2呈同心圆状的框体(环状框体)的增设麦克风部2z1a。具体而言，增设麦克风部2z1a与全方位麦克风阵列装置2未结合在同一平面上，而如图10(B)所示沿高度方向(铅垂方向)分离地设置。

作为结合方法，首先从顶棚面8将全方位麦克风阵列装置2及相机装置1拆卸，将增设麦克风部2z1a安装于顶棚面8并经由螺丝孔 7eb1、7eb2通过螺丝41来固定，之后，将全方位麦克风阵列装置2安装成与增设麦克风部2z1a沿高度方向分离，全方位麦克风阵列装置2 与增设麦克风部2z1a经由螺丝孔7ea1、7ea2通过螺丝41来固定。另外，也可以是全方位麦克风阵列装置2及相机装置1和增设麦克风部 2z1a分别固定地安装于顶棚面8，并分别经由螺丝孔7ea1、7ea2通过螺丝41进行固定。而且，增设麦克风部2z1a优选将增设麦克风部2z1a 的框体通过顶棚安装配件7r固定于顶棚面8。而且，从补强强度的观点出发，在全方位麦克风阵列装置2的框体设置的螺丝孔7eb1、7eb2 优选设置在图10(A)所示的比容限线SPL靠外侧的位置。而且，在此，作为结合方法，说明了通过使用了螺丝41的螺丝紧固进行固定的例子，但是也可以使用公知的卡止构造进行固定，以下同样。

因此，通过图10(A)所示的增设麦克风部2z1a的结合，本实施方式的指向性控制系统10在增设麦克风部2z1a的圆周上均等地配置多个麦克风元件，由此，与单独使用全方位麦克风阵列装置2的情况的声音的收音特性相比，能够均等地进一步提高相对于全方位的声音的收音特性。而且，指向性控制系统10将全方位麦克风阵列装置2与增设麦克风部2z1a沿高度方向分离地设置，因此能够提高垂直方向(铅垂方向)的收音性能。

图11是表示在全方位麦克风阵列装置2的周围结合增设麦克风部 2z2的第二例(椭圆环形结合)的主视图。

在图11中，作为增设麦克风部的第二例，示出具有将全方位麦克风阵列装置2的周围包围的程度的开口部且具有椭圆形状的框体的增设麦克风部2z2。增设麦克风部2z2的安装方法与图10(B)所示的增设麦克风部2z1a的安装方法同样，经由螺丝孔7ec1、7ec2通过螺丝41 来固定，其他说明(例如全方位麦克风阵列装置2及相机装置1的固定方法、设置在比容限线SPL靠外侧的位置的螺丝孔7ea1、7ea2。以下同样。)相同，因此省略说明。

因此，通过图11所示的增设麦克风部2z2的结合，本实施方式的指向性控制系统10例如在增设麦克风部2z2的椭圆形状的长度方向上能够配置比椭圆形状的长度方向以外的方向更多的麦克风元件，与单独使用全方位麦克风阵列装置2的情况的声音的收音特性相比，能够均匀地提高声音的收音特性，而且，能够更进一步提高相对于椭圆形状的长度方向的声音的收音特性。而且，指向性控制系统10由于将全方位麦克风阵列装置2与增设麦克风部2z2沿高度方向分离地设置，因此能够提高垂直方向(铅垂方向)的收音性能。

图12(A)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z3的第三例(正方形结合或长方形结合)的主视图。图12(B) 是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z3的第三例(正方形结合或长方形结合)的侧视图。

在图12(A)中，作为增设麦克风部的第三例，示出具有将全方位麦克风阵列装置2的周围包围的程度的开口部且具有矩形形状的框体(例如正方形形状或长方形形状的框体)的增设麦克风部2z3。具体而言，增设麦克风部2z3与全方位麦克风阵列装置2未结合在同一平面上，而如图12(B)所示，沿高度方向(铅垂方向)分离地设置。

作为结合方法，首先从顶棚面8将全方位麦克风阵列装置2及相机装置1拆卸，将增设麦克风部2z3安装于顶棚面8而经由螺丝孔7ed1、 7ed2通过螺丝41来固定，然后，将全方位麦克风阵列装置2安装成与增设麦克风部2z3沿高度方向分离，全方位麦克风阵列装置2和增设麦克风部2z3经由螺丝孔7ea1、7ea2通过螺丝41来固定。另外，全方位麦克风阵列装置2和增设麦克风部2z3也可以分别固定地安装于顶棚面8，并分别经由螺丝孔7ea1、7ea2通过螺丝41来固定。

因此，通过图12(A)所示的增设麦克风部2z3的结合，本实施方式的指向性控制系统10在增设麦克风部2z3的开口部的周围均等地配置多个麦克风元件，由此，与单独使用全方位麦克风阵列装置2的情况的声音的收音特性相比，能够均等地进一步提高对于全方位的声音的收音特性，而且，能够灵活地设置增设麦克风部2z3。而且，指向性控制系统10由于将全方位麦克风阵列装置2与增设麦克风部2z3沿高度方向分离地设置，因此能够提高垂直方向(铅垂方向)的收音性能。

图13(A)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z4的第四例(蜂窝形结合)的主视图。图13(B)是表示在全方位麦克风阵列装置2s的周围结合增设麦克风部2z4的第五例(蜂窝形结合)的主视图。

在图13(A)中，作为增设麦克风部的第四例，示出具有将全方位麦克风阵列装置2的周围包围的程度的开口部且具有蜂窝形状的框体的增设麦克风部2z4。增设麦克风部2z4的安装方法与图10(B)所示的增设麦克风部2z1a的安装方法同样，经由螺丝孔7ee1、7ee2通过螺丝41来固定，由于其他说明相同，因此省略说明。另外，蜂窝形状的增设麦克风部2z4的安装数并不局限于1个，根据需要也可以为2 个以上。

而且，在图13(B)中，作为增设麦克风部的第五例，示出具有与图13(A)所示的蜂窝形状相同的蜂窝形状的框体的增设麦克风部 2z4a，全方位麦克风阵列装置2s的框体的形状与全方位麦克风阵列装置2的框体的形状不同，为矩形形状。增设麦克风部2z4a未形成图13 (A)所示的增设麦克风部2z4的开口部。而且，在全方位麦克风阵列装置2s的中心安装使用了鱼眼透镜的鱼眼相机(相机装置)1s。增设麦克风部2z4a的安装方法与图10(B)所示的增设麦克风部2z1a的安装方法同样，经由螺丝孔7ef1、7ef2通过螺丝41来固定，而且，全方位麦克风阵列装置2s也同样经由螺丝孔7ea3、7ea4通过螺丝41来固定，由于其他说明相同，因此省略说明。

因此，通过图13(A)或图13(B)所示的增设麦克风部2z4、2z4a 的结合，本实施方式的指向性控制系统10沿着增设麦克风部2z4的开口部或增设麦克风部2z4a的轮廓而均等地配置多个麦克风元件，由此，与单独使用全方位麦克风阵列装置2的情况的声音的收音特性相比，能够均等地进一步提高对于全方位的声音的收音特性，而且，能够灵活地设置增设麦克风部2z4、2z4a，根据增设麦克风部2z4、2z4a的增设方向，能够使收音性能带有差别。而且，指向性控制系统10由于将全方位麦克风阵列装置2与增设麦克风部2z4、2z4a沿高度方向分离地设置，因此能够提高垂直方向(铅垂方向)的收音性能。

图14(A)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z5a、2z5b、2z5c、2z5d的第六例(棒形结合)的主视图。图 14(B)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部 2z5a、2z5b、2z5c、2z5d的第六例(棒形结合)的侧视图。

在图14(A)中，作为增设麦克风部的第六例，在全方位麦克风阵列装置2的周围示出具有一方向长的棒形状的框体的增设麦克风部 2z5a、2z5b、2z5c、2z5d。具体而言，增设麦克风部2z5a、2z5b、2z5c、 2z5d与全方位麦克风阵列装置2可以结合在同一平面上，也可以沿高度方向(铅垂方向)分离地设置。

作为结合方法，首先从顶棚面8将全方位麦克风阵列装置2拆卸，将已设的顶棚安装金属板7z的端部和用于安装增设麦克风部(例如增设麦克风部2z5a、2z5c)的增设用安装金属板7z1、7z2的端部分别嵌入并卡止，通过螺丝41进行固定。而且，全方位麦克风阵列装置2及相机装置1安装于顶棚安装金属板7z而通过螺丝41固定，之后，将增设麦克风部(例如增设麦克风部2z5a、2z5c)安装于增设用安装金属板7z1、7z2而通过螺丝41进行固定。

因此，通过图14(A)所示的增设麦克风部2z5a、2z5b、2z5c、 2z5d的结合，本实施方式的指向性控制系统10沿着增设麦克风部2z5a、 2z5b、2z5c、2z5d的长度方向均等地配置多个麦克风元件，由此，与单独使用全方位麦克风阵列装置2的情况的声音的收音特性相比，能够进一步提高相对于棒形状的长度方向的声音的收音特性。

在此，关于图14(B)所示的全方位麦克风阵列装置2及相机装置1相对于顶棚安装金属板7z的安装构造、增设麦克风部2z5a、2z5c 相对于增设用安装金属板7z1、7z2的安装构造、顶棚安装金属板7z 与增设用安装金属板7z1、7z2的卡止构造，参照图15(A)及图15(B) 进行说明。图15(A)是表示安装有图14(B)所示的全方位麦克风阵列装置2和顶棚安装金属板7z的状态的俯视图。图15(B)示出图15 (A)的E-E截面，是表示在图14(B)所示的全方位麦克风阵列装置 2的周围安装有增设麦克风部2z5a、2z5c的状态的侧视图。

图15(A)示出从顶棚安装金属板7z的表面观察的情况、即从顶棚面8观察图15(B)所示的下方向的情况的全方位麦克风阵列装置2 及相机装置1的安装构造。顶棚安装金属板7z是表面具有凹凸的形成为大致圆盘状的金属制的部件，但也可以取代而使用陶瓷制或合成树脂(例如塑料或弹性体)制的部件。

在与顶棚面8相对的顶棚安装金属板7z的表面上，沿同轴i方向突出且用于安装固定相机装置1的卡止片7a形成于同心圆上的三个部位。而且，在顶棚安装金属板7z的表面上，沿同轴i方向突出且用于安装固定全方位麦克风阵列装置2的卡止片7b形成于比形成有卡止片 7a的同心圆大的直径的同心圆上的三个部位。

与设于相机装置1的底面的固定销43卡合的卡合孔71呈一端部的直径比另一端部的直径大的大致葫芦状地形成于卡止片7a。同样，与设于全方位麦克风阵列装置2的底面的固定销45卡合的卡合孔73 呈一端部的直径比另一端部的直径大的大致葫芦状地形成于卡止片 7b。

固定销43、45分别由具有卡合孔71、73的一端部与另一端部之间的粗细(直径)的头部和比头部细的躯干部构成。

在顶棚安装金属板7z的表面上，扇形的孔部7c、7d分别以向卡止片7a及卡止片7b的外侧扩展的方式形成于三个部位。在顶棚安装金属板7z安装有全方位麦克风阵列装置2及相机装置1的情况下，以使全方位麦克风阵列装置2及相机装置1的各水平角的基准方向一致的方式设计上述的扇形的孔部7c、7d的形状及位置。

在顶棚安装金属板7z的表面的中央部，供螺丝41插通的螺丝孔 7e形成于三个部位。经由螺丝孔7e而使螺丝41与顶棚面8螺合，由此顶棚安装金属板7z固定于顶棚面8。

在全方位麦克风阵列装置2及相机装置1安装于顶棚安装金属板 7z的情况下，首先，将相机装置1安装于顶棚安装金属板7z。在这种情况下，使固定销43与形成于卡止片7a的卡合孔71卡合。

即，将向相机装置1的底面突出的固定销43向卡合孔71的直径大的一端部侧插入。并且，在固定销43的头部从卡合孔71突出的状态下，通过使相机装置1向右方向或左方向旋转而使固定销43在卡合孔71中移动(旋转锁定方式)。并且，在固定销43的头部移动到卡合孔71的另一端部侧的状态下，固定销43与卡合孔71卡合，相机装置1沿同轴i方向被固定。

在将相机装置1安装于顶棚安装金属板7z之后，以使相机装置1 从全方位麦克风阵列装置2的开口部21a的内侧露出的方式将全方位麦克风阵列装置2安装于顶棚安装金属板7z。在这种情况下，使固定销45与形成于卡止片7b的卡合孔73卡合。另外，将固定销45固定于卡合孔73的次序与将固定销43固定于卡合孔71的次序相同。

图16(A)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z5a、2z5b、2z5c、2z5d、2z5e、2z5f、2z5g、2z5h的第七例(棒形结合)的主视图。图16(B)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z5c、2z5f、2z5h的第八例(棒形结合)的主视图。图16(C)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部2z5a、2z5e的第九例(棒形结合)的主视图。

在图16(A)～图16(C)中，若除去增设麦克风部的个数，则各个增设麦克风部的安装方法及安装增设麦克风部产生的效果与图14 (A)所示的增设麦克风部2z5a、2z5b、2z5c、2z5d的安装方法及安装增设麦克风部产生的效果相同，因此省略说明。

图17(A)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部m1、m2、m3、m4的第十例(构架形结合)的主视图。图17 (B)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部m1、 m2、m3、m4的第十例(构架形结合)的侧视图。图17(C)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部m1、m2、m3、 m4、m5、m6、m7、m8的第十一例(构架形结合)的主视图。图17 (D)是表示在全方位麦克风阵列装置2的周围结合增设麦克风部m1、 m2、m3、m4、m5、m6、m7、m8的第十一例(构架形结合)的侧视图。

在图17(A)中，作为增设麦克风部的第十例，在全方位麦克风阵列装置2的框体的相向的四个部位设置的连接器部c1、c2、c3、c4，经由麦克风线收容管n1、n2、n3、n4而结合增设麦克风部m1、m2、 m3、m4。

作为结合方法，首先，在全方位麦克风阵列装置2的框体的相向的四个部位设置的连接器部c1、c2、c3、c4上连接麦克风线收容管n1、 n2、n3、n4。麦克风线收容管n1、n2、n3、n4例如通过树脂成型来制造，在内部收容有用于传送由增设麦克风部m1、m2、m3、m4收音到的声音的声音数据的信号线。在连接了麦克风线收容管n1、n2、n3、 n4之后，将增设麦克风部m1、m2、m3、m4与麦克风线收容管n1、 n2、n3、n4连接，增设麦克风部m1、m2、m3、m4的结合结束。

因此，通过图17(A)所示的增设麦克风部m1、m2、m3、m4的结合，本实施方式的指向性控制系统10不需要上述的用于收容增设麦克风部内的麦克风元件的框体，能够将由框体引起的声音(声波)的旋入排除而对声音进行收音，因此不需要将全方位麦克风阵列装置2 与增设麦克风部m1、m2、m3、m4沿高度方向分离地设置。而且，指向性控制系统10经由麦克风线收容管n1、n2、n3、n4，能够将设置在全方位麦克风阵列装置2的周围的连接器部c1、c2、c3、c4与增设麦克风部m1、m2、m3、m4简易地连接，而且，与在全方位麦克风阵列装置2增设具有预定形状的框体的增设麦克风部的情况相比，能够使增设麦克风部轻量化，因此能够进一步提高增设麦克风部内的麦克风元件的收音特性。

而且，在图17(C)中，也是若除去增设麦克风部的个数，则各个增设麦克风部的安装方法与图17(A)所示的增设麦克风部m1、m2、 m3、m4的安装方法相同，因此省略说明。关于效果，通过追加增设麦克风部m1、m2、m3、m4和高度不同的增设麦克风部m5、m6、m7、 m8，与仅结合增设麦克风部m1、m2、m3、m4的第十例相比，能够提高垂直方向(铅垂方向)的收音性能。

图18(A)是表示具有将全方位麦克风阵列装置2的周围包围的开口部且具有与全方位麦克风阵列装置2呈同心圆状的框体(环框体) 的增设麦克风部2z1的结合方法的第一例的主视图。图18(B)是表示增设麦克风部2z1向全方位麦克风阵列装置2的周围的结合方法的第二例的主视图。

在图18(A)所示的结合方法中，将全方位麦克风阵列装置2及相机装置1预先连接于放大顶棚安装金属板7y，在结合增设麦克风部 2z1的情况下，以包围全方位麦克风阵列装置2的周围的方式连接于放大顶棚安装金属板7y。

在图18(B)所示的结合方法中，从已设的顶棚安装金属板7z将全方位麦克风阵列装置2及相机装置1拆卸，在顶棚安装金属板7z上固定例如4个固定部f1、f2、f3、f4，而且，在将增设麦克风部2z1安装于顶棚安装金属板7z的情况下，在4个固定部f1、f2、f3、f4分别紧固固定螺丝41。之后，以收纳于增设麦克风部2z1的开口部的方式安装全方位麦克风阵列装置2及相机装置1。

图19(A)是表示增设麦克风部2z1向全方位麦克风阵列装置2f 的周围的结合方法的第三例的主视图。图19(B)示出图19(A)的 E-E截面，是表示增设麦克风部2z1向全方位麦克风阵列装置2f的周围的结合方法的第三例的侧视图。图19(C)是表示增设麦克风部2z1 向全方位麦克风阵列装置2的周围的结合方法的第四例的补充说明图。在图19(A)及图19(B)所示的例子中，在全方位麦克风阵列装置 2f的框体的圆周设置能够供例如2个钩部f5、f7卡止的凹部u1、u2。

在图19(A)及图19(B)所示的结合方法中，从已设的顶棚安装金属板7z将全方位麦克风阵列装置2f及相机装置1拆卸，在顶棚安装金属板7z上，使设置在增设麦克风部2z1的开口部的相向的四个部位的钩部f5、f6、f7、f8卡止而固定于凹部u1、u2，进而，安装全方位麦克风阵列装置2f及相机装置1。

在图19(C)所示的结合方法中，已设的顶棚安装金属板7z更换为例如设有3个钩部f9、f10、f11的放大顶棚安装金属板7y。在放大顶棚安装金属板7y上依次通过旋转锁定方式(参照图15(A))而连接增设麦克风部2z1、全方位麦克风阵列装置2及相机装置1，由此增设麦克风部2z1相对于全方位麦克风阵列装置2而结合。

图20是表示在全方位麦克风阵列装置2s1的周围结合增设麦克风部2zs1的第十二例(片形结合)的立体图。全方位麦克风阵列装置2s1 的框体为矩形形状，在中央设置能够收容包含鱼眼透镜的鱼眼相机1s 或者与鱼眼相机1s相同大小的盖的圆状连结部jg3，在中间边部设置形成有半圆状的凹面的中间边连结部jg2，而且，在两端部设置形成有1/4 圆状的凹面的两端连结部jg1。

在图20所示的结合方法中，增设麦克风部2zs1与全方位麦克风阵列装置2s1的框体的周围相邻，而且以成为同一平面上的方式通过粘结等结合并固定。另外，在图20所示的结合方法中，1个或多个增设麦克风部2zs1能够与全方位麦克风阵列装置2s1结合，鱼眼相机1s移设于全方位麦克风阵列装置2s1及增设麦克风部的结合后的框体的中央。

因此，通过图20所示的增设麦克风部2zs1的结合，本实施方式的指向性控制系统10在全方位麦克风阵列装置2s1的周围能够容易地连结增设麦克风部2zs1，根据增设麦克风部2zs1的连结数，能够将全方位麦克风阵列装置2s1的框体的中心设置的鱼眼相机1s对应于连结后(结合后)的全方位麦克风阵列装置2s1及增设麦克风部2zs1的框体形状，而简易地移设于连结后(结合后)的全方位麦克风阵列装置 2s1及增设麦克风部2zs1的框体形状的中心位置。

最后，参照图21，简单地说明上述的本实施方式的增设麦克风部相对于全方位麦克风阵列装置2而结合的情况下的全方位麦克风阵列装置2及增设麦克风部的硬件结构。图21是表示增设麦克风部2z1所结合的全方位麦克风阵列装置2的硬件结构的一例的框图。另外，在图21中，省略向图1所示的网络NW的连接线的图示。

增设麦克风部2z1是包括至少多个(例如m个)麦克风元件22 (n+1)～22(n+m)和与麦克风元件同数的ADC24(n+1)～24(n+m) 的结构。增设麦克风部2z1经由结合部CN2而能够与全方位麦克风阵列装置2结合。由增设麦克风部2z1的麦克风元件22(n+1)～22(n+m) 收音到的模拟的声音信号在ADC24(n+1)～24(n+m)中被转换成数字的声音信号，向全方位麦克风阵列装置2的I/F部2if输入。CPU2p 将由全方位麦克风阵列装置2内的麦克风元件221～22n和增设麦克风部22(n+1)～22(n+m)收音到的声音信号从未图示的通信I/F部向指向性控制装置3发送。

以下，说明上述的本发明的指向性控制装置、指向性控制方法及指向性控制系统的结构、作用及效果。

本发明的一实施方式涉及指向性控制装置，对由包括多个麦克风的收音部收音到的声音的指向性进行控制，该指向性控制装置具备：波束形成部，在从所述收音部向与在显示部的图像上指定的位置对应的声源的方向上形成波束；及倍率设定部，根据输入来设定用于放大或缩小所述显示部的图像的倍率，所述波束形成部根据由所述倍率设定部设定的倍率来变更所述形成的波束的尺寸。

在该结构中，指向性控制装置对由包括多个麦克风的收音部收音到的声音的指向性进行控制，在从收音部向与在显示部的图像上指定的位置对应的声源的方向上形成波束，根据输入来设定用于放大或缩小显示部的图像的倍率，而且，根据设定的倍率来变更波束的尺寸。

由此，指向性控制装置在对于监控对象通过对显示部的图像上的输入操作(例如缩放处理)来切换监控对象的被摄体的情况下，根据缩放处理来调整声音数据的指向性的强度(即，指向方向的尺寸(例如波束宽度))，而且，对应于调整后的波束宽度来形成指向性。因此，指向性控制装置能够适当地形成对于切换后的监控对象的被摄体的声音数据的指向性，能够抑制监控者的监控业务的效率劣化。

而且，本发明的一实施方式涉及指向性控制装置，其中，在通过所述倍率设定部设定倍率以放大所述图像的情况下，所述波束形成部减小所述波束的尺寸。

根据该结构，在图像数据的缩放处理为推近处理的情况下，指向性控制装置设定倍率(例如缩放倍率)以放大显示部的图像，因此能够对应于设定的倍率而将指向方向的波束宽度调整得较窄，能够将切换后的监控对象的被摄体(例如特定的人物)发出的声音比被摄体的周围的声音更显著地输出，因此能够提高监控者的监控业务效率。

而且，本发明的一实施方式涉及指向性控制装置，其中，在通过所述倍率设定部设定倍率以缩小所述图像的情况下，所述波束形成部增大所述波束的尺寸。

根据该结构，在图像数据的缩放处理为拉远处理的情况下，指向性控制装置设定倍率(例如缩放倍率)以缩小显示部的图像，因此能够对应于设定的倍率而将指向方向的波束宽度调整得较宽，能够将切换后的监控对象的被摄体(例如多个人物)发出的声音网罗性地输出，因此能够提高监控者的监控业务效率。

而且，本发明的一实施方式涉及指向性控制装置，其中，所述波束形成部根据由所述倍率设定部设定的倍率来判定是否需要调整所述声音的音量等级。

在该结构中，指向性控制装置根据设定的倍率来判定是否需要调整由收音部收音到的声音的音量等级。

由此，在根据对于监控对象的通过缩放处理设定的倍率而切换了监控对象的被摄体的情况下，指向性控制装置判定是否需要调整声音数据的音量等级，因此根据缩放处理的内容，能够对应于切换后的监控对象相对于显示部的显示区域的大小而没有不适感地输出声音。

而且，本发明的一实施方式涉及指向性控制装置，其中，在通过所述倍率设定部设定倍率以放大所述图像的情况下，所述波束形成部提升所述声音的音量等级。

根据该结构，在图像数据的缩放处理为推近处理的情况下，指向性控制装置设定倍率以放大显示部的图像，因此能够对应于设定的倍率而提升声音数据的音量等级，能够将切换后的监控对象的被摄体(例如特定的人物)发出的声音以比被摄体的周围的声音大的音量输出，因此能够提高监控者的监控业务效率。

而且，本发明的一实施方式涉及指向性控制装置，其中，在通过所述倍率设定部设定倍率以缩小所述图像的情况下，所述波束形成部维持或降低所述声音的音量等级。

根据该结构，指向性控制装置即使图像数据的缩放处理为拉远处理也能够维持声音数据的音量等级，因此能够将切换后的监控对象的被摄体(例如多个人物)发出的声音与被摄体的周围的声音同等地输出，或者在音量等级充分大的情况下降低音量等级，因此即便是拉远处理也能够使监控者没有不适感地执行监控业务。

而且，本发明的一实施方式涉及指向性控制装置，其中，还具备对显示于所述显示部的所述图像进行处理的图像处理部，在通过所述图像处理部在所述图像中未检测到人物的情况下，所述波束形成部维持所述波束的尺寸。

在该结构中，在通过图像处理部判断为在图像数据中未检测到人物的情况下，波束形成部维持指向方向的波束的尺寸(例如波束宽度)。

由此，在图像数据中未检测到人物的情况下，指向性控制装置不调整声音数据的指向性的强弱，因此能够消除在人物未映入的状况下收音区域的周围的环境音发生变动的不适感。

而且，本发明的一实施方式涉及指向性控制装置，其中，在通过所述倍率设定部设定倍率以放大所述图像的情况下，所述波束形成部对所述声音进行变声处理。

根据该结构，在设定倍率以放大图像的情况下，指向性控制装置对由收音部收音到的声音数据进行变声处理，因此切换后的监控对象的被摄体(例如特定的人物)发出的声音是谁的声音难以分辨，由此能够有效地保护被摄体的声音上的隐私。

而且，本发明的一实施方式涉及指向性控制装置，其中，在通过所述倍率设定部设定倍率以放大所述图像的情况下，所述图像处理部对所述图像中的人物的一部分进行掩蔽处理。

根据该结构，在设定倍率以放大图像的情况下，指向性控制装置对推近处理后的图像数据中的人物的一部分(例如脸部)进行掩蔽处理，因此切换后的监控对象的被摄体(例如特定的人物)是谁难以分辨，由此能够有效地保护被摄体的图像上的隐私。

而且，本发明的一实施方式涉及指向性控制方法，是对由包括多个麦克风的收音部收音到的声音的指向性进行控制的指向性控制装置的指向性控制方法，该指向性控制方法具有以下步骤：对由包括多个麦克风的收音部收音到的声音的指向性进行控制；根据输入来设定用于放大或缩小所述显示部的图像的倍率；及根据所设定的所述倍率来变更所形成的所述波束的尺寸。

在该方法中，指向性控制装置对由包括多个麦克风的收音部收音到的声音的指向性进行控制，在从收音部向与在显示部的图像上指定的位置对应的声源的方向上形成波束，根据输入来设定用于放大或缩小显示部的图像的倍率，而且，根据设定的倍率来变更波束的尺寸。

由此，在对于监控对象通过对显示部的图像上的输入操作(例如缩放处理)而切换了监控对象的被摄体的情况下，指向性控制装置根据缩放处理来调整声音数据的指向性的强度(即，指向方向的尺寸(例如波束宽度))，而且，对应于调整后的波束宽度而形成指向性。因此，指向性控制装置能够适当地形成对于切换后的监控对象的被摄体的声音数据的指向性，能够抑制监控者的监控业务的效率劣化。

而且，本发明的一实施方式涉及存储介质，存储有执行对由包括多个麦克风的收音部收音到的声音的指向性进行控制的指向性控制装置的处理的程序，所述存储介质存储有执行如下步骤的程序：对由包括多个麦克风的收音部收音到的声音的指向性进行控制；根据输入来设定用于放大或缩小所述显示部的图像的倍率；及根据所设定的所述倍率来变更所形成的所述波束的尺寸。

在该结构中，在记录介质中存储有使计算机(例如指向性控制装置)执行如下步骤的程序：对由包括多个麦克风的收音部收音到的声音的指向性进行控制；在从收音部向与在显示部的图像上指定的位置对应的声源的方向上形成波束；根据输入来设定用于放大或缩小显示部的图像的倍率；及根据设定的倍率来变更波束的尺寸。

由此，从记录介质安装有能够执行的程序的计算机(例如指向性控制装置)在对于监控对象通过对显示部的图像上的输入操作(例如缩放处理)而切换了监控对象的被摄体的情况下，根据缩放处理来调整声音数据的指向性的强度(即，指向方向的尺寸(例如波束宽度))，而且，对应于调整后的波束宽度而形成指向性。因此，指向性控制装置能够适当地形成对于切换后的监控对象的被摄体的声音数据的指向性，能够抑制监控者的监控业务的效率劣化。

而且，本发明的一实施方式涉及指向性控制系统，具备：拍摄部，对收音区域进行拍摄；第一收音部，包括多个麦克风且对所述收音区域的声音进行收音；及指向性控制装置，对由所述第一收音部收音到的声音的指向性进行控制，所述指向性控制装置具备：显示部，显示由所述拍摄部拍摄到的所述收音区域的图像；波束形成部，根据对显示于所述显示部的所述图像的位置的指定，在从所述第一收音部向与所指定的所述位置对应的声源的方向上形成波束；及倍率设定部，根据输入来设定用于放大或缩小所述显示部的图像的倍率，所述波束形成部根据由所述倍率设定部设定的倍率来变更所形成的所述波束的尺寸。

在该结构中，指向性控制装置对由包括多个麦克风的第一收音部收音到的声音的指向性进行控制，在从第一收音部向由拍摄部拍摄到的图像显示于显示部的情况下与在图像上指定的位置对应的声源的方向上形成波束，根据输入来设定用于放大或缩小显示部的图像的倍率，而且，根据设定的倍率来变更波束的尺寸。

由此，在指向性控制系统中，在对于监控对象通过对显示部的图像上的输入操作(例如缩放处理)而切换了监控对象的被摄体的情况下，指向性控制装置根据缩放处理来调整声音数据的指向性的强度 (即，指向方向的尺寸(例如波束宽度))，进而，对应于调整后的波束宽度来形成指向性。因此，在指向性控制系统中，指向性控制装置能够适当地形成对于切换后的监控对象的被摄体的声音数据的指向性，能够抑制监控者的监控业务的效率劣化。

而且，本发明的一实施方式涉及指向性控制系统，其中，还设有第二收音部，该第二收音部具有将所述第一收音部的周围包围的开口部且具有与所述第一收音部呈同心圆状的框体。

根据该结构，指向性控制系统还设置具有与第一收音部呈同心圆状的框体的第二收音部，因此在第二收音部的圆周上均等地配置多个收音元件(麦克风元件)，由此，与单独使用第一收音部的情况下的声音的收音特性相比，能够均等地进一步提高对于全方位的声音的收音特性。

而且，本发明的一实施方式涉及指向性控制系统，其中，还设有第二收音部，该第二收音部具有将所述第一收音部的周围包围的开口部且具有椭圆形状的框体。

根据该结构，指向性控制系统还设置具有椭圆形状的框体的第二收音部，因此例如能够在第二收音部的椭圆形状的长度方向上配置比椭圆形状的长度方向以外的方向更多的收音元件(麦克风元件)，与单独使用第一收音部的情况下的声音的收音特性相比，能够均匀地提高声音的收音特性，而且，能够更进一步提高相对于椭圆形状的长度方向的声音的收音特性。

而且，本发明的一实施方式涉及指向性控制系统，其中，还设有第二收音部，该第二收音部具有将所述第一收音部的周围包围的开口部且具有矩形形状的框体。

根据该结构，指向性控制系统还设置具有矩形形状的框体的第二收音部，因此在第二收音部的开口部的周围均等地配置多个收音元件 (麦克风元件)，由此，与单独使用第一收音部的情况下的声音的收音特性相比，能够均等地进一步提高对于全方位的声音的收音特性，而且，能够灵活地设置第二收音部。

而且，本发明的一实施方式涉及指向性控制系统，其中，还设有第二收音部，该第二收音部具有将所述第一收音部的周围包围的开口部且具有蜂窝形状的框体。

根据该结构，指向性控制系统还设置具有蜂窝形状的框体的第二收音部，因此在第二收音部的开口部的周围均等地配置多个收音元件 (麦克风元件)，由此，与单独使用第一收音部的情况下的声音的收音特性相比，能够均等地进一步提高对于全方位的声音的收音特性，而且，能够灵活地设置第二收音部，能够根据第二收音部的增设方向使收音性能带有差别。

而且，本发明的一实施方式涉及指向性控制系统，其中，所述第一收音部与所述第二收音部沿着所述第一收音部及所述第二收音部的高度方向分离地设置。

根据该结构，指向性控制系统由于将第一收音部与第二收音部沿高度方向分离地设置，因此能够提高垂直方向(铅垂方向)的收音性能。

而且，本发明的一实施方式涉及指向性控制系统，其中，在所述第一收音部的周围还设置具有至少一个棒形状的框体的第二收音部。

根据该结构，指向性控制系统还设置具有至少1个棒形状的框体的第二收音部，因此沿着第二收音部的长度方向均等地配置多个收音元件(麦克风元件)，由此，与单独使用第一收音部的情况下的声音的收音特性相比，能够进一步提高相对于棒形状的长度方向的声音的收音特性。

而且，本发明的一实施方式涉及指向性控制系统，其中，在所述第一收音部的周围还设置至少一个第二收音部，所述第二收音部经由预定信号线收容管而与设于所述第一收音部的周围的连接器部连接。

根据该结构，指向性控制系统不需要用于收容增设麦克风部内的收音元件(麦克风元件)的框体，能够将由框体引起的声音(声波) 的旋入排除而对声音进行收音，因此不需要将第一收音部与第二收音部沿着高度方向分离地设置。而且，指向性控制系统经由信号线收容管能够将设置在第一收音部的周围的连接器部与第二收音部简易地连接，而且，与在第一收音部增设具有预定形状的框体的第二收音部的情况相比，能够使增设麦克风部轻量化，因此能够进一步提高增设麦克风部内的收音元件(麦克风元件)的收音特性。

而且，本发明的一实施方式涉及指向性控制系统，其中，还设有第二收音部，该第二收音部具有与所述第一收音部相同的矩形形状的框体，所述第一收音部及所述第二收音部的框体在中间边部设置形成有半圆状的凹面的中间边连结部，在两端部设置形成有1/4圆状的凹面的两端连结部。

根据该结构，指向性控制系统在第一收音部的周围能够容易地连结第二收音部，根据第二收音部的连结数，对应于连结后的第一收音部及第二收音部的框体形状，能够将设置在第一收音部的框体的中心的拍摄部向连结后的第一收音部及第二收音部的框体形状的中心位置简易地移设。

而且，本发明的一实施方式涉及指向性控制系统，具备：拍摄部，对收音区域进行拍摄；第一收音部，包括多个麦克风且对所述收音区域的声音进行收音；第二收音部，增设在所述第一收音部的周围；及指向性控制装置，对由所述第一收音部和第二收音部收音到的声音的指向性进行控制，所述指向性控制装置具备：显示部，显示由所述拍摄部拍摄到的所述收音区域的图像；及波束形成部，根据对显示于所述显示部的所述图像的位置的指定，在从所述第一收音部向与所指定的所述位置对应的声源的方向上形成波束。

在该结构中，指向性控制装置根据对显示于显示部的收音区域的图像的位置的指定，在从第一收音部朝向与图像的指定位置对应的声源的指向方向上形成由第一收音部收音到的声音数据的指向性的声音的增强等级不充分的情况下，在所述第一收音部的周围增设第二收音部。

由此，在指向性控制系统中，指向性控制装置即使在声音数据的指向性的强度(即，指向方向的波束宽度)不充分时，通过增设的第二收音部，也能够进一步提高声音数据的指向性的强度，能够抑制监控者的监控业务的效率劣化。

而且，本发明的一实施方式涉及指向性控制系统，其中，所述第二收音部具有将所述第一收音部的周围包围的开口部且具有与所述第一收音部呈同心圆状的框体。

而且，本发明的一实施方式涉及指向性控制系统，其中，所述第二收音部具有将所述第一收音部的周围包围的开口部且具有椭圆形状的框体。

根据该结构，指向性控制系统还设置具有椭圆形状的框体的第二收音部，因此例如在第二收音部的椭圆形状的长度方向上，能够配置比椭圆形状的长度方向以外的方向更多的收音元件(麦克风元件)，与单独使用第一收音部的情况下的声音的收音特性相比，能够均匀地提高声音的收音特性，而且，能够进一步提高相对于椭圆形状的长度方向的声音的收音特性。

而且，本发明的一实施方式涉及指向性控制系统，其中，所述第二收音部具有将所述第一收音部的周围包围的开口部且具有矩形形状的框体。

而且，本发明的一实施方式涉及指向性控制系统，其中，所述第二收音部具有将所述第一收音部的周围包围的开口部且具有蜂窝形状的框体。

根据该结构，指向性控制系统由于将第一收音部与第二收音部沿高度方向分离地设置，因此能够提高垂直方向(铅垂方向)的收音性能。

而且，本发明的一实施方式涉及指向性控制系统，其中，所述第二收音部在所述第一收音部的周围具有至少一个棒形状的框体。

而且，本发明的一实施方式涉及指向性控制系统，其中，增设至少一个所述第二收音部，所述第二收音部经由预定信号线收容管而与设于所述第一收音部的周围的连接器部连接。

根据该结构，指向性控制系统不需要用于收容增设麦克风部内的收音元件(麦克风元件)的框体，能够将由框体引起的声音(声波) 的旋入排除而对声音进行收音，因此不需要将第一收音部与第二收音部沿高度方向分离地设置。而且，指向性控制系统经由信号线收容管而能够将设置在第一收音部的周围的连接器部与第二收音部简易地连接，而且，与在第一收音部增设具有规定形状的框体的第二收音部的情况相比，能够实现增设麦克风部的轻量化，因此能够进一步提高增设麦克风部内的收音元件(麦克风元件)的收音特性。

而且，本发明的一实施方式涉及指向性控制系统，其中，所述第二收音部具有与所述第一收音部相同的矩形形状的框体，所述第一收音部及所述第二收音部的框体在中间边部设置形成有半圆状的凹面的中间边连结部，在两端部设置形成有1/4圆状的凹面的两端连结部。

根据该结构，指向性控制系统能够在第一收音部的周围容易地连结第二收音部，根据第二收音部的连结数，对应于连结后的第一收音部及第二收音部的框体形状，能够将设置在第一收音部的框体的中心的拍摄部向连结后的第一收音部及第二收音部的框体形状的中心位置简易地移设。

以上，参照附图而说明了各种实施方式，但是本发明当然没有限定于上述例子。只要是本领域技术人员，就可知在权利要求书记载的范畴内能想到各种变更例或校正例，并可知这些当然也属于本发明的技术范围。

另外，在上述的实施方式中，说明了使用与推近处理或拉远处理的倍率相关的信息来调整指向方向的波束宽度的例子，但是没有限定于波束宽度，只要能调整波束的尺寸(或波束的大小)，就可以任意。例如，可以不调整波束宽度而调整波束的高度(与指向方向正交的方向的波束宽度)。

工业实用性

本发明作为通过对监控对象的缩放处理即使在监控对象的被摄体切换的情况下也能适当地形成对于切换后的监控对象的被摄体的声音的指向性并且能抑制监控者的监控业务的效率劣化的指向性控制装置、指向性控制方法及指向性控制系统是有用的。

附图标记说明

1、1s相机装置

2、2A、2B、2C、2D、2f、2s、2s1全方位麦克风阵列装置

2z1、2z1a、2z2、2z3、2z4、2z4a、2z5a、2z5b、2z5c、2z5d、2z5e、 2z5f、2z5g、2z5h、2zs1、m1、m2、m3、m4增设麦克风部

3指向性控制装置

4记录器装置

7z顶棚安装金属板

7y放大顶棚安装金属板

7z1、7z2增设用安装金属板

8顶棚面

10指向性控制系统

31通信部

32操作部

33图像处理部

34信号处理部

34a指向方向计算部

34b输出控制部

34c缩放连动控制部

35显示器装置

36扬声器装置

37存储器

c1、c2、c3、c4、c5、c6、c7、c8连接器部

n1、n2、n3、n4麦克风线收容管

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 指向性控制装置、指向性控制方法、存储介质及指向性控制系统 [P] . 中国专利： CN105706462B . 2018.11.30
2. 指向性控制装置、指向性控制方法、存储介质及指向性控制系统 [P] . 中国专利： CN105474667A . 2016-04-06
3. Recording medium storing a control program directivity array antenna system, the directivity control method, and a directivity control program [P] . 日本专利： JPWO2006103878A1 . 2008-09-04

机译：记录介质，其存储有控制程序指向性阵列天线系统，指向性控制方法以及指向性控制程序
4. Antenna directivity control device, antenna directivity control system, and antenna system [P] . 日本专利： JP6575457B2 . 2019-09-18

机译：天线指向性控制装置，天线指向性控制系统以及天线系统
5. Directivity control apparatus and directivity control method of array antenna [P] . 日本专利： JP4457148B2 . 2010-04-28

机译：阵列天线的指向性控制装置及指向性控制方法