首页> 中国专利> 终端数量估计装置及终端数量估计方法

终端数量估计装置及终端数量估计方法

摘要

一种终端数量估计装置,其具有:位置数据取得部,其取得包含识别信息、位置信息和位置取得时刻信息的位置数据;前后位置数据取得部,其对于某个第1位置数据,取得包括相同的识别信息的位置数据中、该第1位置数据的紧前面的第2位置数据和紧后面的第3位置数据的位置取得时刻信息;特征量计算部,其根据第1~第3位置数据的位置取得时刻信息中两个以上的位置取得时刻信息,计算有关第1位置数据的特征量;观测对象取得部,其取得包括观测开始时刻以后而且是观测结束时刻以前的位置取得时刻信息、而且包含与观测区域信息相对应的位置信息的位置数据;以及终端数量估计部,其根据有关观测对象位置数据的特征量及观测期间长度,估计在观测期间中位于观测区域的终端数量。

著录项

  • 公开/公告号CN102959996A

    专利类型发明专利

  • 公开/公告日2013-03-06

    原文格式PDF

  • 申请/专利权人 株式会社NTT都科摩;

    申请/专利号CN201180030251.9

  • 发明设计人 寺田雅之;小林基成;冈岛一郎;

    申请日2011-10-13

  • 分类号H04W4/02(20090101);

  • 代理机构11127 北京三友知识产权代理有限公司;

  • 代理人李辉;黄纶伟

  • 地址 日本东京都

  • 入库时间 2024-02-19 18:03:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-10-09

    未缴年费专利权终止 IPC(主分类):H04W4/02 授权公告日:20150722 终止日期:20171013 申请日:20111013

    专利权的终止

  • 2015-07-22

    授权

    授权

  • 2013-04-03

    实质审查的生效 IPC(主分类):H04W4/02 申请日:20111013

    实质审查的生效

  • 2013-03-06

    公开

    公开

说明书

技术领域

本发明涉及终端数量估计装置及终端数量估计方法,使用从便携式终端(例如移 动电话)的网络设备得到的有关便携式终端的位置信息,估计位于某个区域内的终端 数量。

背景技术

在移动电话运营商的网络设备中,生成移动电话的位置数据或利用者的属性数据 等的运用数据,以向移动电话的利用者提供电气通信服务。通过对这些运用数据实施 累计等统计处理,能够得到“人口分布”、“人口变动”、“人口构成”等有关人口动态的 估计值。其中,“人口分布”是分布于各个区域的人口的相关信息,“人口变动”是某个 区域中的沿着时间轴的人口变动的相关信息,“人口构成”是例如按照性别或年龄段等 区分的人口分布或人口变动的相关信息。

作为上述的位置数据例如有位置登记信号。该位置登记信号是从移动电话向归属 基站大致周期性地发送的信号,在某个基站接收到某个移动电话的位置登记信号的情 况下,能够估计到该移动电话在接收时刻位于该基站的电波到达范围即基站扇区中。

另外,作为位置数据的另一个示例有GPS信息。该GPS信息是从移动电话向归 属基站周期性地发送的信息、或者响应于来自终端的操作或者移动电话网络的请求而 发送的GPS测位结果的相关信息。同样地,在接收到GPS信息的时刻,能够估计到 该移动电话位于GPS测位结果所表示的位置的周围(例如参照专利文献1)。

如果能够根据诸如上述的位置数据的观测结果来估计位于某个地理区域的移动 电话的台数(终端数量),通过再考虑移动电话的签约率等,预计能够得到有关上述 的各种人口动态的估计值。

现有技术文献

专利文献

专利文献1:日本特开2003-44969号公报

发明内容

发明要解决的问题

可是,根据诸如上述的位置数据准确估计终端数量并非易事。这是因为位置登记 信号或GPS信息等终端的位置数据不是始终发送给移动电话网络,而是间隔某种程 度的时间间隔来发送的以及发送的时间间隔不固定。

例如,分析使用位置登记信号作为位置数据来估计终端数量的情况。如果能够假 设位置登记信号是完全被周期性地发送的,则某个扇区的在设定的观测时间内接收的 位置登记信号的数量与扇区内的终端数量成比例。但是,实际上尽管位置登记信号是 以按照例如移动电话内的定时器来周期性地发送为基本,但是无论定时器的状态如 何,均借助跨越某个特定的基站扇区之间的契机来进行位置登记信号的发送,有时由 于通话或服务区外等的影响而使得发送延迟。另外,对于GPS信息也一样,由于服 务区外或终端的操作等各种影响,发送接收的周期不固定。

另外,分析并用位置登记信号和GPS信息作为位置数据的情况。在这种情况下, 能够在估计终端数量时利用的信息量增加,因而预计能够实现精度更高的终端数量估 计。但是,在这种情况下,并用两种信息的位置数据的发送接收频次与分别独立使用 时相比,随机程度进一步增大,如果假设发送接收的周期为固定来估计终端数量,则 担忧估计精度反而恶化。

因此,为了高精度地估计终端数量,需要不仅单纯地统计接收信号的数量,而且 要考虑接收信号的接收间隔的变动。

本发明正是鉴于上述情况而提出的,其目的在于,在使用位置数据估计终端数量 时,对接收间隔的变动所产生的影响进行校正,并且高精度地估计终端数量。

用于解决问题的手段

本发明的一个方面的终端数量估计装置的特征在于,该终端数量估计装置具有: 位置数据取得单元,其取得包含识别便携式终端的识别信息、有关便携式终端的位置 的位置信息和取得位置信息的位置取得时刻信息的位置数据;前后位置数据取得单 元,其对于某个第1位置数据,取得包括与该第1位置数据相同的识别信息的位置数 据中、该第1位置数据的紧前面的位置数据即第2位置数据的位置取得时刻信息、以 及该第1位置数据的紧后面的位置数据即第3位置数据的位置取得时刻信息;特征量 计算单元,其根据第1位置数据的位置取得时刻信息、第2位置数据的位置取得时刻 信息及第3位置数据的位置取得时刻信息中两个以上的位置取得时刻信息,计算有关 第1位置数据的特征量;观测对象取得单元,其取得包括有关待观测的观测期间的观 测开始时刻以后而且是观测结束时刻以前的位置取得时刻信息、而且包括与有关待观 测的观测区域的观测区域信息相对应的位置信息在内的一个或多个位置数据,作为观 测对象位置数据;以及终端数量估计单元,其根据有关观测对象位置数据的特征量以 及观测开始时刻与观测结束时刻之差即观测期间长度,估计在观测期间中位于观测区 域内的终端数量。另外,“特征量”是指与有关便携式终端生成的位置数据的估计生成 密度对应的信息,其中的“估计生成密度”是指生成该位置数据的便携式终端在该位置 数据的生成时刻(相当于上述的位置取得时刻)左右于每单位时间内生成的位置数据 的数量的估计值。在上述的终端数量估计装置中也可以是,特征量计算单元计算第2 位置数据的位置取得时刻与第3位置数据的位置取得时刻之差,作为有关第1位置数 据的特征量,终端数量估计单元将有关观测对象位置数据的特征量的总和除以观测期 间长度的2倍,将相除得到的数值估计为终端数量。具体原理将在后面叙述,特征量 计算单元计算第2、第3位置数据的位置取得时刻之差作为有关第1位置数据的特征 量,终端数量估计单元将有关观测对象位置数据的特征量的总和除以观测期间长度的 2倍,将相除得到的数值估计为终端数量,由此能够对接收间隔的变动所产生的影响 进行校正,并且高精度地估计终端数量。

另外,也可以是,在第1位置数据的位置取得时刻与第2位置数据的位置取得时 刻之差大于预定值的情况下,特征量计算单元将从第1位置数据的位置取得时刻起向 过去追溯预定的时间得到的时刻用作第2位置数据的位置取得时刻,来计算有关第1 位置数据的特征量。同样,也可以是,在第1位置数据的位置取得时刻与第3位置数 据的位置取得时刻之差大于预定值的情况下,特征量计算单元将从第1位置数据的位 置取得时刻起向未来前进预定的时间得到的时刻用作第3位置数据的位置取得时刻, 来计算有关第1位置数据的特征量。通过使特征量计算单元按照以上所述进行动作, 在位置数据的取得时间间隔由于便携式终端位于服务区外或便携式终端的电源切断 等而变得异常长时,能够防止由于该异常长的取得时间间隔而造成的影响过大。

另外,也可以是,特征量计算单元判别第1位置数据是否包括由于跨越位置登记 区域边界而生成的位置登记信息、以及第3位置数据是否包括由于跨越位置登记区域 边界而生成的位置登记信息,根据第1位置数据是否包括由于跨越位置登记区域边界 而生成的位置登记信息的判别结果、和第3位置数据是否包括由于跨越位置登记区域 边界而生成的位置登记信息的判别结果,使用第1位置数据的位置取得时刻信息、第 2位置数据的位置取得时刻信息及第3位置数据的位置取得时刻信息中的两个以上的 位置取得时刻信息,计算有关第1位置数据的特征量。在这种情况下,具体原理将在 后面叙述,通过考虑与由于跨越位置登记区域边界而生成的位置登记信息相关的生成 定时的特性,能够得到精度较高的特征量。另外,所谓“由于跨越位置登记区域边界 而生成的位置登记信息”,是指由于便携式终端跨越位置登记区域边界而生成的位置 登记信息。

更具体地讲,也可以是,特征量计算单元在第1位置数据包括由于跨越位置登记 区域边界而生成的位置登记信息的情况下,将第1位置数据的位置取得时刻设定为第 1变量,在第1位置数据不包括由于跨越位置登记区域边界而生成的位置登记信息的 情况下,将第1位置数据的位置取得时刻与第2位置数据的位置取得时刻之间的中点 时刻设定为第1变量,在第3位置数据包括由于跨越位置登记区域边界而生成的位置 登记信息的情况下,将第3位置数据的位置取得时刻设定为第2变量,在第3位置数 据不包括由于跨越位置登记区域边界而生成的位置登记信息的情况下,将第1位置数 据的位置取得时刻与第3位置数据的位置取得时刻之间的中点时刻设定为第2变量, 根据所设定的第1变量与第2变量之差来计算有关第1位置数据的特征量。

另外,也可以是,在第1位置数据的位置取得时刻与第1变量之差大于预定值的 情况下,特征量计算单元将从第1位置数据的位置取得时刻起向过去追溯预定的时间 得到的时刻用作第1变量,来计算有关第1位置数据的特征量。同样,也可以是,在 第1位置数据的位置取得时刻与第2变量之差大于预定值的情况下,特征量计算单元 将从第1位置数据的位置取得时刻起向未来前进预定的时间得到的时刻用作第2变 量,来计算有关第1位置数据的特征量。通过使特征量计算单元按照以上所述进行动 作,在位置数据的取得时间间隔由于便携式终端位于服务区外或便携式终端的电源被 切断等而变得异常长时,能够防止由于该异常长的取得时间间隔而造成的影响过大。

另外,在终端数量估计装置中,作为特征量的计算对象,也可以将由观测对象取 得单元取得的观测对象位置数据作为对象,还可以将由位置数据取得单元取得的所有 位置数据作为对象。其中,在将由观测对象取得单元取得的观测对象位置数据作为对 象的情况下,前后位置数据取得单元将由观测对象取得单元取得的各个观测对象位置 数据作为第1位置数据,并取得有关该第1位置数据的第2位置数据的位置取得时刻 信息、以及有关该第1位置数据的第3位置数据的位置取得时刻信息,特征量计算单 元计算有关各个观测对象位置数据的特征量,终端数量估计单元使用计算得到的有关 观测对象位置数据的特征量来估计终端数量。

另一方面,在将由位置数据取得单元取得的所有位置数据作为对象的情况下,前 后位置数据取得单元将由位置数据取得单元取得的所有位置数据的各个作为第1位 置数据,并取得有关该第1位置数据的第2位置数据的位置取得时刻信息、以及有关 该第1位置数据的第3位置数据的位置取得时刻信息,特征量计算单元计算有关所有 位置数据各自的特征量,终端数量估计单元使用计算得到的有关所有位置数据各自的 特征量中有关观测对象位置数据的特征量来估计终端数量。

本发明的一个方面的终端数量估计装置也可以构成为,该终端数量估计装置具 有:位置数据取得单元,其取得包含识别便携式终端的识别信息、有关便携式终端的 位置的位置信息和取得位置信息的位置取得时刻信息的位置数据;前后位置数据取得 单元,其对于某个第1位置数据,取得包括与该第1位置数据相同的识别信息的位置 数据中、该第1位置数据的紧前面的位置数据即第2位置数据的位置取得时刻信息、 以及该第1位置数据的紧后面的位置数据即第3位置数据的位置取得时刻信息;特征 量计算单元,其根据至少第2位置数据的位置取得时刻信息及第3位置数据的位置取 得时刻信息,计算有关第1位置数据的特征量;观测对象取得单元,其取得包括有关 待观测的观测期间的观测开始时刻以后而且是观测结束时刻以前的位置取得时刻信 息、而且包括与有关待观测的观测区域的观测区域信息相对应的位置信息在内的一个 或多个位置数据,作为观测对象位置数据;以及终端数量估计单元,其根据有关观测 对象位置数据的特征量以及观测开始时刻与观测结束时刻之差即观测期间长度,估计 在观测期间中位于观测区域内的终端数量。

另外,也可以是,终端数量估计装置还具有存储用于将终端数量变换为人口的放 大系数的放大系数存储单元,终端数量估计单元根据有关观测对象位置数据的特征 量、观测期间长度及放大系数,估计在观测期间中位于观测区域的人口、以及每人口 估计单位的人口中的至少一方,其中该人口估计单位是估计人口的单位。关于上述的 “人口估计单位”,例如可以列举属性、场所、时间段等。另外,放大系数可以使用存 储在放大系数存储单元中的放大系数,也可以按照下面所述来导出放大系数。作为一 例,放大系数能够使用“在服务区率与终端的普及率之积(即,在服务区率与人口的 比率)”的倒数。其中的“在服务区率”是指在服务区数量与签约台数的比率,“普及率” 是指签约台数与人口的比率。优选按照上述的每人口估计单位来导出这种放大系数, 但不是必须的。

另外,也可以是,例如使用按照下面所述根据特征量及观测期间长度而估计出的 终端数量(在服务区数量)来导出放大系数。即,从位置数据求出特征量,根据特征 量及观测期间长度来累计每种放大系数计算单位的终端数量,由此得到用户数量金字 塔数据,并且作为统计数据(例如居民基本登记册等)来取得预先求出的相同的每种 放大系数计算单位的人口金字塔数据。并且,在用户数量金字塔数据和人口金字塔数 据中计算每种放大系数计算单位的位置数据的取得率(即在服务区数量/人口)。在此 得到的“位置数据的取得率(即在服务区数量/人口)”相当于前述的“在服务区率与终 端的普及率之积”。能够导出这样得到的“位置数据的取得率”的倒数作为放大系数。 另外,关于计算放大系数的放大系数计算单位,作为一例,也可以采用住所的都道府 县、间隔5岁或10岁的年龄段、男女、作为时间段的1小时等,还可以采用将其中 两个以上的单位进行组合的单位。例如,在将放大系数计算单位设为“居住在东京都 的二十几岁的男性”的情况下,通过提取日本全国的与居住在东京都的(即,用户属 性中的住所信息是东京都)二十几岁的男性对应的位置数据并累计终端数量,能够得 到用户数量金字塔数据,并且从统计数据取得与居住在东京都的二十几岁的男性相关 的人口金字塔数据。另外,在得到上述用户数量金字塔数据时,关于条件“居住在东 京都”,不是仅提取在东京都服务区的用户的位置数据,而是提取用户属性中的住所 信息是东京都的位置数据。并且,根据用户数量金字塔数据和人口金字塔数据计算放 大系数计算单位(此处指居住在东京都的二十几岁的男性)的位置数据的取得率(即, 在服务区数量/人口),并导出所得到的“位置数据的取得率”的倒数作为放大系数。另 外,在本申请中,将放大系数计算单位和人口估计单位作为相同单位进行说明,但这 毕竟仅是一例,并不限于此。

另外,也可以是,终端数量估计装置还具有变换单元,该变换单元根据与观测区 域不同的输出单位和观测区域的重合区域在观测区域中所占的面积比,将通过所述终 端数量估计单元的估计而得到的每个观测区域的估计值变换为每输出单位的估计值。 也可以是,在室内站的通信区域以及利用电波到达范围不同的频带的多个室外站的通 信区域中有两个以上的通信区域重叠存在于地理上相同的观测区域的情况下,上述的 变换单元对于重叠存在的各个通信区域,基于所述面积比变换为每输出单位的估计 值、并针对各个所述通信区域对变换后的估计值进行合计,由此得到每输出单位的估 计值。

也可以是,终端数量估计单元根据有关观测对象位置数据的特征量、观测期间长 度、用于将终端数量变换为人口的放大系数、以及与观测区域不同的输出单位和观测 区域的重合区域在观测区域中所占的面积比,区分为每输出单位及每人口估计单位来 估计人口。

作为区分为每输出单位及每种人口估计单位来估计人口的方式,也可以是,在终 端数量估计单元估计人口之前,使特征量、放大系数、面积比以及与该面积比相关的 输出单位ID的组合与位置数据相关联,终端数量估计单元对于与相同输出单位ID 相关联的位置数据计算(特征量×面积比×放大系数),并按人口估计单位来对所得到 的每输出单位的(特征量×面积比×放大系数)进行累计,根据所得到的每输出单位 且每人口估计单位的累计值和观测期间长度,估计每输出单位且每人口估计单位的人 口。

另外,也可以是,终端数量估计装置还具有:观测期间取得单元,其取得包括观 测开始时刻与观测结束时刻的组的观测期间信息;以及观测区域取得单元,其取得与 一个或多个位置信息相对应的观测区域信息。

另外,也可以是,终端数量估计装置还具有输出所得到的估计值的输出单元。输 出单元的输出形式能够采用表示人口分布的图、表示按时序人口变动的图、以及表示 人口构成的图中的至少一种,输出单元的输出单位能够根据便携式终端的用户的属 性、时间段、场所中的至少一种来设定。

另外,也可以是,终端数量估计装置还具有非识别化单元,其针对由位置数据取 得单元取得的位置数据中所包含的识别信息,进行包含如下变换的非识别化处理,该 变换是向基于单向性函数的不可逆编码的变换,非识别化单元在进行使用了便携式终 端的用户的属性信息的处理的情况下,在该处理之前对属性信息进行非识别化处理。

另外,也可以是,终端数量估计装置还具有隐匿处理单元,在所得到的估计值被 输出之前,该隐匿处理单元根据预先设定的基准对估计值进行隐匿处理。在这种情况 下,也可以是,隐匿处理单元判定取得源终端数量是否小于判定为需要隐匿处理的基 准值,在某个区域的位置数据的取得源终端数量小于基准值的情况下,将有关该区域 的估计值隐匿,其中,所述取得源终端数量表示作为估计的基础的每个区域的位置数 据是从哪台终端取得的。另外,上述的取得源终端数量表示去除了有关同一终端的重 复的唯一的终端数量。

关于其中的隐匿方法,例如可以采用将估计值设为零的方法、利用预定的文字或 记号(例如“×”等)表示估计值的方法等。另一方面,在某个区域的位置数据的取得 源终端数量不小于基准值的情况下,隐匿处理单元可以不对估计值进行隐匿处理,也 可以进行如下所述的圆整。即,隐匿处理单元根据在估计值输出中使用的多个级别中 该区域的估计值所属的级别中的上限值、下限值、级幅以及该估计值,将该区域的估 计值圆整为分别伴随有概率值的所述上限值及所述下限值,其中所述概率值对应于与 所述上限值的差分以及与所述下限值的差分。

上述的终端数量估计装置的发明能够作为由终端数量估计装置执行的终端数量 估计方法的发明,并发挥相同的作用及效果。具体地讲,根据是将观测对象位置数据 作为对象来计算特征量、还是将所取得的所有位置数据作为对象来计算特征量,能够 进行如下所述的记述。

本发明的一个方面的终端数量估计方法是由终端数量估计装置执行的终端数量 估计方法,其特征在于,该终端数量估计方法包括:位置数据取得步骤,取得包含识 别便携式终端的识别信息、有关便携式终端的位置的位置信息和取得位置信息的位置 取得时刻信息的位置数据;观测对象取得步骤,取得包括有关待观测的观测期间的观 测开始时刻以后而且是观测结束时刻以前的位置取得时刻信息、而且包括与有关待观 测的观测区域的观测区域信息相对应的位置信息在内的一个或多个位置数据,作为观 测对象位置数据;前后位置数据取得步骤,将所取得的各个观测对象位置数据作为第 1位置数据,对于各个第1位置数据,取得包括与该第1位置数据相同的识别信息的 位置数据中、该第1位置数据的紧前面的位置数据即第2位置数据的位置取得时刻信 息、以及该第1位置数据的紧后面的位置数据即第3位置数据的位置取得时刻信息; 特征量计算步骤,根据第1位置数据的位置取得时刻信息、第2位置数据的位置取得 时刻信息及第3位置数据的位置取得时刻信息中两个以上的位置取得时刻信息,计算 有关各个观测对象位置数据的特征量;以及终端数量估计步骤,根据有关通过计算得 到的观测对象位置数据的特征量以及观测开始时刻与观测结束时刻之差即观测期间 长度,估计在观测期间中位于观测区域内的终端数量。

本发明的一个方面的终端数量估计方法是由终端数量估计装置执行的终端数量 估计方法,其特征在于,该终端数量估计方法包括:位置数据取得步骤,取得包含识 别便携式终端的识别信息、有关便携式终端的位置的位置信息和取得位置信息的位置 取得时刻信息的位置数据;前后位置数据取得步骤,将所取得的所有位置数据分别作 为第1位置数据,对于各个第1位置数据,取得包括与该第1位置数据相同的识别信 息的位置数据中、该第1位置数据的紧前面的位置数据即第2位置数据的位置取得时 刻信息、以及该第1位置数据的紧后面的位置数据即第3位置数据的位置取得时刻信 息;特征量计算步骤,根据第1位置数据的位置取得时刻信息、第2位置数据的位置 取得时刻信息及第3位置数据的位置取得时刻信息中两个以上的位置取得时刻信息, 计算有关所有位置数据各自的特征量;观测对象取得步骤,取得包括有关待观测的观 测期间的观测开始时刻以后而且是观测结束时刻以前的位置取得时刻信息、而且包括 与有关待观测的观测区域的观测区域信息相对应的位置信息在内的一个或多个位置 数据,作为观测对象位置数据;以及终端数量估计步骤,根据有关通过计算得到的所 有位置数据各自的特征量中有关观测对象位置数据的特征量、以及观测开始时刻与观 测结束时刻之差即观测期间长度,估计在观测期间中位于观测区域内的终端数量。

本发明的一个方面的终端数量估计方法是由终端数量估计装置执行的终端数量 估计方法,其特征在于,该终端数量估计方法包括:位置数据取得步骤,取得包含识 别便携式终端的识别信息、有关便携式终端的位置的位置信息和取得位置信息的位置 取得时刻信息的位置数据;观测对象取得步骤,取得包括有关待观测的观测期间的观 测开始时刻以后而且是观测结束时刻以前的位置取得时刻信息、而且包括与有关待观 测的观测区域的观测区域信息相对应的位置信息在内的一个或多个位置数据,作为观 测对象位置数据;前后位置数据取得步骤,将所取得的各个观测对象位置数据作为第 1位置数据,对于各个第1位置数据取得包括与该第1位置数据相同的识别信息的位 置数据中、该第1位置数据的紧前面的位置数据即第2位置数据的位置取得时刻信息、 以及该第1位置数据的紧后面的位置数据即第3位置数据的位置取得时刻信息;特征 量计算步骤,根据至少所述第2位置数据的位置取得时刻信息及所述第3位置数据的 位置取得时刻信息,计算有关各个观测对象位置数据的特征量;以及终端数量估计步 骤,根据有关通过计算得到的观测对象位置数据的特征量以及观测开始时刻与观测结 束时刻之差即观测期间长度,估计在观测期间中位于观测区域内的终端数量。

本发明的一个方面的终端数量估计方法是由终端数量估计装置执行的终端数量 估计方法,其特征在于,该终端数量估计方法包括:位置数据取得步骤,取得包含识 别便携式终端的识别信息、有关便携式终端的位置的位置信息和取得位置信息的位置 取得时刻信息的位置数据;前后位置数据取得步骤,将所取得的所有位置数据分别作 为第1位置数据,对于各个第1位置数据取得包括与该第1位置数据相同的识别信息 的位置数据中、该第1位置数据的紧前面的位置数据即第2位置数据的位置取得时刻 信息、以及该第1位置数据的紧后面的位置数据即第3位置数据的位置取得时刻信息; 特征量计算步骤,根据至少第2位置数据的位置取得时刻信息及第3位置数据的位置 取得时刻信息,计算有关所有位置数据各自的特征量;观测对象取得步骤,取得包括 有关待观测的观测期间的观测开始时刻以后而且是观测结束时刻以前的位置取得时 刻信息、而且包括与有关待观测的观测区域的观测区域信息相对应的位置信息在内的 一个或多个位置数据,作为观测对象位置数据;以及终端数量估计步骤,根据有关通 过计算得到的所有位置数据各自的特征量中有关观测对象位置数据的特征量、以及观 测开始时刻与观测结束时刻之差即观测期间长度,估计在观测期间中位于观测区域内 的终端数量。

发明效果

根据本发明,能够对接收间隔的变动所产生的影响进行校正,并且高精度地估计 终端数量。

附图说明

图1是示出第1~第6实施方式的通信系统的系统结构的图。

图2是示出第1实施方式的终端数量估计装置的结构的图。

图3是用于说明终端数量估计的第1思路的图。

图4是用于说明终端数量估计的第1计算方法的图。

图5是示出第1实施方式的终端数量估计处理的流程图。

图6是示出第1、第2实施方式的特征量的计算处理的流程图。

图7是示出第2实施方式的终端数量估计装置的结构的图。

图8是示出第2实施方式的终端数量估计处理的流程图。

图9是用于说明终端数量估计的第2思路的图。

图10是示出第3实施方式的特征量的计算处理的流程图。

图11是示出变量s、e的调整(適正化)处理的流程图。

图12是示出第4实施方式的终端数量估计装置的结构的图。

图13是示出第4实施方式的人口估计处理的流程图。

图14是示出第5实施方式的终端数量估计装置的结构的图。

图15是示出第5实施方式的人口估计处理的流程图。

图16是示出人口估计处理的输出示例的图。

图17是示出第6实施方式的终端数量估计装置的结构的图。

图18是用于说明网格与区域图的合成的图。

图19是用于说明各个分割区域的面积及面积比的计算的图。

图20是用于说明某个网格内的分割区域的人口的总和计算的图。

图21是用于说明第7实施方式的估计值的变换处理的图。

图22是示出用于变换为作为对象的输出单位的估计人口的矩阵的图。

图23是示出第8实施方式的终端数量估计装置的结构的图。

图24是用于说明非识别化处理的一例的图。

图25是示出第9实施方式的终端数量估计装置的结构的图。

图26是示出隐匿处理的一例的流程图。

图27是示出作为输出方式的示例的人口分布、人口变动及人口构成的图。

图28是用于说明终端数量估计的第2思路的图。

具体实施方式

参照附图说明本发明的实施方式。在尽可能的情况下,对相同的部分标注相同的 标号,并省略重复说明。

[第1实施方式]

[通信系统的结构]

图1是本实施方式的通信系统1的系统结构图。如图1所示,该通信系统1构成 为包括便携式终端100、BTS(基站)200、RNC(无线控制装置)300、交换机400、 各种处理节点700及管理中心500。并且,该管理中心500构成为包括社会感测单元 501、PETA挖掘单元(peta mining unit)502、流动人口统计(demography)单元503 及可视化处理单元504。

交换机400通过BTS 200、RNC 300收集有关便携式终端100的后述的位置信息。 RNC 300在与便携式终端100之间进行通信连接时,能够使用RRC连接请求信号中 的延迟值来测定便携式终端100的位置。交换机400能够在便携式终端100执行通信 连接时接收这样测定到的便携式终端100的位置信息。交换机400存储所接收到的位 置信息,并按照预定的定时或者来自管理中心500的请求,将收集到的位置信息输出 给管理中心500。

各种处理节点700通过RNC 300和交换机400取得便携式终端100的位置信息, 根据情况还进行位置的再计算等,并按照预定的定时或者来自管理中心500的请求, 将收集到的位置信息输出给管理中心500。

关于本实施方式中的便携式终端100的位置信息,能够采用表示利用位置登记信 号而求出的归属扇区的扇区号、由GPS测位系统或在采用PRACHPD的位置信息取 得系统中得到的位置测位数据等。便携式终端100的位置数据包括:上述那样的位置 信息、以及识别该便携式终端的识别信息(例如线路号码等与便携式终端对应的信 息)、和取得位置信息的位置信息取得时刻信息。另外,在使用线路号码作为识别信 息的情况下,不是直接采用线路号码,而是优选使用与线路号码对应的值(例如线路 号码的散列值(Hash值)等)(即,将线路号码非识别化)。在使用这样与线路号码 对应的值(例如线路号码的散列值(Hash值)等)来进行用户的每种属性的处理的 情况下,即使是包含于属性信息中的能够特定用户的信息,也需要采用与该能够特定 用户的信息对应的值(即,将该能够特定用户的信息非识别化)。关于这种非识别化, 将在第8实施方式中详细说明。

管理中心500如上所述构成为包括社会感测单元501、PETA挖掘单元502、流 动人口统计单元503及可视化处理单元504,在各个单元中进行在便携式终端100的 位置信息中使用的统计处理。另外,后述的终端数量估计装置10(图2)例如能够由 管理中心500构成。

社会感测单元501是服务器装置,从各个交换机400及各种处理节点700或者离 线收集包含便携式终端100的位置信息等的数据。该社会感测单元501构成为接收从 各个交换机400及各种处理节点700定期输出的数据,或者按照在社会感测单元501 中预先设定的定时从交换机400及各种处理节点700取得数据。

PETA挖掘单元502是服务器装置,将从社会感测单元501接收到的数据变换为 预定的数据形式。例如,PETA挖掘单元502以用户ID为密钥进行分类处理,或按 照每个区域进行分类处理。

流动人口统计单元503是服务器装置,进行针对在PETA挖掘单元502中处理的 数据的累计处理即各个项目的统计处理。例如,流动人口统计单元503计数处于某个 区域的用户数量,并且累计在服务区分布。

可视化处理单元504是服务器装置,能够可视地处理在流动人口统计单元503 中被累计处理的数据。例如,可视化处理单元504能够在地图上对所累计的数据进行 映射处理。由该可视化处理单元504进行处理后的数据被提供给企业、政府机构或者 个人等,用于店铺开发、道路交通调查、灾害对策、环境对策等。另外,这样进行统 计处理后的信息当然是以不特定个人等的方式进行加工的,以便不侵害隐私。

另外,社会感测单元501、PETA挖掘单元502、流动人口统计单元503及可视 化处理单元504如前面所述均由服务器装置构成,虽然省略了图示,但是当然具有通 常的信息处理装置的基本结构(即CPU、RAM、ROM、键盘和鼠标等输入装置、与 外部进行通信的通信装置、存储信息的存储装置、以及显示器或打印机等输出装置)。

[终端数量估计装置的结构]

下面,说明本实施方式的终端数量估计装置。图2示出终端数量估计装置10的 功能结构。如该图2所示,终端数量估计装置10具有位置数据取得部11(位置数据 取得单元)、蓄积部12、观测期间取得部13(观测期间取得单元)、观测区域取得部 14(观测区域取得单元)、观测对象取得部15(观测对象取得单元)、前后位置数据 取得部16(前后位置数据取得单元)、特征量计算部17(特征量计算单元)、终端数 量估计部18(终端数量估计单元)、及终端数量输出部19(输出单元)。

下面,说明图2所示的终端数量估计装置10的各部分的功能。位置数据取得部 11从外部取得上述的位置数据并保存在蓄积部12中。蓄积部12保存有关多个用户 (便携式终端)的多个时刻的位置数据。观测期间取得部13取得包含观测开始时刻 与观测结束时刻的组的观测期间信息。观测区域取得部14取得与一个或多个位置信 息相对应的观测区域信息。此处的观测区域信息被赋予为例如扇区号、经度纬度、地 理范围(例如市区村镇)等,优选观测区域取得部14具有管理对应关联了取得的观 测区域信息的表述形式与位置信息的表述形式的信息的管理数据库(例如扇区号与经 度纬度的对应关系信息等)。

观测对象取得部15从蓄积部12取得包括有关待观测的观测期间的观测开始时刻 以后而且是观测结束时刻以前的位置取得时刻信息、而且包括与有关待观测的观测区 域的观测区域信息相对应的位置信息在内的一个或多个位置数据,作为观测对象位置 数据。另外,观测对象位置数据也可以利用另外赋予的条件(例如便携式终端的用户 的年龄段等)再进行锁定。

前后位置数据取得部16针对求出特征量的对象的位置数据(下面称为第1位置 数据),取得包括与该第1位置数据相同的识别信息的位置数据中、该第1位置数据 的紧前面的位置数据(下面称为第2位置数据)的位置取得时刻信息、以及该第1 位置数据的紧后面的位置数据(下面称为第3位置数据)的位置取得时刻信息。另外, 前后位置数据取得部16不是必须全部取得第2或者第3位置数据,只要至少取得位 置数据中所包含的位置取得时刻信息即可。

在第1实施方式中,前后位置数据取得部16将由观测对象取得部15取得的观测 对象位置数据作为第1位置数据,取得与该第1位置数据相关的第2、第3位置数据 的位置取得时刻信息,后述的特征量计算部17计算有关观测对象位置数据的特征量。 即,第1实施方式是将计算特征量的对象的位置数据锁定为观测对象位置数据的实施 方式。与此相对,在后述的第2实施方式中,说明将所取得的所有位置数据作为对象 来计算特征量的示例。

特征量计算部17计算有关各个第1位置数据(在第1实施方式中指观测对象位 置数据)的特征量。例如,特征量计算部17计算第2位置数据的位置取得时刻与第 3位置数据的位置取得时刻之差,作为有关该第1位置数据的特征量。并且,在第2 位置数据的位置取得时刻是异常值的情况下,在此作为一例是在第1位置数据的位置 取得时刻与第2位置数据的位置取得时刻之差大于预定的基准值(例如1小时)的情 况下,特征量计算部17将从第1位置数据的位置取得时刻起向过去追溯预定的时间 (例如1小时)得到的时刻,用作第2位置数据的位置取得时刻,来计算有关第1 位置数据的特征量。同样,在第3位置数据的位置取得时刻是异常值的情况下,在此 作为一例是在第1位置数据的位置取得时刻与第3位置数据的位置取得时刻之差大于 预定的基准值(例如1小时)的情况下,特征量计算部17将从第1位置数据的位置 取得时刻起向未来前进预定的时间(例如1小时)得到的时刻,用作第3位置数据的 位置取得时刻,来计算有关第1位置数据的特征量。这种在第2、第3位置数据的位 置取得时刻是异常值时的处理不是必须的处理,但通过进行上述处理,在由于便携式 终端100位于服务区外或便携式终端100的电源被切断等,位置数据的取得时间间隔 变得异常地长时,能够防止由于该异常长的取得时间间隔而造成的影响过大。

终端数量估计部18根据有关观测对象位置数据的特征量以及观测开始时刻与观 测结束时刻之差即观测期间长度,估计在观测期间中位于观测区域的终端数量。详细 情况将在后面叙述,终端数量估计部18将有关观测对象位置数据的特征量的总和除 以观测期间长度的2倍,将相除得到的数值估计为终端数量。

终端数量输出部19输出通过估计而得到的终端数量。此处的输出包括显示输出、 语音输出、打印输出等各种输出形式。

[终端数量估计的思路及计算方法]

下面,说明终端数量估计的思路及计算方法。如图3所示的模型那样,假设在某 个观测期间(长度T)中,n个终端a1、a2、…、an通过扇区S,各个终端ai在观测 期间内在扇区S的滞留时间为ti(0<ti≦T)。此时,位于扇区S中的终端数量m(实 际是位于扇区S中的终端数量m的观测期间内的平均值)用下式(1)表示。

[数式1]

m=Σi=1nti/T---(1)

即,将各个终端ai在观测期间内在扇区S的滞留时间ti的总和除以观测期间的长 度T,将相除的结果估计为终端数量m。其中,虽然终端ai在观测期间内在扇区S的 滞留时间ti的真正值是不能观测到的,但是各个终端ai发出信号(例如位置登记信号), 这些信号是能够观测到的。

将终端ai在观测期间内在扇区S发出的信号按照时刻顺序设为

[数式2]

qi1,qi2,...,qixi

(xi表示终端ai在观测期间内在扇区S发出的信号的总数),终端数量的估计一定是 根据观测到的信号qij(j为1以上xi以下的整数)估计m的值。

另外,根据图4说明终端数量估计的计算方法。将从终端ai发送信号qij的密度 (即,每单位时间的信号数)设为pi。此时,如果发送信号的概率相对于扇区是独立 的,则终端ai在观测期间内在扇区S发出的信号的总数xi的期望值E(xi)是E(xi) =ti×pi,因而关于终端ai在观测期间内在扇区S的滞留时间ti的期望值E(xi),下 面的式(2)成立。

E(ti)=xi/pi    (2)

其中,在设信号qij的发送时刻为uij时,信号qij的密度pij通过下式(3)来赋值。

pij=2/(ui(j+1)-ui(j-1))    (3)

其中,在设信号qij为有关第1位置数据的信号时,信号qi(j-1)相当于有关第2 位置数据的信号,信号qi(j+1)相当于有关第3位置数据的信号。在本实施方式中,将 有关第2位置数据的信号qi(j-1)的发送时刻ui(j-1)与有关第3位置数据的信号qi(j+1)的发送时刻ui(j+1)之差即上式(3)中的(ui(j+1)-ui(j-1)),作为有关第1位置数据的 特征量wij。因此,上式(3)表示如下。即,能够与密度pij的倒数相对应地计算出 特征量wij

pij=2/(ui(j+1)-ui(j-1))=2/wij   (4)

此时,密度pi用下式赋值,

[数式3]

ρi=xi/E(ti)=(xi/Σi=1xiwij)×2---(5)

因而能够用下式(6)计算出终端数量m的估计值E(m)。

[数式4]

E(m)=(Σi=1nΣj=1xi(wij/2))/T=(Σi=1nΣj=1xiwij)/2T---(6)

如图4的示例所示,在观测期间内而且是终端ai滞留于扇区S的期间内,假设终 端ai发送信号qi1、qi2、qi3,在信号qi1的紧前面发送信号qi0,在信号qi3的紧后面发 送信号qi4,将信号qi0、qi1、qi2、qi3、qi4的发送时刻分别设为ui0、ui1、ui2、ui3、ui4, 上述思路相当于将终端ai在观测期间内在扇区S的滞留时间ti估计为从(ui0与ui1的 中点)到(ui3与ui4的中点)的期间。另外,虽然终端ai不在观测期间内,但是在滞 留于扇区S时发送信号qi4。另外,为了保持滞留时间ti的估计量的不偏倚性,在此 作为一例,说明进行不将滞留时间ti的结束时刻估计为与观测期间T的结束时刻相同 的处理。

[终端数量估计处理]

下面,说明本发明的终端数量估计方法的终端数量估计处理。在此,作为一例, 假设便携式终端的位置数据中所包含的位置信息被赋予了该便携式终端所处扇区的 扇区号。

如图5所示,首先位置数据取得部11从外部取得位置数据并保存在蓄积部12中 (图5的步骤S1)。由此,蓄积部12保存有关多个用户(便携式终端)多个时刻的 位置数据。另外,在执行步骤S1的处理之后,自步骤S2起的处理也可以间隔时间来 执行。即,也可以执行步骤S1作为自步骤S2起的处理的事前准备。

然后,观测期间取得部13取得包括观测开始时刻和观测结束时刻的组的观测期 间信息,并且观测区域取得部14取得与一个或多个位置信息相对应的观测区域信息 (步骤S2)。在此,取得观测开始时刻T1和观测结束时刻T2的组作为观测期间信息, 取得扇区号S作为观测区域信息。

然后,观测对象取得部15从蓄积部12取得包含观测开始时刻T1以后而且是观 测结束时刻T2以前的位置取得时刻信息、而且包含与观测区域信息即扇区号S相对 应的位置信息在内(例如位置信息是扇区号S)的一个或多个位置数据,作为观测对 象位置数据(步骤S3)。即,观测对象取得部15取得符合下面的条件的位置数据作 为观测对象位置数据。

条件1:位置取得时刻在观测开始时刻T1以后而且在观测结束时刻T2以前。即 包含在观测期间内。

条件2:位置信息是扇区S。

然后,针对所取得的各个观测对象位置数据执行下面的步骤S4、S5的处理。在 步骤S4,前后位置数据取得部16对于观测对象位置数据中作为求出特征量的对象的 位置数据(第1位置数据),取得包括与该第1位置数据相同的识别信息的位置数据 中、从位置取得时刻来看是该第1位置数据的紧前面的位置数据(第2位置数据)的 位置取得时刻信息以及是该第1位置数据的紧后面的位置数据(第3位置数据)的位 置取得时刻信息。另外,前后位置数据取得部16不是必须取得全部第2、第3位置 数据,只要取得第2、第3位置数据中所包含的位置取得时刻信息即可。

另外,在步骤S5,特征量计算部17计算有关第1位置数据的特征量。关于其处 理内容将使用图6进行说明。在此,将第1、第2、第3位置数据的位置取得时刻分 别设为t1、t2、t3。并且,将作为用于判定第2位置数据的位置取得时刻t2是异常值 的基准的预定的基准值(与第1、第2位置数据的位置取得时刻之差相关的基准值) 设为基准值A(例如1小时),将作为用于判定第3位置数据的位置取得时刻t3是异 常值的基准的预定的基准值(与第1、第3位置数据的位置取得时刻之差相关的基准 值)设为基准值B(例如1小时)。

特征量计算部17计算第1、第2位置数据的位置取得时刻之差(即时刻t1与t2 之差)Da、以及第1、第3位置数据的位置取得时刻之差(即时刻t1与t3之差)Db (图6的步骤S11)。并且,特征量计算部17判定第1、第2位置数据的位置取得时 刻之差Da是否大于预定的基准值A(例如1小时)(步骤S12),如果差Da大于基准 值A,则将从第1位置数据的位置取得时刻t1起向过去追溯预定的时间(例如1小 时)得到的时刻,作为第2位置数据的位置取得时刻t2(步骤S13)。然后,特征量 计算部17判定第1、第3位置数据的位置取得时刻之差Db是否大于预定的基准值B (例如1小时)(步骤S14),如果差Db大于基准值B,则将从第1位置数据的位置 取得时刻t1起向未来前进预定的时间(例如1小时)得到的时刻,作为第3位置数 据的位置取得时刻t3(步骤S15)。并且,特征量计算部17计算第2位置数据的位置 取得时刻t2与第3位置数据的位置取得时刻t3之差,作为有关第1位置数据的特征 量(步骤S16)。通过以上处理,结束有关某一个观测对象位置数据(第1位置数据) 的步骤S4、S5的处理。

以后,针对各个观测对象位置数据执行上述的步骤S4、S5的处理,在对所有观 测对象位置数据执行了处理之后(步骤S6为肯定判定),进入到步骤S7。

在步骤S7,终端数量估计部18按照前述的式(6)所示,将有关观测对象位置 数据的特征量wij的总和除以观测期间长度T的2倍,将相除得到的数值估计为终端 数量。另外,如根据式(6)可知,也可以是,终端数量估计部18将有关观测对象位 置数据的特征量wij分别除以2,求出(特征量wij/2)的总和,将所求出的总和除以 观测期间长度T,将相除得到的数值估计为终端数量。但是,如本实施方式这样将有 关观测对象位置数据的特征量wij的总和除以观测期间长度T的2倍的计算方法,能 够以极少的除法运算的次数完成处理,因而具有能够减轻处理负荷的优点。

另外,终端数量输出部19输出通过估计而得到的终端数量(步骤S8)。

根据以上的第1实施方式,在使用位置数据估计终端数量时,通过实施使用了前 后的位置数据的取得时刻信息的校正,能够对接收间隔的变动所产生的影响进行校 正,并且高精度地估计终端数量。

另外,在特征量的计算处理中,通过进行前述的第2、第3位置数据的位置取得 时刻是异常值时的处理,在由于便携式终端100位于服务区外或便携式终端100的电 源切断等,位置数据的取得时间间隔异常地长时,能够防止由于该异常长的取得时间 间隔而造成的影响过大。

[第2实施方式]

在上述的第1实施方式中说明了将用于计算特征量的对象的位置数据锁定为观 测对象位置数据的示例,而在下面的第2实施方式中说明将所取得的全部位置数据作 为对象来计算特征量的示例,即在实施终端数量估计之前预先计算有关所有位置数据 的特征量,使用其中有关观测对象位置数据的特征量来估计终端数量的示例。另外, 第2实施方式的通信系统的系统结构与图1所示的第1实施方式的系统结构相同,因 而省略其系统结构的说明。

如图7所示,第2实施方式的终端数量估计装置10具有与第1实施方式的终端 数量估计装置(图2)相同的构成要素,各个构成要素的功能基本相同,因而在此以 与第1实施方式的终端数量估计装置的不同之处为中心进行说明。

第2实施方式的观测对象取得部15取得包含有关待观测的观测期间的观测开始 时刻以后而且是观测结束时刻以前的位置取得时刻信息、而且包含与有关待观测的观 测区域的观测区域信息相对应的位置信息在内的一个或多个位置数据,作为观测对象 位置数据,然后向终端数量估计部18输出观测对象位置数据。

前后位置数据取得部16将由位置数据取得部11取得的所有位置数据分别作为第 1位置数据,并取得有关该第1位置数据的第2位置数据(紧前面的位置数据)以及 第3位置数据(紧后面的位置数据)各自的位置取得时刻信息。另外,上述由位置数 据取得部11取得的位置数据可以是在由位置数据取得部11取得后被蓄积在蓄积部 12中的位置数据,也可以是不蓄积在蓄积部12中而从位置数据取得部11发送给前 后位置数据取得部16的位置数据。

特征量计算单元17将由位置数据取得部11取得的所有位置数据分别作为第1位 置数据,计算有关该第1位置数据的特征量。由于其计算结果是庞大的量,因而如图 7所示,特征量计算部17具有用于保存计算结果的特征量的特征量保存部17A,优 选由特征量保存部17A保存计算结果的特征量。另外,特征量计算部17计算第2、 第3位置数据的位置取得时刻之差作为有关第1位置数据的特征量、以及进行如图6 所示的第2或者第3位置数据的位置取得时刻是异常值时的处理,这些与第1实施方 式相同。

终端数量估计部18从预先计算并保存在特征量保存部17A中的有关所有位置数 据的特征量中,提取从观测对象取得部15接收到的有关观测对象位置数据的特征量, 并根据有关该观测对象位置数据的特征量以及观测开始时刻与观测结束时刻之差(观 测期间长度),估计在观测期间中位于观测区域的终端数量。具体地讲,与第1实施 方式相同地,终端数量估计部18将有关观测对象位置数据的特征量的总和除以观测 期间长度的2倍,将相除得到的数值估计为终端数量。

下面,说明第2实施方式的终端数量估计处理。在此,假设便携式终端的位置数 据中所包含的位置信息被赋予了该便携式终端所在扇区的扇区号。

如图8所示,首先位置数据取得部11从外部取得位置数据并保存在蓄积部12中 (图8的步骤S21)。但是,位置数据向蓄积部12的保存不是必须的,也可以直接从 位置数据取得部11向前后位置数据取得部16转发位置数据,并执行后述的步骤S22 的处理。并且,自步骤S22起的处理也可以在执行步骤S21的处理之后隔开时间间隔 来执行。

然后,针对所取得的所有位置数据分别执行下面的步骤S22~S24的处理。在步 骤S22,前后位置数据取得部16对于作为求出特征量的对象的一个位置数据(第1 位置数据),取得包括与该第1位置数据相同的识别信息的位置数据中、从位置取得 时刻来看是该第1位置数据的紧前面的位置数据(第2位置数据)的位置取得时刻信 息以及是该第1位置数据的紧后面的位置数据(第3位置数据)的位置取得时刻信息。 另外,前后位置数据取得部16不是必须取得全部第2、第3位置数据,只要取得第2、 第3位置数据中所包含的位置取得时刻信息即可。另外,在步骤S23,特征量计算部 17按照与第1实施方式相同的图6所示的步骤,计算有关第1位置数据的特征量。 步骤S23的处理与前述第1实施方式的步骤S5的处理相同,因而省略说明。然后, 在步骤S23得到的特征量被保存在特征量保存部17A中(步骤S24)。

通过以上处理,完成有关某一个观测对象位置数据(第1位置数据)的步骤S22~ S24的处理。

以后,针对所有位置数据分别执行步骤S22~S24的处理。并且,在对所有位置 数据完成步骤S22~S24的处理后(步骤S25为肯定判定),计算有关所有位置数据 的特征量并保存在特征量保存部17A中。这样,能够在实施终端数量估计之前预先 计算有关所有位置数据的特征量并进行保存。

在后面的步骤S26,观测期间取得部13取得包括观测开始时刻和观测结束时刻 的组的观测期间信息,并且观测区域取得部14取得与一个或多个位置信息相对应的 观测区域信息。在此,取得观测开始时刻T1和观测结束时刻T2的组作为观测期间 信息,取得扇区号S作为观测区域信息。

然后,观测对象取得部15从蓄积部12取得包括观测开始时刻T1以后而且是观 测结束时刻T2以前的位置取得时刻信息、而且包括与观测区域信息即扇区号S相对 应的位置信息在内(例如位置信息是扇区号S)的一个或多个位置数据,作为观测对 象位置数据(步骤S27)。即,观测对象取得部15取得符合下面的条件的位置数据作 为观测对象位置数据。

条件1:位置取得时刻在观测开始时刻T1以后而且在观测结束时刻T2以前。即 包含在观测期间内。

条件2:位置信息是扇区S。

然后,观测对象位置数据的取得也可以按照下面所述来进行。即,特征量计算部 17将通过计算得到的特征量与计算对象的位置数据(上述第1位置数据)相关联, 并将关联起来的带特征量的位置数据保存在特征量保存部17A中。另外,也可以是, 终端数量估计部18经由观测对象取得部15取得观测期间信息和观测区域信息,从特 征量保存部17读出符合观测期间及观测区域的条件的带特征量的位置数据,并作为 观测对象位置数据进行取得。

返回到图8,在后面的步骤S28中,终端数量估计部18按照前述的式(6)所示, 将有关观测对象位置数据的特征量wij的总和除以观测期间长度T的2倍,将相除得 到的数值估计为终端数量。另外,如根据式(6)可知,也可以是,终端数量估计部 18将有关观测对象位置数据的特征量wij分别除以2,求出(特征量wij/2)的总和, 将所求出的总和除以观测期间长度T,将相除得到的数值估计为终端数量。但是,如 本实施方式这样将有关观测对象位置数据的特征量wij的总和除以观测期间长度T的 2倍的计算方法,能够以极少的除法运算的次数完成处理,因而具有能够减轻处理负 荷的优点。

另外,终端数量输出部19输出通过估计而得到的终端数量(步骤S29)。

根据以上的第2实施方式,与第1实施方式相同地,在使用位置数据估计终端数 量时,通过实施使用了前后的位置数据的取得时刻信息的校正,能够对接收间隔的变 动所产生的影响进行校正,并且高精度地估计终端数量。

尤其是在第2实施方式中,在实施终端数量估计之前预先计算有关所有位置数据 的特征量并进行保存,因而具有如下优点:能够缩短从终端数量估计装置取得观测期 间信息及观测区域信息并开始终端数量的估计处理、到得到估计结果的终端数量的时 间。

另外,在图8的处理中,不是必须在步骤S25之后执行步骤S26~S27的处理, 也可以是同时并行地执行步骤S22~S25的处理和步骤S26~S27的处理。

[第3实施方式]

在第3实施方式中说明有关终端数量估计的第2方法以及基于该方法的特征量的 计算处理。第3实施方式的通信系统及终端数量估计装置的结构与第1、第2实施方 式相同,因而省略说明。

图9是表示有关终端数量估计的第2思路的图。在该图9中,qij表示由终端ai生成的位置数据,其中qi1、qi2、qi3表示在观测期间内由处于扇区S的终端ai生成的 位置数据。其中,假设qi1包含由于终端ai跨越位置登记区域(Location Area)边界 而生成的位置登记信息(下面称为“LA跨越位置登记信息”),下面称为“LA跨越位置 登记信息qi1”。在这种情况下下述的思路成立,即由于能够判定终端ai在生成了LA 跨越位置登记信息qi1的定时进入到扇区S,因而将有关LA跨越位置登记信息qi1的 特征量wi1作为LA跨越位置登记信息qi1的生成时刻与紧后面的位置数据qi2的生成 时刻之差分,而不是如前述第1、第2实施方式那样的紧前面的位置数据qi0的生成 时刻与紧后面的位置数据qi2的生成时刻之差分。

基于这种思路,终端ai在观测期间内处于扇区S的在服务区期间ti是图9中用粗 线示出的期间,相比第1、第2实施方式的在服务区期间(图9中用虚线示出的期间) 缩短了(LA跨越位置登记信息qi1的生成时刻与紧前面的位置数据qi0的生成时刻之 差分的二分之一)。

并且,如图28所示,假设位置数据qi4包含LA跨越位置登记信息,下面称为“LA 跨越位置登记信息qi4”。在这种情况下,能够判定终端ai在生成了LA跨越位置登记 信息qi4的定时从扇区S退出。因此,在计算有关LA跨越位置登记信息qi4的紧前面 的位置数据qi3的特征量wi3时,有关位置数据qi3的特征量wi3延长了(位置数据qi3的生成时刻与紧后面的LA跨越位置登记信息qi4的生成时刻之差分的二分之一)。即, 终端ai在观测期间内位于扇区S服务区的在服务区期间ti是图28中用粗线示出的期 间,相比第1、第2实施方式的在服务区期间(图28中用虚线示出的期间)延长了 (位置数据qi3的生成时刻与紧后面的LA跨越位置登记信息qi4的生成时刻之差分的 二分之一)。

关于如上所述的基于终端数量估计的第2思路的特征量的计算处理,使用图10 进行说明。下面,将计算特征量的对象的位置数据称为“计算对象位置数据”。

如图10所示,特征量计算部17首先根据例如计算对象位置数据中所包含的呼叫 类别信息,判定计算对象位置数据是否包含LA跨越位置登记信息(步骤S31)。其 中,在计算对象位置数据包含LA跨越位置登记信息的情况下,将计算对象位置数据 的位置取得时刻设定为用于计算特征量的第1变量s(下面称为“变量s”)(步骤S32), 在计算对象位置数据不包含LA跨越位置登记信息的情况下,将计算对象位置数据的 位置取得时刻与紧前面的位置数据的位置取得时刻的中点时刻设定为变量s(步骤 S33)。

然后,特征量计算部17根据例如紧后面的位置数据中所包含的呼叫类别信息, 判定紧后面的位置数据是否包括LA跨越位置登记信息(步骤S34)。其中,在紧后 面的位置数据包括LA跨越位置登记信息的情况下,设定紧后面的位置数据的位置取 得时刻为用于计算特征量的第2变量e(下面称为“变量e”)(步骤S35),在紧后面的 位置数据不包括LA跨越位置登记信息的情况下,设定计算对象位置数据的位置取得 时刻与紧后面的位置数据的位置取得时刻的中点时刻为变量e(步骤S36)。另外,不 是必须根据呼叫类别信息进行上述的步骤S31、S34的判定处理,也可以根据其它信 息来进行。例如,也可以预先保存表示位置登记区域的范围的区域信息,根据计算对 象位置数据及紧后面的位置数据的位置信息和区域信息来进行判定处理。

然后,特征量计算部17进行图11所示的变量s、e的调整处理(步骤S37)。其 中,将计算对象位置数据的位置取得时刻设为t1,将作为用于判定变量s是异常值的 基准的预定的基准值设为基准值C(例如0.5小时),将作为用于判定变量e是异常值 的基准的预定的基准值设为基准值D(例如0.5小时)。

特征量计算部17计算变量s与时刻t1之差Dc以及变量e与时刻t1之差Dd(图 11的步骤S41)。并且,特征量计算部17判定变量s与时刻t1之差Dc是否大于预定 的基准值C(例如0.5小时)(步骤S42),如果差Dc大于基准值C,则对变量s设定 从时刻t1起向过去追溯预定的时间(例如0.5小时)得到的时刻(步骤S43)。然后, 特征量计算部17判定变量e与时刻t1之差Dd是否大于预定的基准值D(例如0.5 小时)(步骤S44),如果差Dd大于基准值D,则对变量e设定从时刻t1起向未来前 进预定的时间(例如0.5小时)得到的时刻(步骤S45)。这样通过进行变量s、e的 调整处理,在位置数据的取得时间间隔由于便携式终端100位于服务区外或便携式终 端100的电源被切断等而变得异常地长时,能够防止由于该异常长的取得时间间隔而 造成的影响过大。

然后返回到图10,特征量计算部17计算将(变量e-变量s)乘以2倍的值,并 作为有关计算对象位置数据的特征量(步骤S38)。通过以上处理,能够得到有关计 算对象位置数据的特征量。

根据以上所述的第3实施方式,在计算对象位置数据及其紧后面的位置数据中至 少一方是LA跨越位置登记信息的情况下,通过考虑在生成该LA跨越位置登记信息 的定时发生了向扇区S的流入或者从扇区S流出,能够得到高精度的特征量。

另外,在第3实施方式中说明的特征量的计算方法,也能够应用于如第1实施方 式那样锁定为观测对象位置数据来计算特征量并估计终端数量的情况,以及如第2 实施方式那样预先计算有关所有位置数据的特征量,并使用其中有关观测对象位置数 据的特征量来估计终端数量的情况。

[第4实施方式]

在下面的第4、第5实施方式中,对使用用于将通过估计得到的终端数量变换为 人口的系数(下面称为“放大系数”)来估计人口的示例进行说明。其中,在第4实施 方式中说明将特征量乘以放大系数,并使用该相乘结果的累计值求出人口的实施方 式,在第5实施方式中说明按照每人口估计单位(例如每种属性或每个时间段)来累 计特征量,将对应于人口估计单位的放大系数与该累计值相乘,使用该相乘结果求出 人口的实施方式。

在自第4实施方式起的实施方式中,以预先计算有关所有位置数据的特征量,并 使用其中有关观测对象位置数据的特征量来估计人口或终端数量的处理为基础进行 说明。但是,也能够应用于锁定为观测对象位置数据来计算特征量并估计人口或终端 数量的处理。

如图12所示,第4实施方式的终端数量估计装置10的功能块结构在以下方面与 第2实施方式的终端数量估计装置的功能块结构(图7)不同,因而对该不同之处进 行说明。终端数量估计装置10具有根据特征量估计人口的人口估计部21来取代终端 数量估计部18,并且具有输出人口估计部21的估计值的人口输出部22来取代终端 数量输出部19。但是,权利要求书中的“终端数量估计单元”对应于终端数量估计部 18及人口估计部21,“输出单元”对应于终端数量输出部19及人口输出部22。

另外,终端数量估计装置10具有属性/放大系数存储部23(放大系数存储单元), 其存储了每个便携式终端用户的属性信息及预先求出的每种属性的放大系数。特征量 计算部17以位置数据的用户识别信息(例如已散列的电话号码)为密钥,从属性/ 放大系数存储部23读出用户的属性信息及与该属性信息相关的放大系数,使计算出 的特征量和读出的属性信息及放大系数与位置数据相关联,将关联后的位置数据保存 在特征量保存部17A中。

下面,使用图13说明第4实施方式的终端数量估计装置10的处理。图13所示 的第4实施方式的处理在以下方面与第2实施方式的处理(图8)不同,因而对该不 同之处进行说明。

如图13所示,当在步骤S23进行特征量的计算处理之后,在步骤S24A,特征量 计算部17以位置数据的用户识别信息(例如已散列的电话号码)为密钥,从属性/ 放大系数存储部23读出用户的属性信息及与该属性信息相关的放大系数,使计算出 的特征量和读出的属性信息及放大系数与位置数据相关联,将关联后的位置数据保存 在特征量保存部17A中。通过对所有位置数据依次执行图13的步骤S22~S24A的处 理,将关联了各自的特征量、属性信息及放大系数的位置数据保存在特征量保存部 17A中。

然后,当在步骤S26取得观测期间信息和观测区域信息后,在步骤S27,人口估 计部21经由观测对象取得部15接收观测期间信息和观测区域信息,并从特征量保存 部17A取得符合观测期间信息和观测区域信息的条件的位置数据(即观测对象位置 数据)。并且,在步骤S28A,人口估计部21对于各个观测对象位置数据将特征量和 放大系数相乘,将得到的相乘结果的总和除以(观测长度×2),将相除得到的值估计 为在观测期间中位于观测区域内的人口。并且,人口估计部21根据与各个观测对象 位置数据相关联的属性信息和各个观测对象位置数据中所包含的取得时刻信息,将有 关各个观测对象位置数据的上述相乘结果按照每种属性进行累计,将其累计值除以 (观测长度×2),将相除得到的值估计为每种属性的人口。另外,在此叙述了按照每 种属性估计人口的示例,但是估计人口的单位不限于属性,也可以采用场所或时间段 等。下面,将这些估计单位(属性、场所、时间段等)称为“人口估计单位”。

另外,在后面的步骤S29,人口输出部22输出通过步骤S28A的估计而得到的、 在观测期间中位于观测区域内的人口及按照每人口估计单位的人口。在此,例如输出 如图16所示的针对观测区域估计出的人口(在图16中表述为“估计人口”)、或按照 性别/年龄段/住所等每种属性的人口。并且,也可以采用将多种属性进行组合的条件 (例如,将性别和住所进行组合的条件“居住在东京都的女性”)。另外,此处的输出 包括显示输出、语音输出、打印输出等各种输出形式。

根据以上所述的第4实施方式,能够得到在观测期间中位于观测区域内的人口及 按照每人口估计单位(例如属性或时间段)的人口。

另外,在上述的步骤S28A、S29,叙述了估计观测期间中的观测区域内的人口和 按照每人口估计单位的人口两者并进行输出的示例,然而不是必须对这两者进行估计 并输出,也可以只对一方进行估计并输出。

并且,在第4实施方式中说明了预先求出放大系数的示例,放大系数也可以按照 下面所述来取得。作为一例,放大系数能够采用在服务区率与终端的普及率之积(即, 在服务区数量与人口的比率)的倒数。其中,“在服务区率”是指在服务区数量与签约 台数的比率,“普及率”是指签约台数与人口的比率。优选按照上述的每种放大系数计 算单位来导出这种放大系数,但不是必须的。另外,也可以是,例如按照下面所述使 用根据特征量及观测期间长度而估计出的终端数量(在服务区数量)来导出放大系数。 利用在第1~第3实施方式中叙述的方法从位置数据求出特征量,根据特征量及观测 期间长度来累计每种放大系数计算单位的终端数量,由此得到用户数量金字塔数据, 并且取得预先求出的相同的放大系数计算单位中的人口金字塔数据作为统计数据(例 如居民基本登记册等)。并且,在用户数量金字塔数据和人口金字塔数据中计算每种 放大系数计算单位的位置数据的取得率(即在服务区数量/人口)。在此得到的“位置 数据的取得率(即在服务区数量/人口)”相当于前述的“在服务区率与终端的普及率 之积”。能够导出这样得到的“位置数据的取得率”的倒数作为放大系数。另外,关于 计算放大系数的放大系数计算单位,作为一例,也可以采用住所的都道府县、间隔5 岁或10岁的年龄段、男女单位、作为时间段的1小时等,还可以采用将其中两种以 上单位进行组合的单位。例如,在将放大系数计算单位设为“居住在东京都的二十几 岁的男性”的情况下,通过提取日本全国的与居住在东京都的(即,用户属性中的住 所信息是东京都)二十几岁的男性对应的位置数据并累计终端数量,能够得到用户数 量金字塔数据,并且从统计数据中取得与居住在东京都的二十几岁的男性相关的人口 金字塔数据。另外,在得到上述用户数量金字塔数据时,关于条件“居住在东京都”, 不是仅提取处于东京都服务区的用户的位置数据,而是提取用户属性中的住所信息是 东京都的位置数据。并且,根据用户数量金字塔数据和人口金字塔数据计算放大系数 计算单位(此处指居住在东京都的二十几岁的男性)的位置数据的取得率(即,在服 务区数量/人口),并导出所得到的“位置数据的取得率”的倒数作为放大系数。另外, 在本申请中,将放大系数计算单位和人口估计单位作为相同单位进行说明,但这毕竟 仅是一例,并不限于此。

另外,在第4实施方式中说明了以第2实施方式为基础来求出人口的处理,然而 第4实施方式也能够应用于前述的第1、第3实施方式。

[第5实施方式]

在第5实施方式中说明这样的实施方式,即按照每人口估计单位(例如每种属性 或每个时间段)来累计特征量,将对应于人口估计单位的放大系数与该累计值相乘, 由此求出人口。

如图14所示,第5实施方式的终端数量估计装置10的功能块结构与前述第4 实施方式的终端数量估计装置(图12)的功能块结构相似,但是与第4实施方式的 不同之处在于,关于放大系数,不是由特征量计算部17,而是由人口估计部21从属 性/放大系数存储部23读出,并进行使用了放大系数的人口的估计。即,特征量计算 部17及人口估计部21的处理与第4实施方式不同,因而使用图15对该不同之处进 行说明。

如图15所示,当在步骤S23中进行特征量的计算处理之后,在步骤S24B,特征 量计算部17以用户识别信息(例如已散列的电话号码)为密钥,根据位置数据确定 该位置数据的用户的属性信息,从属性/放大系数存储部23读出该属性信息,使计算 出的特征量和读出的属性信息与位置数据相关联,将关联后的位置数据保存在特征量 保存部17A中。通过对所有位置数据依次执行图15的步骤S22~S24B的处理,将关 联了各自的特征量及属性信息的位置数据保存在特征量保存部17A中。

然后,当在步骤S26取得观测期间信息和观测区域信息后,在步骤S27,人口估 计部21从特征量保存部17A取得与观测期间信息和观测区域信息的条件相符的位置 数据(即观测对象位置数据)。并且,在步骤S28B,人口估计部21按照下面所述进 行使用了放大系数的人口的估计。

首先,人口估计部21确定所取得的观测对象位置数据中符合某种人口估计单位 (属性或时间段)的条件的观测对象位置数据,对确定出的观测对象位置数据累计特 征量(步骤S51),从属性/放大系数存储部23读出有关该人口估计单位的放大系数, 将该放大系数和特征量累计值相乘,将相乘结果(放大系数×特征量累计值)除以(观 测期间长度×2),将相除得到的值估计为该人口估计单位的人口(步骤S52)。并且, 针对各种人口估计单位执行上述步骤S51~S52,在对所有人口估计单位执行完成后, 进入到步骤S54。在该时刻,作为估计结果能够得到有关每人口估计单位的人口。另 外,将有关每人口估计单位的人口进行总和,将该总和估计为在观测期间中位于观测 区域内的人口(步骤S54)。

通过以上的步骤S28B,能够得到在观测期间中位于观测区域内的人口以及每人 口估计单位的人口。并且,在后面的步骤S29,人口输出部22输出通过步骤S28A的 估计而得到的、在观测期间中位于观测区域内的人口及按照每人口估计单位的人口。

根据以上所述的第5实施方式,例如能够得到如图16所示的针对观测区域而估 计出的人口(在图16中表述为“估计人口”)、和按照属性或时间段等每人口估计单位 的人口。

与第4实施方式相同地,在步骤S28A、S29叙述了估计观测期间中的观测区域 内的人口和每人口估计单位的人口两者并进行输出的示例,然而不是必须对这两者进 行估计并输出,也可以只对一方进行估计并输出。并且,在第5实施方式中说明了以 第2实施方式为基础来求出人口的处理,然而第5实施方式也能够应用于前述的第1、 第3实施方式。

[第6实施方式]

在下面的第6、第7实施方式中,对将作为累计单位的每个区域的估计值(人口 或终端数量)变换为每种输出单位(在此作为一例是网格(mesh))的估计值的示例 进行说明。其中,在第6实施方式中说明利用单个频带的室外站的通信区域所在的环 境中的处理,在第7实施方式中说明室内站的通信区域以及利用电波到达范围不同的 频带的多个室外站的通信区域中两个以上的通信区域在地理上重复地存在的环境中 的处理。另外,在输出单位和累计单位相同的情况下,不需要在下面的第6、第7实 施方式中叙述的变换处理。

在第6实施方式中说明对第4实施方式的估计人口的终端数量估计装置增加了向 上述每种网格的估计值进行变换的功能的终端数量估计装置及其处理。

如图17所示,第6实施方式的终端数量估计装置10的功能块结构构成为在第4 实施方式的终端数量估计装置(图12)中,在人口估计部21与人口输出部22之间 增加了变换部24(变换单元)。变换部24通过后述的处理,将通过人口估计部21的 估计而得到的每个区域的人口变换为每个网格的人口。

下面,根据图18具体说明变换部24的处理。图18(a)是表示区域的区域范围 的图,图18(b)是表示网格的图,图18(c)是将区域和网格合成的合成图。

变换部24将根据预先存储的区域边界信息而再现的区域图(参照图18(a))、 和根据预定的区划规则而再现的二维网格(参照图18(b))进行合成,得到如图18 (c)所示的合成图。然后,变换部24在上述合成图中根据网格边界将各个区域进行 分割。例如,如图19所示,图18(a)的区域A根据网格边界被分割为4个分割区 域A-1、A-2、A-3、A-4。并且,变换部24计算各个分割区域的面积,并计算 各个分割区域的面积比。例如,如图19所示,假设计算出分割区域A-1、A-2、A -3、A-4的面积分别是10m2、50m2、100m2、40m2,并计算出分割区域A-1、A -2、A-3、A-4的面积比(例如百分比)分别是5%、25%、50%、20%。

另外,变换部24不是必须计算各个分割区域的面积比。例如,也可以构成为, 预先求出各个分割区域的面积比,变换部24能够从终端数量估计装置10内的未图示 的表或者外部参照各个分割区域的面积比的信息。

然后,变换部24计算各个分割区域的人口。例如,假设图18(a)中的区域A 的人口是800人,如图18所示计算出分割区域A-2的人口为200人(即800人×25 %)。同样,假设区域B、C的人口分别是500人、750人,计算出区域B的面积比 80%的分割区域B-1的人口是400人(即500人×80%),计算出区域C的面积比 80%的分割区域C-4的人口是600人(即750人×80%)。

另外,变换部24计算一个网格中所包含的多个分割区域的人口的总和,由此计 算该网格的人口。在图20的示例中,计算出一个网格中所包含的分割区域A-2、B -1、C-4的人口的总和是1200人(即200人+400人+600人),将该1200人作为 该网格的人口。

如上所述,能够在利用单个频带的室外站的通信区域所在的环境中,将每累计单 位的人口变换为每输出单位的人口。

另外,在第6实施方式中说明了以第4实施方式为基础,将每累计单位的人口变 换为每输出单位的人口的处理,然而第6实施方式也能够适用于前述的第5实施方式。 并且,在第6实施方式中叙述的变换处理也能够应用于将每累计单位的终端数量变换 为每输出单位的终端数量的情况,通过应用于前述的第1~第3实施方式,能够将每 累计单位的终端数量变换为每输出单位的终端数量。

[第7实施方式]

在第7实施方式中说明这样的示例,在室内站的通信区域以及利用电波到达范围 不同的频带的多个室外站的通信区域中两个以上的通信区域在地理上重复存在的环 境中,将作为累计单位的每个区域(扇区)的估计值(终端数量或者人口)变换为每 输出单位(在此作为一例是指网格)的估计值。

第7实施方式的终端数量估计装置的功能块结构与第6实施方式相同,但是变换 部24的处理不同,因而根据图21、图22来说明变换部24的处理。

如图21所示,在室内站的通信区域以及利用电波到达范围不同的频带(室外 2GHz/1.7GHz和室外800MHz)的多个室外站的通信区域中两个以上的通信区域在地 理上重复存在的环境中,变换部24针对各个通信区域进行在第6实施方式中叙述的 变换处理,由此求出有关各个通信区域的每输出单位(网格)的人口,最后按照每输 出单位将有关各个通信区域的人口进行合计,由此得到每输出单位的人口。

在图21的示例中,变换部24首先对利用室外2GHz/1.7GHz的室外站的通信区 域、利用室外800MHz的室外站的通信区域、室内站的通信区域,分别进行在第6 实施方式中叙述的变换处理。例如,在利用室外2GHz/1.7GHz的室外站的通信区域 中,假设输出单位Q与区域A重合的分割区域占区域A整体的面积比是40%,通过 将区域A的估计人口100人乘以面积比0.4,能够得到输出单位Q与区域A重合的 分割区域的估计人口是40人。同样,能够得到输出单位Q与区域B重合的分割区域 的估计人口是3人(区域B的估计人口30人×面积比0.1)、以及输出单位Q与区域 C重合的分割区域的估计人口是5人(区域C的估计人口100人×面积比0.05)。同 样,对于利用室外800MHz的室外站的通信区域,能够得到输出单位Q与区域D重 合的分割区域的估计人口是3人(区域D的估计人口10人×面积比0.3)、以及输出 单位Q与区域F重合的分割区域的估计人口是9人(区域F的估计人口30人×面积 比0.3)。另一方面,关于室内站,各个室内站的电波到达范围的区域非常小,在图 21的示例中,一个室内站的区域L整体与输出单位Q重合,因而能够认为面积比是 100%。因此,通过向区域L的估计人口10乘以面积比1.0,能够得到输出单位Q与 区域L重合的区域(在该示例中是区域L整体)的估计人口是10人。

最后,变换部24将如上所述得到的输出单位Q与各个区域重合的区域的估计人 口进行合计,得到输出单位Q的估计人口是70人。通过以上所述的处理,能够从每 累计单位的人口变换为输出单位Q的累计人口。

图21表示向一个输出单位Q的估计人口的变换,但是通过对其它的输出单位执 行相同的处理,能够进行向作为对象的所有输出单位的估计人口的变换。

图22表示用于进行向作为对象的n个输出单位的估计人口的变换的矩阵。即, 图22中的式子的右边的

[数式5]

Popb

(j表示1以上m以下的整数(m表示与作为对象的n个输出单位中任意一个输出单 位重合的累计单位的数量))表示通过估计而求出的每累计单位的人口(估计人口), 左边的

[数式6]

Popai

(i表示1以上n以下的整数)表示每输出单位的人口,右边的矩阵中的

[数式7]

kbiai

表示用于从累计单位bj的人口变换为输出单位ai的人口的变换系数。其中的变换系 数相当于前述的分割区域在原来的区域整体中所占的面积比。

图22中的各个变换系数能够根据估计单位(例如区域)与输出单位(例如网格) 的位置关系而预先求出,通过预先求出各个变换系数并存储图22的式子,能够使用 图22的式子容易且快速地从通过估计而求出的每累计单位的人口(估计人口)变换 为每输出单位的人口。

通过以上所述的处理,即使是在室内站的通信区域以及利用电波到达范围不同的 频带的多个室外站的通信区域中两个以上的通信区域在地理上重复存在的环境中,也 能够将每累计单位的人口变换为每输出单位的人口。

另外,在第6、第7实施方式中说明了将预先通过估计而得到的每累计单位的人 口变换为每输出单位的人口的示例,但也可以考虑以下的变形例。

将特征量和放大系数、以及与该位置数据所属的区域(累计单位)在地理上重合 的多个输出单位分别相关的输出单位ID及与该输出单位的重合部分的面积比(即, 重合部分在累计单位整体中所占的面积比)的一个以上的组合,与位置数据相关联地 保存在特征量保存部17A中。

在此,也可以是,对于与相同的输出单位ID相关联的位置数据计算(特征量× 面积比),将所得到的(特征量×面积比)按照每输出单位进行累计,将每输出单位的 累计值除以(观测期间长度×2),由此估计每输出单位的终端数量。

并且,也可以是,对于与相同的输出单位ID相关联的位置数据计算(特征量× 面积比×放大系数),将所得到的(特征量×面积比×放大系数)按照每输出单位进行 累计,将每输出单位的累计值除以(观测期间长度×2),由此估计每输出单位的人口。 此时,将每输出单位的(特征量×面积比×放大系数)按照每人口估计单位(例如属 性或时间段等)进行累计,将所得到的每输出单位及每人口估计单位的累计值除以(观 测期间长度×2),由此估计每输出单位及每人口估计单位的人口。

并且,也可以是,对于与相同的输出单位ID相关联的位置数据,按照每人口估 计单位(例如属性或时间段等)计算(特征量×面积比),将所得到的每人口估计单位 的(特征量×面积比)按照每输出单位进行累计,将所得到的每输出单位及每人口估 计单位的(特征量×面积比)的累计值与有关该人口估计单位的放大系数相乘,将所 得到的相乘结果除以(观测期间长度×2),由此估计每输出单位及每人口估计单位的 人口。但是,在这种情况下,不是必须将放大系数与位置数据相关联,在上述的乘法 运算时,有关各个人口估计单位的放大系数也可以使用例如与位置数据不同的预先存 储的放大系数或者从外部取得的放大系数。通过上述的处理,如果能够得到每输出单 位及每人口估计单位的人口,通过按照每输出单位将每输出单位及每人口估计单位的 人口进行合计,也可以估计每输出单位的人口。

并且,如前面所述,不是必须按照人口估计单位来求出放大系数,例如也可以不 使用全体共用的放大系数等每人口估计单位的放大系数。在这种情况下,作为一例, 也可以是,将有关作为对象的所有位置数据的(特征量×面积比)进行累计,向所得 到的累计值乘以共同的放大系数,将相乘结果除以(观测期间长度×2),由此估计人 口。

另外,在上述的各种变形例中使用的特征量可以利用前述的第1~第3实施方式 的任意一种方法计算出。

另外,在第7实施方式中说明了以第4实施方式为基础将每累计单位的人口变换 为每输出单位的人口的处理,但是第7实施方式也能够适用于前述的第5实施方式。 并且,在第7实施方式中叙述的变换处理也能够应用于将每累计单位的终端数量变换 为每输出单位的终端数量的情况,通过应用于前述的第1~第3实施方式,能够将每 累计单位的终端数量变换为每输出单位的终端数量。

[第8实施方式]

在第8实施方式中说明进行非识别化处理的实施方式,该非识别化处理用于从位 置数据或属性信息中去除具有个人识别性质的信息。

如图23所示,第8实施方式的终端数量估计装置10的功能块结构构成为,在第 4实施方式的终端数量估计装置的功能块结构(图12中),在位置数据取得部11与 蓄积部12之间增加了进行非识别化处理的非识别化部25(非识别化单元)。

非识别化部25针对位置信息中所包含的识别信息(例如电话号码),进行包含如 下变换的非识别化处理,该变换是向基于单向性函数的不可逆编码的变换。此处采用 单向性函数是为了防止根据变换后的信息进行复原,关于单向性函数例如可以采用如 图24所示的、由国内外的评价项目或评价机构推荐的基于散列函数(Hash Function) 的带密钥散列函数。

并且,如图24所示,在进行采用便携式终端的用户的属性信息的处理的情况下, 非识别化部25在进行该处理之前,针对属性信息中能够确定个人的号码(例如电话 号码),进行包含向基于单向性函数的不可逆编码的变换的非识别化处理。另外,也 可以是,非识别化部25删除属性信息中的姓名信息,将出生年月日信息置换为年龄 信息,将住所信息置换为删除了门牌号信息的街道号级别的住所信息。

通过以上所述的非识别化部25的非识别化处理,能够从位置数据或属性信息中 去除具有个人识别性质的信息,因而能够防止从位置数据或属性信息识别出个人。

另外,在第8实施方式中说明了以第4实施方式为基础的非识别化处理,但是第 8实施方式也能够应用于前述的第5实施方式。并且,在第8实施方式中叙述的非识 别化处理不仅能够应用于人口估计,而且也能够应用于在第1~第3实施方式中说明 的终端数量估计。并且,在第8实施方式中叙述的非识别化处理也能够应用于进行在 第6、第7实施方式中说明的变换处理的情况。

[第9实施方式]

在第9实施方式中说明这样的实施方式,即在输出某个估计值(终端数量或人口 等)之前,根据预先设定的基准对估计值进行隐匿处理。

如图25所示,第9实施方式的终端数量估计装置10的功能块结构构成为,在第 8实施方式的终端数量估计装置的功能块结构(图23中),在人口估计部21与人口 输出部22之间增加了进行隐匿处理的隐匿处理部26(隐匿处理单元)。

隐匿处理部26在从人口估计部21接收到估计值(估计人口等)时,进行例如图 26所示的隐匿处理。即,隐匿处理部26判定取得源终端数量是否小于用于判定为需 要隐匿处理的预先设定的基准值(作为一例是10)(图26的步骤S61),所述取得源 终端数量表示作为估计的基础的每个区域(小区)的位置数据是从哪台终端取得的。 另外,取得源终端数量表示去除了有关同一终端的重复的唯一的终端数量。在进行此 处的判定时需要每个区域(小区)的位置数据的取得源终端数量,但作为一例也可以 是,人口估计部21在累计与位置数据相对应的特征量时,计数该位置数据中的识别 信息(例如,前述的非识别化部25的非识别化处理之后的已散列的电话号码)的数 量,将所得到的已散列的电话号码总数的信息转发给隐匿处理部26,隐匿处理部26 将已散列的电话号码总数用作每个区域(小区)的位置数据的取得源终端数量。

在步骤S61,如果作为估计的基础的每个区域(小区)的位置数据的取得源终端 数量小于基准值,则隐匿处理部26将有关该区域(小区)的估计值设为零,由此将 该估计值隐匿化(步骤S62)。另外,此处的隐匿方法不限于将估计值设为零,也可 以采用利用预定的文字或记号(例如“×”等)表示估计值的方法等其它方法。

另一方面,在步骤S61,如果作为估计的基础的每个区域(小区)的位置数据的 取得源终端数量为基准值以上,隐匿处理部26针对有关该区域(小区)的估计值, 进行如下所述的在输出估计值时使用的级幅的概率圆整(步骤S63)。即,将有关该 区域(小区)的估计值设为x,将级幅设为k,在kn≦x<k(n+1)(n为整数)的情 况下,隐匿处理部26用概率(x-kn)/k将该估计值x圆整为k(n+1),用概率(k (n+1)-x)/k将该估计值x圆整为kn。

例如,在估计值x为23、级幅k为10的情况下,由于k×2≦x<k(2+1),因而 n=2,用概率0.3(30%的概率)将估计值[23]圆整为[30],用概率0.7(70%的概率) 将估计值[23]圆整为[20]。

通过以上所述的隐匿处理部26进行的隐匿处理,能够防止根据估计结果来确定 个人,提高估计结果的有用性。并且,能够防止利用其它的值估计出被隐匿化的值的 问题。

另外,关于概率圆整中的级幅,也可以从在累计中使用的位置数据中提取放大系 数最大的放大系数,将把该放大系数设为预定倍(例如10倍)后得到的值设定为级 幅。并且,还可以预先确定级幅来实施概率圆整。此时,也可以采用将包括放大系数 超过预先设定的级幅的预定比率(例如1/10)的位置数据在内的区域(小区)的数据 舍去的处理规则。

并且,隐匿处理部26的隐匿处理不限于图26所示的处理,也可以采用其它处理。 例如,在图26的步骤S61,也可以取代“作为估计的基础的每个区域(小区)的位置 数据的取得源终端数量”,而判定“作为估计的基础的每个区域(小区)的位置数据的 个数”是否小于基准值,还可以判定“所输出的估计值(人口或者终端数量)”是否小 于基准值。并且,当在图26的步骤S61判定为否定的情况下,也可以省略步骤S63 的处理。

另外,在第9实施方式中以第8实施方式(进行非识别化处理的方式)为基础说 明了隐匿处理,但也能够应用于不进行如第8实施方式所示的非识别化处理的情况。 并且,第9实施方式也能够适用于在第4、第5实施方式中叙述的人口估计,还能够 应用于在第1~第3实施方式中叙述的终端数量估计。并且,第9实施方式也能够应 用于进行在第6、第7实施方式中叙述的变换处理的情况。

另外,关于前述的各种实施方式的人口估计单位、以及与输出相关的输出单位及 输出形式说明如下。

人口估计单位能够根据用户的属性(年龄、性别、住所等)、时间段、场所(小 区或网格等)中至少一种要素进行设定。例如,在对于人口估计单位设定了某种属性 的情况下,如在第4实施方式中叙述的那样,人口估计部21根据与各个观测对象位 置数据相关联的属性信息,按照被设为人口估计单位的每种属性,将与各个观测对象 位置数据相关联的特征量和放大系数相乘,将该相乘结果的总和除以(观测长度×2), 由此能够估计出被设为人口估计单位的每种属性的人口。例如,如图16所示,能够 输出针对观测区域估计出的人口或性别/年龄段/住所这样的每种属性的人口。并且, 也可以采用将多种属性进行组合的条件(例如,将性别和住所进行组合得到的条件“居 住在东京都的女性”)。并且,在作为人口估计单位设定了例如每天间隔1小时的时间 段的情况下,人口估计部21根据各个观测对象位置数据中所包含的取得时刻信息来 确定各个观测对象位置数据属于哪个时间段,按照间隔1小时的每个时间段,将与各 个观测对象位置数据相关联的特征量和放大系数相乘,将该相乘结果的总和除以(观 测长度×2),由此能够估计出每个时间段的人口。另外,在设定时间段作为人口估计 单位的情况下,也可以设定按照时间序列而不连续的时间段(例如,每天13:00~ 14:00的时间段,每周星期六及星期日的10:00~11:00的时间段等)。

另一方面,与输出相关的输出单位也与估计单位相同地,能够根据用户的属性(年 龄、性别、住所等)、时间段、场所(扇区或网格等)中至少一种要素进行设定。

并且,关于与输出相关的输出形式,可以选择例如图27(a)所示的表示人口分 布的图、图27(b)所示的表示按时间序列的人口变动的图、图27(c)所示的表示 人口构成的图等各种输出形式。并且,关于这些各种输出形式,也可以按照用户的属 性(年龄、性别、住所等)、时间段、场所(扇区或网格等)中的一个或者多个要素 的每种组合进行输出,例如也可以按照图27(c)所示输出间隔5岁的每个年龄段的 男女分类的人口构成。

下面,叙述与特征量相关的变形例。在前述的第1、第2实施方式中示出了这样 的示例,计算求出特征量的对象的位置数据(第1位置数据)前后的位置数据的时间 差(第2位置数据与第3位置数据的时间差),作为第1位置数据的特征量。用式子 表示该示例,则特征量可以用下面的式(7)表示。另外,下面的式(7)仅仅是将前 述的式(4)进行变形,因而与式(4)等效(即,不是变更了式(4)的思路的方式)。

wij=ui(j+1)-ui(j-1)    (7)

本变形例表示在特征量计算部17中计算出的特征量的计算方法的另一个变形。

在本变形例中,特征量计算部17在求出上述的第1位置数据的特征量时,考虑 有关第2位置数据及第3位置数据的类别信息(例如后述的位置数据的生成原因(生 成定时))。具体地讲,特征量计算部17计算向第3位置数据与第1位置数据的时间 差乘以与第3位置数据的类别信息(此处是生成原因)对应的校正系数α得到的值, 并且计算向第1位置数据与第2位置数据的时间差乘以与第2位置数据的类别信息 (此处是生成原因)对应的校正系数β得到的值。但是,除上述情况之外,特征量计 算部17也可以根据第1位置数据的类别信息确定校正系数α或β,并且也可以根据第 1及第2位置数据的类别信息确定校正系数β,还可以根据第1及第3位置数据的类 别信息确定校正系数α。并且,特征量计算部17将通过这些乘法运算得到的值进行 合计,将合计值作为第1位置数据的特征量。如果用式子表示特征量计算部17中特 征量的计算处理,则可以用下式(8)表示。

wij=α(ui(j+1)-uij)+β(uij-ui(j-1))    (8)

关于有关第2位置数据及第3位置数据的类别信息,例如在位置数据是位置登记 信息的情况下,可以举出与该位置登记信息的生成原因相关的信息,与该生成原因相 关的信息包含在所生成的位置登记信息中。关于位置登记信息的生成原因,可以举出 终端跨越位置登记区域(Location Area)边界、根据周期性地进行的位置登记而生成、 由于终端的电源接通等而执行连接(attach)处理、由于终端的电源切断等而执行断 开(detach)处理等,与这些生成原因相对应地,预先确定校正系数α及β的设定值。 并且,特征量计算部17可以根据与第3位置数据的生成原因相关的信息,设定有关 第3位置数据的校正系数α,并根据与第2位置数据的生成原因相关的信息,设定有 关第2位置数据的校正系数β。另外,也可以是,校正系数α及β均预先设定为0以上 1以下的值。但是,不一定必须是该数值范围。

例如,在诸如基于周期性进行的位置登记的位置登记信息那样、终端的位置与位 置登记信息的生成契机没有关系的位置登记信息的情况下,可以认为在当前的扇区中 滞留的时间的期望值在生成该位置登记信息的前后是相同的。另一方面,在由于终端 跨越位置登记区域边界而生成的位置登记信息的情况下,能够判定为至少在生成该位 置登记信息之前终端没有滞留在当前的扇区中。因此,认为在生成该位置登记信息之 前终端滞留在当前的扇区中的时间为0,如果第1位置数据的类别信息(生成原因) 是“跨越位置登记区域边界”,则能够将上述式(8)中的校正系数β(即,有关与紧前 面的位置数据的时间差的校正系数β)设定为0。由此,能够计算出更切合实际的特 征量。另外,这样在第1位置数据的类别信息(生成原因)是“跨越位置登记区域边 界”的情况下,如果将校正系数β设为0来计算特征量,则能够得到与前述第3实施方 式相同的修改。

这样,特征量计算部17在计算有关对象的位置数据(第1位置数据)的特征量 的情况下,根据有关第1位置数据的前后的位置数据即第2和第3位置数据的类别信 息(作为一例是位置数据的生成原因),对第2位置数据与第3位置数据的时间差进 行校正,并使用校正后的时间差计算特征量。由此,能够根据位置数据的类别信息更 加高精度地计算特征量。

标号说明

1通信系统;10终端数量估计装置;11位置数据取得部;12蓄积部;13观测期 间取得部;14观测区域取得部;15观测对象取得部;16前后位置数据取得部;17 特征量计算部;17A特征量保存部;18终端数量估计部;19终端数量输出部;21人 口估计部;22人口输出部;23属性/放大系数存储部;24变换部;25非识别化部; 26隐匿处理部;100便携式终端;200BTS;300RNC;400交换机;500管理中心; 501社会感测单元;502PETA挖掘单元;503流动人口统计单元;504可视化处理单 元;700各种处理节点。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号