首页> 中国专利> 针对特定的人口统计和使用率分布从网络服务器数据获取匿名观众测量数据的方法和装置

针对特定的人口统计和使用率分布从网络服务器数据获取匿名观众测量数据的方法和装置

摘要

公开了针对特定的人口统计和使用率分布从网络服务器数据获取匿名观众测量数据的方法和装置。本发明所公开的向观众测量实体提供匿名观众测量数据的示例性方法包括以下步骤:获取人口统计分布和网络使用率分布;对存储在观众测量实体不能访问的顾客数据库中的顾客数据进行采样,以不需要顾客干预而生成代表人口统计分布和网络使用率分布的顾客样本,所述顾客样本包括顾客识别信息;使用该顾客识别信息对从观众测量实体不能访问的网络服务器中获取的日志数据进行处理,以确定与顾客样本中的顾客相关的观众测量数据;以及从观众测量数据中删除顾客识别信息,以针对观众测量实体准备匿名观众测量数据。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-06-04

    授权

    授权

  • 2012-03-07

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20110629

    实质审查的生效

  • 2012-01-11

    公开

    公开

说明书

技术领域

本公开总体涉及观众测量,更具体地,涉及针对特定的人口统计分布 (demographic profile)和使用率分布(usage profile)从网络服务器数据获取匿名观 众测量数据的方法和装置。

背景技术

使用各种非常规的技术(诸如通过因特网以及各种移动电话网络)将媒体内容提 供给观众。因此,内容提供商和广告商希望在传统广播电视市场之外扩展媒体内容消 费的观众测量。然而,由于在招募产生期望的人口统计分布的代表性样本的专门小组 (panel)中所遇到的挑战,传统的电视市场中用于观众测量的基于专门小组的常规 的技术实现起来可能比较昂贵。另外,因为这种专门小组通常仅包括所有观众成员的 一个小子集,所以常规的基于专门小组的技术经常不获得由相对较少的观众成员访问 的内容(例如,特定的市场内容(niche content))。虽然如果允许观众测量实体访问 跟踪数据流量(包括对媒体内容的访问)的网关以及其它网络服务器日志,以及访问 存储有可以用于确定顾客的人口统计的顾客数据的顾客关系数据库,则可以避免对专 门小组的需求,但是由于涉及隐私,这种访问通常是不可行的。

附图说明

图1是示例性使用环境的框图,其中,示例性的代表性采样单元可以从针对特定 的人口统计和使用率分布的网络服务器数据中获取匿名观众测量数据。

图2是图1的代表性采样单元的示例性实施例的框图。

图3例示了可以由图1和/或图2的代表性采样单元处理的示例性人口统计分布 和示例性使用率分布。

图4是表示可以被执行用来实现图1和/或图2的代表性采样单元的示例性机器 可读指令的流程图。

图5是表示可以用来实现图4的示例性机器可读指令并且/或者执行顾客样本生 成处理以实现图1和/或图2的代表性采样单元的示例性机器可读指令的流程图。

图6是表示可以用来实现图4的示例性机器可读指令并且/或者执行测量数据采 样处理以实现图1和/或图2的代表性采样单元的示例性机器可读指令的流程图。

图7是可以执行图4至图6的示例性机器可读指令以实现图1和/或图2的代表 性采样单元、和/或图1的示例性使用环境的示例性处理系统的框图。

具体实施方式

本文公开了从针对特定的人口统计和使用率分布的网络服务器数据获取匿名观 众测量数据的方法和装置。虽然下面公开的示例性方法和装置包括在硬件上执行的软 件等,应注意的是,这种方法和装置仅仅是说明性的,并且不应被认为是限制性的。 例如,可以预期的是,可以只用硬件、只用软件、只用固件,或者用硬件、软件和/ 或固件的任意组合来实现这些硬件和软件部件的任何一个或所有。另外,虽然结合使 用移动/无线网络、接入点和其它网络结构和设备的示例性的实施例进行了描述,但 是本文所描述的示例性方法和装置并不限定于此。因此,当下面描述示例性方法和装 置时,本领域的技术人员将很容易意识到,所提供的示例并不是实现这种方法和装置 的唯一方式。

如本文所使用的,措辞顾客通常指能够消费由任何供应商、消息来源、技术等提 供的媒体内容的任何人或实体。同样地,顾客可以是观众成员、订阅者、用户、观众、 听众等等。此外,本文涉及的顾客并不限于付款的顾客,而是包括不需要任何付款交 易或与内容的提供者没有任何其它关系的能够访问内容的顾客。

在公开的用于将匿名观众测量数据提供给观众测量实体的技术的示例中,示例性 代表性采样单元被包括在业务供应商的网络中,示例性代表性采样单元从观众测量实 体获取人口统计分布和网络使用率分布,观众测量实体是与业务供应商相分离的。在 示例性的实施例中,人口统计分布包括一组人口统计类型,其中每个人口统计类型包 括分别与一组目标人口比例相关的一组目标段。同样地,该示例性实施例中的网络使 用率分布包括分别与另一组目标人口比例相关的一组使用类型。

在被给予由观众测量实体所指定的人口统计分布和网络使用率分布之后,代表性 采样单元接着对存储在观众测量实体不能访问的顾客数据库中的顾客数据进行采样, 以不需要顾客干预而生成代表人口统计分布和网络使用率分布的顾客样本。在示例性 的实施例中,针对代表人口统计分布和网络使用率分布的顾客的子集,生成的顾客样 本包括顾客识别信息,诸如电话号码、互联网协议(IP)地址、用户名、个人身份证 号(PIN)、小量信息(cookie)识别符等,以及其它人口统计信息。使用包括在所生 成的顾客样本中的顾客识别信息,代表性采样单元能够从观众测量实体不能访问的网 络服务器(诸如网关或其它网络服务器)获取并处理日志数据,以确定与顾客样本中 的顾客相关的观众测量数据。为了使观众测量数据是匿名的,在向观众测量实体提供 数据之前,代表性采样单元删除观众测量数据以移除任何顾客识别信息(例如,用不 能识别特定的顾客的匿名识别符代替这种删除的信息)。然而,匿名测量数据保留了 其它人口统计信息以根据指定的人口统计和网络使用率分布来进行数据的分类。

与许多传统的观众测量技术不同,本文描述的示例性匿名服务器采样技术不使用 顾客/观众专门小组。替代地,本文描述的示例性技术直接根据(1)存储顾客信息记 录/数据(其包括识别和人口统计数据)的业务供应商的顾客关系数据库,以及(2) 跟踪数据流量/事件(其与例如媒体服务器和/或媒体内容访问相关)的业务供应商的 网络服务器日志,来确定匿名观众测量数据。另外,由代表性采样单元确定匿名观众 测量数据,该数据代表最初由观众测量实体所指定的人口统计和使用率分布的样本, 这与许多常规的技术不同,在常规技术中在处理测量数据之前人口统计组成是未知 的。此外,在公开的示例性匿名服务器采样技术中,观众测量实体与业务供应商是分 离的,这与业务供应商同时充当测量实体的其它测量技术不同。然而,因为当向观众 测量实体输出观众测量数据时观众测量数据是匿名的,所以隐私被维护,尽管事实上 观众测量实体与业务供应商是分离的。

转向附图,图1例示了示例性使用环境100的框图,其中,示例性代表性采样单 元105可以从针对特定的(例如,指定的)人口统计和使用率分布的网络服务器数据 获取匿名观众测量数据。使用环境100包括由业务供应商操作以向一个或更多个顾客 (未示出)提供媒体内容和其它业务的示例性供应商网络110。可以由任意类型的业 务供应商来实现供应商网络110,业务供应商例如移动通信业务供应商、因特网业务 供应商、有线电视业务供应商、卫星电视业务供应商、卫星无线电业务供应商等。

供应商网络110包括存储顾客记录的一个或更多个示例性顾客数据库115,该顾 客记录包含与业务供应商的顾客相关的顾客数据。顾客数据库115可以对应于,例如, 顾客关系管理(CRM)数据库、RADIUS服务器等,或者存储有与顾客相关的信息 以使业务供应商能够向它的顾客提供媒体内容和其它通信业务的任意其它类型的数 据库或服务器。在供应商网络110包括多个顾客数据库115的示例中,所有这些顾客 数据库115或这些顾客数据库115中的一些顾客数据库115可以共处在一起,或者处 于分开的位置。在说明性的示例中,在顾客数据库115的顾客记录中存储的顾客数据 包括顾客识别信息和其它人口统计信息。在顾客数据库115中存储的顾客识别信息的 示例可以包括(但不限于)顾客设备识别信息,诸如顾客所使用的用于访问供应商网 络110的移动电话和/或其它电话的电话号码、IP地址、媒体访问控制(MAC)地址 和/或顾客设备使用的用于访问供应商网络110的其它设备识别信息等中的任一个、 某一些或全部。顾客识别信息也可以包括个人识别信息,诸如顾客姓名、地址、身份 证号、帐号等中的任一个、某一些或全部。在顾客数据库115中存储的其它人口统计 信息的示例可以包括(但不限于)有关(例如,作为对一个或更多个顾客调查等的响 应,由顾客在申请业务中自动提供的)顾客的年龄、种族、收入、教育等中的任一个、 某一些或全部的信息,以及有关于顾客从业务供应商购买的服务、产品、订阅等的信 息。

供应商网络110还包括用于路由或处理供应商网络110中的数据流量的一个或更 多个示例性网络服务器120。例如,网络服务器120可以对应于网关(诸如无线接入 点(WAP)网关)、路由器、顾客访问服务器(CAS)、IP探测器、代理服务器、内 容适应服务器,等等。在供应商网络110包括多个网络服务器120的示例中,某些或 所有的多个网络服务器120可以共处在一起,或者处于分开的位置。另外,网络服务 器120可以与顾客数据库115共处在一起,或者处于与顾客数据库115分开的位置。 网络服务器120保留服务器日志,该日志用于跟踪与顾客对供应商网络110的使用相 关的数据流量和其它网络事件。例如,服务器日志可以跟踪顾客设备所访问的特定的 媒体内容和/或其它内容服务器、主机等的地址,所访问的特定的媒体或其它内容的 名称,访问服务器/主机和/或内容的时间,等等。另外,服务器日志数据由顾客设备 识别信息(例如,设备电话号码、IP地址,等等)进行索引,以使得数据流量和网 络事件与特定的顾客设备能够进行关联,进而能够与特定的顾客进行关联。

供应商网络110是由示例性的防火墙125所保护的安全并专用的网络,可以由任 意类型的防火墙设备或应用程序来实现该防火墙。因为供应商网络是安全并专用的, 所以虽然观众测量实体不能访问顾客数据库115和网络服务器120,但是供应商网络 110中包括的代表性采样单元105允许与业务供应商分离的观众测量实体从存储在顾 客数据库115中的顾客数据以及由网络服务器120存储的服务器日志中获取观众测量 数据。此外,为了维护顾客的隐私,由代表性采样单元105提供给观众测量实体的观 众测量数据是匿名的,因此不包含个人识别信息,但是可以包括其它人口统计信息。

在所例示的示例中,代表性采样单元105针对顾客的子集生成匿名测量数据,该 顾客的子集具有由观众测量实体指定的特定的人口统计分布和特定的网络使用率分 布。例如,被给予指定的人口统计和网络使用率分布之后,代表性采样单元105对存 储在顾客数据库115中的顾客数据进行采样(例如,一次或经过多次反复),以不用 顾客干预而生成包含代表指定的人口统计和网络使用率分布的顾客的子集的顾客样 本。附加地或另选地,顾客数据库115可能已经确定并跟踪了供应商网络110的顾客 的人口统计和/或网络使用。在这种示例中,代表性采样单元105可以询问顾客数据 库115以获取由顾客数据库115确定并跟踪的人口统计和/或网络使用率分布(例如, 而不是从观众测量实体接收人口统计和/或使用率分布)。代表性采样单元105还可以 询问顾客数据库115以获取代表由顾客数据库115确定并跟踪的这些人口统计和/或 网络使用率分布的顾客样本。然后,在任意这些示例中,使用包括在生成的顾客样本 (例如,根据观众测量实体提供的或顾客数据库115确定并跟踪的人口统计和/或使 用率分布所生成的)中的顾客识别信息(例如,顾客设备识别信息),代表性采样单 元105从网络服务器120获得并处理日志数据,以确定与顾客样本中的顾客相关的观 众测量数据。代表性采样单元105从根据服务器日志确定的观众测量数据中删除任何 顾客识别信息以维护隐私(例如,并且用匿名标识符来代替这种删除的信息),但是 保留其它人口统计信息以使得能够根据指定的人口统计和网络使用率分布来进行匿 名观众测量数据的分类。图2例示了代表性采样单元105的示例性实施例,并在下面 进行更加详细描述。

在所例示的示例中,代表性采样单元105使用由示例性通信网络145所承载的示 例性安全通信线路140与示例性测量实体网络135中包括的一个或更多个示例性测量 服务器130进行通信,该通信网络145是诸如因特网、专用网络、或任意其它类型的 通信网络。测量实体网络135也是安全的专用网络,并且由示例性的防火墙150进行 保护,该防火墙可以由任意类型的防火墙设备或应用程序来实现。可以通过例如虚拟 专用网络(VPN)、安全的文件传输协议(FTP)会话等来实现安全通信线路140。

测量服务器130接收用于指定特定的人口统计分布和特定的网络使用率分布的 分布配置文件155,其中的观众测量数据是通过代表性采样单元105来确定的。测量 服务器130将由分布配置文件155所指定的人口统计和网络使用率分布通过安全通信 线路140传送至代表性采样单元105。图3例示了可以采用分布配置文件155指定的 人口统计分布和网络使用率分布的示例,并且在下面进行更加详细的描述。

测量服务器130还根据由代表性采样单元105所确定的并通过安全通信线路140 下载到测量服务器130的匿名观众测量数据来生成报告160。该报告160采用任何适 当的报告格式,并且包括例如收视率、媒体内容访问度量(诸如,人气排行(popularity rankings))。此外,该报告160可以针对整个指定的人口统计和网络使用率分布、或 指定的人口统计和/或网络使用率分布的某些子集(例如,分类层或多个分类层)报 告观众测量数据。

虽然图1已经例示了实现使用环境100的示例性方式,但是可以组合、分离、重 新安排、省略、删除并且/或者用任何其它的方式实现图1所例示的一个或更多个部 件、过程和/或设备。此外,可以用硬件、软件、固件和/或硬件、软件和/或固件的任 意组合来实现图1的示例性代表性采样单元105、示例性供应商网络110、示例性顾 客数据库115、示例性网络服务器120、示例性防火墙125、示例性测量服务器130、 示例性测量实体网络135、示例性安全通信线路140、示例性通信网络145、示例性 防火墙150和/或,更一般地,示例性使用环境100。因此,例如,可以通过一个或更 多个电路、可编程处理器、专用集成电路(ASIC)、可编程逻辑器件(PLD)和/或现 场可编程逻辑器件(FPLD)等等来实现任何示例性代表性采样单元105、示例性供 应商网络110、示例性顾客数据库115、示例性网络服务器120、示例性防火墙125、 示例性测量服务器130、示例性测量实体网络135、示例性安全通信线路140、示例 性通信网络145、示例性防火墙150和/或,更一般地,示例性使用环境100。当所附 的权利要求中任一项被解读为用于涵盖仅软件和/或固件实现时,将示例性使用环境 100、示例性代表性采样单元105、示例性供应商网络110、示例性顾客数据库115、 示例性网络服务器120、示例性防火墙125、示例性测量服务器130、示例性测量实 体网络135、示例性安全通信线路140、示例性通信网络145和/或示例性防火墙150 中的至少一个明确定义为包括诸如存储器、数字式多功能光盘(DVD)、光盘(CD) 等存储这种软件和/或固件的有形介质。此外,图1的示例性使用环境100可以包括 除了(或代替)图1所说明的那些部件、过程和/或设备之外的一个或更多个部件、 过程和/或设备,并且/或者可以包括多于一个的任意或所有例示的部件、过程和设备。

图2例示了图1的代表性采样单元105的示例性实施例的框图。图2的代表性采 样单元105包括示例性分布指定器205,其用于获取由观众测量实体所指定的一个或 更多个人口统计分布和一个或多个网络使用率分布。通常,人口统计分布包括一组人 口统计分类,每个人口统计分类包括分别与一组目标人口比例相关的一组目标段(例 如,也称为目标层(strata))。同样地,网络使用率分布通常包括分别与另一组目标 人口比例相关的一组使用率分类。图3例示了可以由分布指定器205获得的示例性人 口统计分布305和示例性网络使用率分布310。

转向图3,示例性人口统计分布305包括两个(2个)分类,年龄分类312和收 入分类314(虽然可以包括其它分类来代替这两个分类的任何一个或两者,或者除这 两个分类的任何一个或两者以外可以包括其它分类)。年龄分类312包括一组目标年 龄段(或层)316-320。例如,第一目标年龄段(或层)316可以对应于18岁以下的 人的人口段,第二目标年龄段318可以对应于18岁到34岁的人,并且第三目标年龄 段320可以对应于34岁以上的人。每个目标段316-320与各自的目标人口比例326-330 相关。每个目标人口比例326-330可以是具体的比例值(例如,5%、10%,等等)或 比例值的范围(例如,5-10%、10-15%,等等)。同样地,收入分类314包括一组目 标段336-340。例如,第一目标收入段336可以对应于年收入低于40,000美元的人的 人口段,第二目标收入段338可以对应于年收入从40,000到100,000美元的人,并且 第三目标收入段340可以对应于年收入超过100,000美元的人。每个目标段336-340 与各自的目标人口比例346-350相关。如上所注意到的,每个目标人口比例346-350 可以是具体的比例值或比例值的范围。

示例性网络使用率分布310包括三个(3个)使用分类(或层)352-356(虽然示 例性实施例中可以包括更多或更少的分类)。例如,第一使用分类(或层)352对应 于显示出低的网络使用率的顾客,第二使用分类354对应于显示出中等网络使用率的 顾客,并且第三使用分类352对应于显示出高的网络使用率的顾客。可以根据例如一 段时期内的网络访问、一段时期内使用的带宽、一段时期内购买的带宽等来将网络使 用率特征化。例如,低的网络用户可以是大约每周一次通过供应商网络110访问内容 的顾客,中等的网络用户可以是每周一次到五次访问内容的顾客,并且高的网络用户 可以是每周大于五次访问内容的顾客。作为另一个示例,低的网络用户可以是每周访 问或购买小于1兆字节的内容的顾客,中等的网络用户可以是每周访问或购买1兆到 5兆字节的内容的顾客,并且高的网络用户可以是每周访问或购买大于5兆字节的内 容的顾客。前述的这些值是示例性的而不是限定性的。与人口统计分布305类似,网 络使用率分布310中的每个分类(或层)352-356与各自的目标人口比例362-366相 关,其可以是具体的比例值或比例值的范围。

返回图2,所例示的代表性采样单元105包括示例性顾客样本生成器210,顾客 样本生成器210采样存储在例如图1的顾客数据库115的记录中的顾客数据,以生成 包含代表例如由分布指定器205获得的特定的人口统计分布和特定的网络使用率分 布的顾客的子集的顾客样本(例如,单一的顾客样本)。顾客样本生成器210使用示 例性顾客数据库接口215来查询顾客数据库115并从顾客数据库115中获得查询结 果。在示例性实施例中,顾客样本生成器210使用顾客数据库接口215来根据包括在 所获得的人口统计分布中的用于确定索引的顾客数据的人口统计分类来对存储在顾 客数据库中的顾客数据进行索引。例如,参照图3的示例性人口统计分布305,顾客 样本生成器210可以使用顾客数据库接口215将顾客数据库115中的顾客数据索引 (例如,通过分类)成:(i)与包括在第一目标年龄段316和第一目标收入段336两 者中的顾客相对应的第一组;(ii)与包括在第一目标年龄段316和第二目标收入段 338两者中的顾客相对应的第二组;(iii)与包括在第一目标年龄段316和第三目标收 入段340两者中的顾客相对应的第三组,等等,直到将顾客索引为目标年龄与收入段 的所有可能的分组为止。然后,在这种示例性实施例中,顾客样本生成器210对根据 包括在所获得的人口统计分布中的目标人口比例所索引的顾客数据进行随机采样(例 如,选择),以随机选择代表人口统计分布的顾客的子集。例如,参照基于图3的人 口统计分布305的前述示例,顾客样本生成器210可以从第一组(例如,对应于包括 在第一目标年龄段316和第一目标收入段336两者中的顾客)中随机选择顾客,使得 通过将目标人口比例326与346相乘来确定相对于顾客样本中的顾客总数所选择的顾 客的数量。

至少在某些示例性实施例中,顾客网络使用信息也存储在顾客数据库115中(例 如,当网络使用率与购买的网络带宽相对应时)。在这种示例中,顾客样本生成器210 可以使用上述的顾客数据库接口215,根据包括在所获得的网络使用率分布中的网络 分类的设置,通过对存储在顾客数据库中的顾客数据进行索引来生成代表所获得的网 络使用率分布的另一顾客样本,然后根据所获得的包括在网络使用率分布中的目标人 口比例对索引的顾客数据进行随机采样(例如,选择),以随机选择代表网络使用率 分布的顾客的子集。附加地或另选地,顾客样本生成器210可以使用顾客数据库接口 215来生成代表获得的人口统计以及网络使用率分布两者的单一顾客样本。参照图3 的示例性人口统计分布305以及示例性网络使用率分布310,在这种示例中,顾客样 本生成器210可以将网络使用率分布310作为人口统计分布305的另一个维数(例如, 分类)。换言之,顾客样本生成器210可以使用顾客数据库接口215将顾客数据库115 中的顾客数据索引(例如,通过分类)成:(i)与包括在第一目标年龄段316、第一 目标收入段336以及低的网络使用率分类352的组合中的顾客相对应的第一组;(ii) 与包括在第一目标年龄段316、第一目标收入段336以及中等的网络使用率分类354 的组合中的顾客相对应的第二组,等等,直到顾客被索引成目标年龄与收入段以及网 络使用率分类的所有可能分组为止。然后,顾客样本生成器210根据包括在所获得的 人口统计和网络使用率分布中的目标人口比例对索引的顾客数据进行随机采样(例 如,选择),以随机选择代表人口统计和网络使用率分布两者的顾客的子集(例如, 使得每个索引的组包括多个随机选择的顾客,其与整个所选的顾客子集的比例对应于 构成组的人口段的个别目标人口比例的乘积)。

顾客样本生成器210可以使用任意类型的随机或伪随机采样技术来对包括在顾 客数据库115中的顾客数据进行采样。生成代表获得的人口统计分布(和/或在网络 使用率信息存储在顾客数据库115中时代表获得的网络使用率分布)的顾客样本之 后,顾客样本生成器210将所生成的顾客样本存储在顾客样本存储器220中。可以通 过任意类型的存储器或存储装置或技术来实现顾客样本存储器220,诸如包括在图7 中所例示的并且将在下面更加详细描述的示例性处理系统700中的大容量存储设备 730和/或易失性存储器718。

代表性采样单元105还包括示例性测量数据采样器225,示例性测量数据采样器 225用于为包含在存储于顾客样本存储器220中的顾客样本中的顾客获取并处理服务 器日志数据。例如,测量数据采样器225使用示例性服务器日志接口230从网络服务 器120获得针对包含于由顾客样本生成器210生成的顾客样本中的顾客、但是不针对 没有包括在顾客样本中的顾客的服务器日志数据。另选地,在示例性的实时采样实施 例中,测量数据采样器225将网络服务器120配置为针对包含在由顾客样本生成器 210所生成的顾客样本中的顾客、但是不针对没有包括在顾客样本中的顾客自动地提 供(例如,通过推入机制)服务器日志数据。在示例性的实施例中,包括在顾客样本 中的顾客识别信息、具体地是顾客设备识别信息(例如,电话号码、IP地址、用户 名、PIN、小量信息(cookie)标识符,等等)用于获得针对包括在顾客样本中的那 些顾客的服务器日志数据,或者将网络服务器120配置为针对包括在顾客样本中的那 些顾客自动地提供(例如,推入)服务器日志数据。因此,对于顾客样本中的每个顾 客,由测量数据采样器225从网络服务器120检索或(例如,通过推入机制自动地) 获得包括代表特定的顾客的顾客识别信息(例如,电话号码、IP地址,等等)或与 括代表特定的顾客的顾客识别信息(例如,电话号码、IP地址,等等)相关的服务 器日志数据。

为了生成观众测量数据(例如,离线使用所获得的服务器日志数据或实时使用自 动提供/推入的服务器日志数据),测量数据采样器225然后针对顾客样本中的每个顾 客将服务器日志数据分类为特定的顾客所属于的特定的人口统计分类或多个分类(以 及特定顾客的网络使用率分类,如果可以从存储在顾客数据库115中的顾客数据中获 知的话)。附加地或另选地,诸如在顾客网络使用率信息没有存储在顾客数据库115 中的示例性实施例中,测量数据采样器225处理服务器日志数据以针对顾客样本中的 每个顾客确定网络使用率分类,从而允许测量数据采样器225将特定顾客的服务器日 志数据分类为特定的网络使用率分类。例如,测量数据采样器225可以分析服务器日 志数据以确定一段时期内的网络访问、一段时期内所使用的带宽,等等,针对包括在 顾客样本中的每个顾客确定网络使用率分类,因而确定顾客样本的实际网络使用率分 布。

代表性采样单元105还包括示例性分布验证器240,该分布验证器240用于确定 由测量数据采样器225获得并处理的服务器日志数据是否对应于(例如,代表)由观 众测量实体所指定的分布指定器205所获得的人口统计和网络使用率分布。例如,在 顾客数据库115未针对每个顾客存储网络使用率信息的操作情形中,由顾客样本生成 器210所生成的顾客样本将代表所获得的人口统计分布,但是可能代表或者可能不代 表所获得的网络使用率分布。在这种操作情形中,分布验证器240将(例如,由测量 数据采样器225根据服务器日志数据所确定的)顾客样本的实际网络使用率分布与所 获得的网络使用率分布进行比较,以针对每个网络使用率分类确定这些分布是否匹 配、或者在某些容限内基本匹配。如果分布不匹配,则分布验证器240使顾客样本生 成器210通过以下方式更新顾客样本,例如,(1)从属于顾客的实际比例超过指定比 例的各网络使用率分类的样本中随机删除一些顾客,以及(2)用与删除的顾客属于 同一人口统计分类的、新的、随机采样的顾客代替删除的顾客。然后,测量数据采样 器225获得针对这些新采样的顾客的服务器日志数据,并且针对更新的顾客样本重新 计算实际网络使用率分布。该分布验证器240反复地重复该过程,直到顾客样本的实 际网络使用率分布与指定的网络使用率以及人口统计分布相匹配,并且/或者直到执 行了指定的次数的重复为止。

为了使测量数据采样器225所确定的并且经分布验证器240验证的所产生的观众 测量数据保密,代表性采样单元105包括示例性的保密单元245。保密单元245删除 任何可以用于识别特定的顾客的顾客识别信息,诸如包括在观众测量数据(例如,作 为所获得的服务器日志数据的一部分)中的顾客设备识别信息(例如,电话号码、IP 地址,等等)。在某些示例中,保密单元245用匿名标识符代替删除的顾客识别信息, 该匿名标识符可以用于对相关的数据进行分组而不实际标识任何顾客。然而,保密单 元245保留了包括在观众测量数据中的任何人口统计和使用率分类信息(例如,由测 量数据采样器225所确定的)。代表性采样单元105包括数据传送单元250,数据传 送单元250用于向观众测量实体的测量服务器传送匿名观众测量数据以进行后续处 理。

虽然图2已经例示了图1的代表性采样单元105的示例性实施方式,但是可以组 合、分离、重新安排、省略、删除并且/或者用任何其它的方式实现图2所例示的一 个或更多个部件、过程和/或设备。此外,可以通过硬件、软件、固件和/或硬件、软 件和/或固件的任意组合来实现图2的示例性分布指定器205、示例性顾客样本生成器 210、示例性顾客数据库接口215、示例性顾客样本存储器220、示例性测量数据采样 器225、示例性服务器日志接口230、示例性分布验证器240、示例性保密单元245、 示例性数据传送单元250和/或,更一般地,示例性代表性采样单元105。因此,例如, 可以通过一个或更多个电路、可编程处理器、专用集成电路(ASIC)、PLD和/或FPLD 等来实现任何示例性分布指定器205、示例性顾客样本生成器210、示例性顾客数据 库接口215、示例性顾客样本存储器220、示例性测量数据采样器225、示例性服务 器日志接口230、示例性分布验证器240、示例性保密单元245、示例性数据传送单 元250和/或,更一般地,示例性代表性采样单元105。当任何所附权利要求被解读为 涵盖仅软件和/或固件实现时,这里将示例性代表性采样单元105、示例性分布指定器 205、示例性顾客样本生成器210、示例性顾客数据库接口215、示例性顾客样本存储 器220、示例性测量数据采样器225、示例性服务器日志接口230、示例性分布验证 器240、示例性保密单元245和/或示例性数据传送单元250的至少之一明确定义为包 括诸如存储器、DVD、CD等存储这种软件和/或固件的有形介质。此外,图2的示例 性代表性采样单元105可以包括除了(或代替)图2所说明的那些部件、过程和/或 设备之外的一个或更多个部件、过程和/或设备,并且/或者可以包括多于一个的任意 或所有例示的部件、过程和设备。

图4至图6示出了代表示例性机器可读指令的流程图,该机器可读指令可以被执 行以实现示例性使用环境100、示例性代表性采样单元105、示例性供应商网络110、 示例性顾客数据库115、示例性网络服务器120、示例性防火墙125、示例性测量服 务器130、示例性测量实体网络135、示例性安全通信线路140、示例性通信网络145、 示例性防火墙150、示例性分布指定器205、示例性顾客样本生成器210、示例性顾 客数据库接口215、示例性顾客样本存储器220、示例性测量数据采样器225、示例 性服务器日志接口230、示例性分布验证器240、示例性保密单元245和/或示例性数 据传送单元250。在这些示例中,由各个流程图表示的机器可读指令可以包括一个或 更多个由以下部件执行的程序:(a)处理器,诸如在以下结合图7讨论的示例性处理 系统700中所示出的处理器712,(b)控制器,和/或(c)任何其它适当的设备。一 个或更多个程序可以实施在存储在有形介质上的软件中,该有形介质诸如,闪存、只 读型光盘(CD-ROM)、软盘、硬盘驱动器、DVD、或与处理器712相关的存储器。 另选地,整个程序和/或它的一部分可以由不同于处理器712的设备执行,或嵌入在 (例如,由ASIC、PLD、FPLD、离散逻辑等等实现的)固件或专用硬件中。

例如,可以通过软件、硬件和/或固件的任意组合来实现任意一个或所有的示例 性使用环境100、示例性代表性采样单元105、示例性供应商网络110、示例性顾客 数据库115、示例性网络服务器120、示例性防火墙125、示例性测量服务器130、示 例性测量实体网络135、示例性安全通信线路140、示例性通信网络145、示例性防 火墙150、示例性分布指定器205、示例性顾客样本生成器210、示例性顾客数据库 接口215、示例性顾客样本存储器220、示例性测量数据采样器225、示例性服务器 日志接口230、示例性分布验证器240、示例性保密单元245和/或示例性数据传送单 元250。而且,可以人工实现由图4至图6的流程图所表示的某些或所有的机器可读 指令。此外,虽然参照在图4至图6中所例示的流程图描述了示例性的机器可读指令, 但是可以另选地使用用于实现这里所描述的示例性方法和装置的许多其它技术。例 如,参照在图4至图6中所例示的流程图,可以改变框的执行顺序,并且/或者对所 描述的某些框进行改变、删除、组合、并且/或者再分为多个框。

图4所示的流程图表示可以执行以实现图1和/或2的示例性代表性采样单元105 的示例性机器可读指令400。可以在预定的时间间隔、基于预定事件的发生等、或它 们任意的组合,来执行示例性机器可读指令400。如图4所例示的,示例性机器可读 指令400实现两个处理线程,顾客样本生成线程404和测量数据采样线程408。在至 少某些示例性实施例中,测量数据采样线程408比顾客样本生成线程404执行的更加 频繁。例如,期望以相对于顾客获得、丢失、更新服务分布相对不频繁的频率(诸如 每天、每周、每月、每季度等),相对较少地更新人口统计和网络使用率分布。因此, 可以以同样不频繁的频率执行顾客样本生成线程404,以生成与最近更新的人口统计 和/或网络使用率分布相对应的顾客样本,如以下所描述的,并且当顾客样本的实际 网络使用率分布与指定的网络使用率分布不对应时,更频繁的调用来更新顾客样本。 相反地,预期更频繁地执行测量数据采样线程408,诸如每分钟、每几分钟(例如, 每15分钟)、每小时、每天,等等,这取决于所生成的观众测量数据所期望的暂时的 精确性。

参照图1至图3,在框412开始执行图4的机器可读指令400的顾客样本生成线 程404,在该框中,包括在代表性采样单元105中的分布指定器205从操作观众测量 服务器130的观众测量实体中获取人口统计分布,诸如人口统计分布305。在框416, 包括在代表性采样单元105中的分布指定器205从操作观众测量服务器130的观众测 量实体中获取网络使用率分布,诸如网络使用率分布310。然后,在框420,包括在 代表性采样单元105中的顾客样本生成器210对存储在顾客数据库115的记录中的顾 客数据进行采样,以生成包含分别代表在框412和416获得的人口统计分布和网络使 用率分布的顾客的子集的顾客样本。所生成的顾客样本存储在顾客样本存储器220 中。图5例示了用于实现框420的处理的示例性机器可读指令,并在下面进行更加详 细地描述。

在框420执行了顾客样本生成之后,在框424,顾客样本生成器210确定是否需 要更新在框420生成的顾客样本。例如,如果(例如,根据样本服务器日志数据所确 定的)针对顾客样本的实际网络使用率分布与在框416所获得的指定的网络使用率分 布未能匹配并且未能在指定的容限内基本匹配,则包括在代表性采样单元105中的分 布验证器240可以指示顾客样本需要更新。如果需要更新顾客样本(框424),则处 理返回框420,在该框更新顾客样本。然而,如果不需要更新顾客样本(框424),则 分布指定器205在框428确定是否已经对指定的人口统计和/或网络使用率分布进行 了更新。如果要更新分布中的一个或两者(框428),则处理返回框412。否则,结束 顾客样本生成线程404的执行,直到顾客样本生成线程404被调用来生成新顾客样本。

在框432开始执行图4的机器可读指令400的测量数据采样线程408,在该框, 包括在代表性采样单元105中的测量数据采样器225针对在存储在顾客样本存储器 220中的顾客样本中所包含的顾客从网络服务器120中获得服务器日志数据。另选地, 在示例性的实时采样实施例中,当网络服务器120的服务器日志数据变得实时可得 时,网络服务器120可以自动(例如,通过推入机制)向代表性采样单元105提供它 们的服务器日志数据。另外,在框432,测量数据采样器225根据检索到的(或提供 的/推入的)服务器日志数据确定观众测量数据。图6说明了用于执行框432的处理 的示例性机器可读指令,并在下面进行详细描述。

在框432执行了测量数据采样之后,在框436,分布验证器240确定由测量数据 采样器225根据所获得的服务器日志确定的实际网络使用率分布是否与在框416获得 的指定的网络使用率分布相对应。如果实际的和指定的网络使用率分布不对应(框 436),则分布验证器240调用顾客样本生成线程404的框424,指示需要更新顾客样 本。然而,如果实际的和指定的网络使用率分布对应(框436),则在框440,包括在 代表性采样单元105中的保密单元245擦除在框432所确定的观众测量数据,以删除 任何顾客识别信息,但是保留任何其它的人口统计和/或网络使用率分类。然后,在 框444,包括在代表性采样单元105中的数据传送单元250向观众测量实体的测量服 务器130传送所产生的匿名测量数据。然后,在框448,测量数据采样器225确定是 否到了更新测量数据样本的时间。如果到了更新测量数据的时间(框448),则处理 返回至框432,测量数据采样器225在该框获得并处理新的服务器日志数据,以确定 更新的观众测量数据。否则,结束测量数据采样线程408的执行,直到测量数据采样 线程408被调用来生成新的匿名观众测量数据。

图5例示了用于实现图4的框420的顾客样本生成处理的示例性机器可读指令 420。参照图1至图3,在框504开始执行图5的机器可读指令420,在该框,包括在 代表性采样单元105中的顾客样本生成器210获得由分布指定器205从观众测量实体 中获得的人口统计分布。在框508,顾客样本生成器210访问顾客数据库115,在框 512,顾客样本生成器210根据在框504所获得的人口统计分布中包含的人口统计分 类,使用存储于顾客数据库115中的顾客数据将顾客索引成组。例如,在框512,顾 客样本生成器210可以针对包括在人口统计分布中的所有不同的分类的各个分类,生 成针对用于选择特定的人口统计段的各个可能的排列的组。然后,顾客样本生成器 210根据存储在顾客数据库115中的顾客的标识和人口统计数据,将每个顾客放置在 适当的人口统计组中。

接着,在框516,顾客样本生成器210生成与针对人口统计分布中的每个分类所 指定的目标人口比例相匹配的随机顾客样本。例如,在框516,顾客样本生成器210 通过将针对包括在特定的索引组中的各个分类的组成人口段的目标人口比例相乘,来 针对在框512所确定的各个索引组确定有效人口比例。然后,对于每个索引组,顾客 样本生成器210从每个索引组中随机采样(例如,选择)多个顾客,使得从每个索引 组所采样出的顾客的数量与顾客样本中所包括的顾客总数的比例对应于针对该特定 的项目组所确定的有效人口比例。结果获得了实际人口统计分布与在框504所获得的 指定的人口统计分布相对应的顾客的子集。

接下来,在框520,顾客样本生成器210确定顾客数据库115是否包含网络使用 率信息。如果包括,则在框524,顾客样本生成器210开始生成具有由分布指定器205 所获得的指定的网络使用率分布的另一顾客样本。具体地,在框524,顾客样本生成 器210使用存储在顾客数据库115中的网络使用率数据和相关的顾客识别信息来将顾 客索引(例如,分类)为包含于在框504所获得的人口统计分布中的不同网络使用率 分类。然后,在框528,顾客样本生成器210生成与针对网络使用率分布中的每个分 类所指定的目标人口比例相匹配的随机顾客样本。例如,顾客样本生成器210从每个 网络使用率分类中随机采样(例如,选择)多个顾客,使得从每个网络使用率分类所 采样的顾客的数量与顾客样本中所包括的顾客总数的比例对应于针对该特定的网络 使用率分类的目标人口。得到了这样的顾客的子集,该顾客的子集的实际的网络使用 率分布与在框504所获得的指定的网络使用率分布对应。

另选地,如果顾客数据库115包含网络使用率信息,则可以组合框512到528的 处理,以生成表示获得的人口统计和网络使用率分布的顾客样本。在这种示例中,如 上所述,当索引并采样顾客(例如,在框512和516)以生成顾客样本时,在指定的 网络使用率分布中的网络使用率分类的集合被视为指定的人口统计分布的另一维(例 如,作为另一个人口统计分类)。

接下来,在框532,顾客样本生成器210将在框516和528生成的一个或更多个 顾客样本存储在顾客样本存储器220中。然后,结束示例性机器可读指令420的执行。

图6例示了用于实现图4的框432的测量数据采样处理的示例性机器可读指令 432。参照图1至图3,在框604处开始执行图6的机器可读指令432,在该框,测量 数据采样器225从顾客样本存储器220中获得由顾客样本生成器210所生成的顾客样 本。在框608,测量数据采样器225访问由网络服务器120维护的网络服务器日志, 在框612,针对包含于在框604所获得的顾客样本中的顾客,测量数据采样器225获 得服务器日志数据。例如,在框612,测量数据采样器225可以使用顾客识别信息, 诸如顾客设备识别信息(例如,电话号码、IP地址,等等)针对包括在顾客样本中 的顾客(例如,通过匹配网络服务器日志中包括的设备识别信息)来获得服务器日志 数据,但是不针对其它顾客获得服务器日志数据。

接下来,在框616,测量数据采样器225确定是否需要将包括在顾客样本中的顾 客分类为所获得的网络使用率分布的网络使用率分类(例如,当在顾客数据库115中 不包括网络使用率信息,因而不能预先确定具有指定的网络使用率分布的顾客样本 时)。如上所述,如果需要网络使用率分类(框616),则在框620,测量数据采样器 225处理在框612所获得的服务器日志数据,以将顾客样本中的每个顾客分类为特定 的的网络使用率分类。然后,在框624,测量数据采样器225将每个顾客的服务器日 志数据(例如,该数据已经与顾客的识别信息相关联)与特定的顾客所属于的人口统 计分类和网络使用率分类(例如,如果从存储于顾客数据库中的顾客数据中了解后者) 进行关联(例如,分类)。在框628,测量数据采样器225将所获得的服务器日志数 据和相关的顾客识别信息、人口统计分类以及网络使用率分类存储为观众测量数据。 然后结束机器可读指令432的执行。

图7是能够实现本发明所公开的装置和方法的示例性处理系统700的框图。处理 系统700可以是,例如,服务器、个人计算机、个人数字助理(PDA)、因特网设备、 DVD播放器、CD播放器、数字录像机、个人录像机、机顶盒、或任何其它类型的计 算设备。

系统700的示例包括诸如通用可编程处理器的处理器712。处理器712包括本地 存储器714,并执行存在于本地存储器714和/或另一个存储设备中的编码指令716。 此外,处理器712可以执行图4至图6中所表示的机器可读指令。处理器712可以是 任何类型的处理单元,诸如来自微处理器家族、微 处理器家族、微处理器家族,和/或Intel处理器家族的一个或 更多个微处理器。当然,来自其它家族的其它处理器也是适当的。

处理器712通过总线722与包括易失性存储器718和非易失性存储器720的主存 储器进行通信。易失性存储器718可以由以下部件实现:静态随机存取存储器 (SRAM)、同步动态随机存取存储器(SDRAM)、动态随机存取存储器(DRAM)、 RAMBUS动态随机存取存储器(RDRAM)和/或任何其它类型的随机存取存储器设 备。可以用闪存和/或任何其它期望类型的存储器设备来实现非易失性存储器720。通 常由存储器控制器(未示出)来控制对主存储器718,720的访问。

处理系统700还包括接口电路724。可以用任何类型的接口标准,诸如以太网接 口、通用串行总线(USB)、和/或第三代输入/输出(3GIO)接口,来实现接口电路 724。

一个或更多个输入设备726被连接到接口电路724。输入设备726允许用户向处 理器712输入数据和命令。可以由以下部件来实现输入设备,例如,键盘、鼠标、触 摸屏、轨迹板、轨迹球、追踪点(isopoint)和/或声音识别系统。

一个或更多个输出设备728也连接到接口电路724。可以由例如显示设备(例如, 液晶显示器、阴极射线管显示器(CRT))、打印机和/或扬声器来实现输出设备728。 因此,接口电路724通常包括图形驱动卡。

接口电路724还包括诸如调制解调器或网络接口卡的通信设备,以方便通过网络 (例如,以太网连接、数字用户线(DSL)、电话线、同轴电缆、移动电话系统、等 等)与外部计算机交换数据。

处理系统700还包括用于存储软件和数据的一个或更多个大容量存储设备730。 这种大容量存储设备730的示例包括软盘设备、硬盘驱动器、光盘驱动器和数字式多 功能光盘(DVD)驱动器。该大容量存储设备730可以实现顾客样本存储器220。另 选地,易失性存储器718可以实现顾客样本存储器220。

作为实现本发明所描述的在诸如图7的处理系统的系统中的方法和/或装置的选 择,本发明所描述的方法和/或装置可以嵌入到诸如处理器和/或专用集成电路(ASIC) 的结构中。

最后,虽然本发明已经描述了某些示例性的方法、装置和制造的产品,但是该专 利的覆盖范围并不限定于此。相反,本专利覆盖完全落入或在等同的教导下落入所附 权利要求的范围之内的所有方法、装置和制造的产品。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号