公开/公告号CN105407364A
专利类型发明专利
公开/公告日2016-03-16
原文格式PDF
申请/专利权人 四川长虹电器股份有限公司;
申请/专利号CN201510708077.9
申请日2015-10-27
分类号H04N21/258(20110101);H04N21/466(20110101);H04N21/6377(20110101);H04N21/442(20110101);H04N21/658(20110101);
代理机构51213 四川省成都市天策商标专利事务所;
代理人袁辰亮
地址 621000 四川省绵阳市高新区绵兴东路35号
入库时间 2023-12-18 14:59:01
法律状态公告日
法律状态信息
法律状态
2018-07-03
授权
授权
2016-04-13
实质审查的生效 IPC(主分类):H04N21/258 申请日:20151027
实质审查的生效
2016-03-16
公开
公开
技术领域
本发明涉及智能电视,具体涉及一种基于智能电视收视率体系下频道综合 竞争力实现方法。
背景技术
目前市面上综合竞争力都是基于城市、高校、企业、国家等进行排名,主 要是为了衡量一个城市,一所高校,一个企业,一个国家的整体实力,提高综 合竞争力有利于企业、城市、高校、国家等发展,基于智能电视收视率体系下 的频道综合竞争力还没有进展,各大收视率网站几乎没有提出频道综合竞争力 概念。
发明内容
本发明克服了现有技术的不足,提供一种基于智能电视收视率体系下频道 综合竞争力实现方法。
为解决上述的技术问题,本发明采用以下技术方案:
一种基于智能电视收视率体系下频道综合竞争力实现方法,所述的实现方 法包括以下步骤:
1)统计收视率、到达率、忠诚度、用户流入、用户流出对应参考数据;
2)根据收视率、到达率、忠诚度、用户流入、用户流出的定义公式和所述 对应参考数据,分别计算出收视率、到达率、忠诚度、用户流入、用户流出;
3)按照标准化算法分别计算出收视率综合竞争力、到达率综合竞争力、忠 诚度综合竞争力、用户流入综合竞争力、用户流出综合竞争力的值;
4)将所述收视率综合竞争力、到达率综合竞争力、忠诚度综合竞争力、用 户流入综合竞争力和用户流出综合竞争力的值之和作为频道综合竞争力。
更进一步的技术方案是还包括采用模糊算法将所述收视率综合竞争力、到 达率综合竞争力、忠诚度综合竞争力、用户流入综合竞争力和用户流出综合竞 争力的值进行扩大,并保持趋势一致,再对扩大后的收视率综合竞争力、到达 率综合竞争力、忠诚度综合竞争力、用户流入综合竞争力和用户流出综合竞争 力的值求和,得到模糊算法的频道综合竞争力。
更进一步的技术方案是统计收视率、到达率、忠诚度、用户流入、用户流 出对应参考数据步骤包括:
步骤1、获取当前工作目录;
步骤2、确定查询日期参数、更新天数参数、MR输入文件路径参数、MR结果 的存储目录参数;
步骤3、遍历每一条数据,并对其进行处理,将相应数据传给Reducer函数;
步骤4、对获得的同一个MAC的所有观影行为进行处理,并将相应结果输出 到HDFS上。
更进一步的技术方案是步骤3包括:
3.1、Mapper启动时,获取相应参数,以及获取要查询日期的EPG信息;
3.2、根据数据中channel_id与EPG中的channel_code进行匹配;如果匹配 成功,则将该条数据中program替换成EPG中的program名称,并获得其播放开始 时间和结束时间;如果匹配失败,则丢弃该条数据;
3.3、按照<keyvalue>格式输出数据:
key:MAC
value:province|channel|时间戳|。
更进一步的技术方案是步骤4包括:
4.1、获取相应的参数;
4.2、将该MAC的观影数据放入List列表中;
4.3、对List列表按照时间戳字段进行从小到大排序;
4.4、遍历List列表:
4.4.1、每次遍历获得第i与第i-1数据;
4.4.2、计算第i条数据在不同时段中的观影时间;
4.4.3、分别按照<keyvalue>格式输出全国和省份的观影时间以及全 国频道收视分钟数:
key:0|N|channel|N|时段|
value:1
省份频道收视分钟数:
key:0|province|channel|N|时段|
value:1;
4.4.4、将全国和省份的频道接触人数加入Map中,其中key与步骤4.4.3 中的key一样,但第一位标记改为1;
4.5、遍历4.4.4步骤中Map,按照<keyvalue>格式输出数据。
更进一步的技术方案是步骤4还包括:
5.1、获取相应的参数;
5.2、将该MAC的观影数据放入List列表中;
5.3、对List列表按照时间戳字段进行从小到大排序;
5.4、遍历List列表:
5.4.1、每次遍历获得第i与第i-1数据;
5.4.2、如果第i条属于与第i-1条数据之差为5分钟,则判断其流入流 出;
5.4.3、分别按照<keyvalue>格式输出全国和省份的观影时间以及全 国频道收视分钟数:
key:N|channel|N|时段|inorout|channel/on,off
value:1
省份频道收视分钟数:
key:province|channel|N|时段|inorout|channel/on,off
value:1
5.5、遍历步骤4.4.4中Map,按照<keyvalue>格式输出数据。
更进一步的技术方案是数据标准化算法为:
设定竞争力综合指数标准值为X1,X2,X3,Xn,其中最大值为Max,最小值 为Min;变换后对应竞争力指数为Y1,Y2,Y3,Yi,则有:
目标时段内分别对收视率、到达率、忠诚度、用户 流入和用户流出计算综合竞争力,之后对这五个指标的综合竞争力相加即为 该频道目标时段内总的综合竞争力。
更进一步的技术方案是步骤3)之后还包括:将收视率、收拾份额、到达率、 忠实度、用户流入和用户流出数据输出到mysql。
更进一步的技术方案是步骤4)包括:按照条件读取mysql中收视率、收拾 份额、到达率、忠实度、用户流入和用户流出数据,默认五个指标同等重要, 综合竞争力数值在0-100之间,五个指标最大综合竞争力为20,对每个指标进行 排序,选取每个指标里面的最大值和最小值,按照标准化算法分别计算出每个 指标的综合竞争力,将五个指标的综合竞争力加和,即为该频道的总体综合竞 争力。
更进一步的技术方案是对收视率、到达率、忠诚度、用户流入和用户流出 分别进行单点测试。
与现有技术相比,本发明的有益效果是:本发明以收视率体系下的收视率、 到达率、忠诚度、用户流入、用户流出等五个维度来评判综合竞争力,频道综 合竞争力越高,说明频道在相同条件下整体实力越强,由于频道的热门程度、 节目质量、节目数量、节目热度等情况不同,频道综合竞争力的提出不仅提升 了用户对收视率体系的关注度,还可创造经济价值。
附图说明
图1为本发明一个实施例的方法流程图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互 相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除 非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非 特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
下面结合附图及实施例对本发明的具体实施方式进行详细描述。
如图1所示,根据本发明的一个实施例,本实施例公开一种基于智能电视收 视率体系下频道综合竞争力实现方法,它包括收视率体系下收视率、到达率、 忠诚度、用户流入、用户流出等定义实现和综合竞争力数据标准化算法以及模 糊算法实现。本实施例采取新的采集机制,数据以一分钟的形式上报,离线数 据一天以半个小时为单位;全国34个省(直辖市);每个省每个频道每个时段 都有相应的收视率、到达率、忠诚度、用户流入和用户流出;基于收视率、忠 诚度、到达率、用户流入和用户流出五个定义,根据数据标准化以及模糊算法 实现频道综合竞争力。
具体步骤为:获取当前工作目录,确定其他参数:查询日期、更新天数、 输入文件路径和mapreduce程序结果的存储目录;
mapper函数处理,即遍历每一条数据,并对其进行处理,将相应数据传给 redece函数;mapper启动时,获取相应参数,以及获取要查询日期的epg信息, 根据数据中channelID与epg中的channel_code进行匹配。如果匹配成功,则将 该条数据中channel替换成epg中的channel_name,如果匹配失败,则丢弃该条 数据,按照<keyvalue>格式输出数据;
redeuce函数处理,即对获得的同一个mac的所有观影行为进行处理,并将 相应结果输出到HDFS上。
(1)获取相应参数,将该mac的观影数据放入List列表中,对List列表按 照时间戳字段进行从小到大排序,遍历List列表,每次遍历获得第i与i-1数据, 计算第i条数据在不同时段中的观影时间,分别按照<keyvalue>格式输出全国 和省份的观影时间,将全国和省份的频道接触人数放入map中,按照<keyvalue> 格式输出数据;addMR进行求和处理,即在同一时段,且在全国或省份中观看同 一频道的分钟数进行累加求和;根据上述获得的数据,分别计算出收视率、收 视份额、到达率和忠实度。
(2)获取相应参数,将该mac的观影数据放入List列表中,对List列表按 照时间戳字段进行从小到大排序,遍历List列表,每次遍历获得第i与i-1数据, 如果第i条数据与第i-1条数据之差为5分钟,判断其流入流出情况,分别按照 <keyvalue>格式输出全国和省份的流入流出情况。根据上述情况的数据,分别 计算出用户流入和用户流出;接下来按照条件分别获取收视率、到达率、忠诚 度、用户流入和用户流出,默认为每个指标同样重要,同时分别获取收视率、 到达率、忠诚度、用户流入和用户流出每个指标数据的最大值和最小值,按照 数据标准化指标分别计算每个指标相应的综合竞争力,之后对五个指标进行加 和,即为该频道的综合竞争力,由于数据量少以及展示需求,按照模糊算法对 每个指标的综合竞争力进行扩大,便于展示,达到最佳效果。
具体的,本实施例基于智能电视收视率体系下频道综合竞争力实现方法, 具体实现步骤为:
步骤1、获取当前工作目录
步骤2、确定其他参数:
2.1查询日期
2.2更新天数:对以前的日期计算的结果重新计算
2.3MR输入文件路径
2.4MR结果的存储目录
步骤3、Mapper函数处理,即遍历每一条数据,并对其进行处理,将相应 数据传给Reducer函数。
3.1Mapper启动时,获取相应参数,以及获取要查询日期的EPG信息
3.2根据数据中channel_id与EPG中的channel_code进行匹配。如果 匹配成功,则将该条数据中program替换成EPG中的program名称,并获得其 播放开始时间和结束时间;如果匹配失败,则丢弃该条数据
3.3按照<keyvalue>格式输出数据:
key:MAC
value:province|channel|时间戳|。具体的,对用户观看电视的行为 数据中频道进行映射,以及所有时段(以半个小时为时段)。
步骤4、Reducer函数处理,即对获得的同一个MAC的所有观影行为进行处 理,并将相应结果输出到HDFS上;
4.1获取相应的参数;
4.2将该MAC的观影数据放入List列表中;
4.3对List列表按照时间戳字段进行从小到大排序;
4.4遍历List列表:
4.4.1每次遍历获得第i与第i-1数据;
4.4.2计算第i条数据在不同时段中的观影时间;
4.4.3分别按照<keyvalue>格式输出全国和省份的观影时间
全国频道收视分钟数:
key:0|N|channel|N|时段|
value:1
省份频道收视分钟数:
key:0|province|channel|N|时段|
value:1
4.4.4将全国和省份的频道接触人数加入Map中,其中key与上一步骤中 的key一样,但第一位标记改为1。
4.5遍历4.4.4步骤中Map,按照<keyvalue>格式输出数据。
步骤5、Reducer函数处理,即对获得的同一个MAC的所有观影行为进行处 理,并将相应结果输出到HDFS上;
5.1获取相应的参数
5.2将该MAC的观影数据放入List列表中
5.3对List列表按照时间戳字段进行从小到大排序
5.4遍历List列表:
5.4.1每次遍历获得第i与第i-1数据
5.4.2如果第i条属于与第i-1条数据之差为5分钟,则判断其流入流出
5.4.3分别按照<keyvalue>格式输出全国和省份的观影时间
全国频道收视分钟数:
key:N|channel|N|时段|inorout|channel/on,off
value:1
省份频道收视分钟数:
key:province|channel|N|时段|inorout|channel/on,off
value:1
5.5遍历4.4.4步骤中Map,按照<keyvalue>格式输出数据。优选的,对 省份进行映射,保证数据的标准性。
步骤6、AddMR进行求和处理,即在同一时段,且在全国或省份中观看同一 频道的分钟数进行累加求和以及用户流入流出情况累加求和
步骤7、后续处理程序:根据上述获得的数据,分别计算出收视率、收拾份 额、到达率、忠实度、用户流入和用户流出等。
具体的,收视率、到达率、忠诚度、用户流入、用户流出公式如下:
7.1、收视率(%)是指针对某特定时段或节目,平均每分钟的收视人数占 总体覆盖终端的百分比。
式中:假如选取时段以半个小时为单位,则该时段总时长为30分钟,收 视时长是指目标时段内该用户观看时间分钟数。
收视率考察特定时段收看某一频道或某一节目的人数在总体推及人口中的 比例。该指标考察的实际是特定时段(节目)长度上收看人数和收看时长的均 匀分布。
7.2、忠实度(%)是指特定频道(时段/节目)的收视率与到达率的百分比 值。
7.3、用户流入是指在某一时段内,用户从其他频道(节目)切换到当前频 道(节目)的用户进入次数,以及用户开机或切换到非电视直播状态而进入当前 频道(节目)的用户进入次数。
7.4、用户流出是指在某一时段内,用户从当前频道(节目)切换到其他频 道(节目)的用户离开次数,以及用户关机或切换到非电视直播状态而离开当前 频道(节目)的用户离开次数。
用户流入流出用于考察在一定时间内用户的流向。该指标是从动态角度 反映频道竞争状况。
7.5、到达率(%)是指在特定时段内符合到达条件的接触总人数占总体覆盖 终端的百分比。其中,到达条件一般是“至少收看了1分钟”。
式中:
接触人-------在特定时段内进入过该时段观看内容的人,其中,到达条件 可以改变。
到达率是一个时间上的纵向累积指标,它考察特定时间段内观众收看某一 频道或节目(或某一广告计划所能覆盖)的不重复的人数多少(或比例),反映 了接触的受众规模和传播的广泛性。
总体覆盖终端:一个Mac地址表示一个电视终端,总体覆盖终端即所有具 有TV用户行为的电视终端。
步骤8、将收视率、收拾份额、到达率、忠实度、用户流入和用户流出数据 输出到mysql。优选的,对收视率、到达率、忠诚度、用户流入和用户流出分别 进行单点测试,保证数据的准确性。
步骤9、按照条件读取mysql中收视率、收拾份额、到达率、忠实度、用户 流入和用户流出数据,默认五个指标同等重要,综合竞争力数值在0-100之间, 五个指标最大综合竞争力为20,对每个指标进行排序,选取每个指标里面的最 大值和最小值,按照标准化算法分别计算出每个指标的综合竞争力,将五个指 标的综合竞争力加和,即为该频道的总体综合竞争力。
其中,数据标准化算法如下:
假设竞争力综合指数标准值为X1,X2,X3,…,其中最大值为Max,最 小值为Min;变换后对应竞争力指数为Y1,Y2,Y3,…,Yi,则有:
目标时段内分别对收视率、到达率、忠诚度、用户流入和用户流出计算综 合竞争力,之后对这五个指标的综合竞争力相加即为该频道目标时段内总的综 合竞争力,本次综合竞争力只有在本收视率系统下才成立,综合竞争力只有在 本系统下才能相互比较。
步骤10、为了展示效果,根据模糊算法对每个指标的综合竞争力数值进行 数据扩大,保持扩大后的数据与原数据比例一样,达到展示效果,将模糊算法 的综合竞争力数据输入到mysql。
在本说明书中所谈到的“一个实施例”、“另一个实施例”、“实施例”等, 指的是结合该实施例描述的具体特征、结构或者特点包括在本申请概括性描述 的至少一个实施例中。在说明书中多个地方出现同种表述不是一定指的是同一 个实施例。进一步来说,结合任一个实施例描述一个具体特征、结构或者特点 时,所要主张的是结合其他实施例来实现这种特征、结构或者特点也落在本发 明的范围内。
尽管这里参照发明的多个解释性实施例对本发明进行了描述,但是,应该 理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实 施方式将落在本申请公开的原则范围和精神之内。更具体地说,在本申请公开 权利要求的范围内,可以对主题组合布局的组成部件和/或布局进行多种变型和 改进。除了对组成部件和/或布局进行的变型和改进外,对于本领域技术人员来 说,其他的用途也将是明显的。
机译: 媒体系统,远程控制,用于实现返回到媒体设备上的主频道的方法,媒体系统以及用于监视媒体频道并且可由设备读取的方法。
机译: 在智能电视上实现我自己的频道的方法
机译: 基于节目收视率的虚拟频道生成装置和方法