法律状态公告日
法律状态信息
法律状态
2017-03-01
授权
授权
2016-11-09
实质审查的生效 IPC(主分类):H04N21/466 申请日:20160624
实质审查的生效
2016-10-12
公开
公开
技术领域
本发明涉及智能电视技术领域,具体涉及一种电视观众兴趣建模方法和系统。
背景技术
近年来,随着电视智能化程度和互联网化程度的不断加深,电视节目的类型和数量大幅度增加,各种节目、新闻充斥着人们的生活。面对如此庞杂的内容群,人们已经无法通过简单的搜索获取自己真正感兴趣的信息,并且重复频繁的搜索方式,会使人们厌倦对节目的选择,失去观赏节目的兴趣。
为解决上述问题,电视节目推荐系统应运而生。电视节目推荐系统根据用户历史行为数据,建立用户兴趣偏好模型,筛选出用户感兴趣的节目,快速准确地向用户推荐所喜好的节目信息。
现有技术公开了一种电视观众兴趣建模方法,该方法包括用户兴趣偏好模型为:
其中:表示用户ui对节目vj的基础兴趣偏好;ctime(i,j,l)表示在第l条历史点播记录中用户ui点播节目vj的时长;ptime(j)表示节目vj单个集数的时长;表示用户ui点播节目vj的总次数。
上述用户兴趣偏好模型仅从单一用户点播节目的时长和次数以及节目的单集时长这三个方面考虑,采用的用户点播节目的时长占节目的单集时长的比例的方式,不能准确地反应用户对电视节目的偏好。
发明内容
(一)解决的技术问题
本发明提供了一种电视观众兴趣建模方法和系统,解决了有效地反映用户兴趣偏好以及准确地向用户推荐电视节目信息的技术问题。
(二)技术方案
为解决上述问题,本发明提供了一种电视观众兴趣建模方法,其包括如下步骤:
S1、通过电视采集系统获取点播节目数据并对所述数据进行处理;
根据所述处理后的数据生成用户历史点播记录、节目基本属性记录和频道电子节目菜单;
S2、根据所述用户历史点播记录、节目基本属性记录和频道电子节目菜单,统计同一节目被各频道播放的总次数、全体用户点播同一个节目的平均时长和次数以及单一用户点播所有节目的时长和次数,建立基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型;
S3、融合所述基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型,建立用户对节目的偏好模型;
S4、根据所述偏好模型建立用户偏好矩阵,进而根据所述用户偏好矩阵向用户推荐电视节目。
在步骤S1中,所述节目基本属性记录表示为:
Pj={vj,Fj,ptime(j)},
其中:
Pj表示节目vj的基本属性记录;
vj(1≤j≤N),vj表示第j个节目,N表示节目总数;
Fj表示节目vj的总集数;
ptime(j)表示节目vj单个集数的时长;
所述频道电子节目菜单表示为:
其中:
Gk表示频道ck的电子节目菜单;
ck(1≤k≤K),ck表示第k个频道,K表示频道总数;
vj(1≤j≤N),vj表示第j个节目,N表示节目总数;
表示节目vj的第s集,Fj表示节目vj的总集数;
stimej表示频道ck播放节目vj的开始时间;
etimej表示频道ck播放节目vj的结束时间;
所述用户历史点播记录表示为:
其中:
表示用户ui的第l条历史点播记录;
ui(1≤i≤M),ui表示第i位用户,M表示用户总数;
vj(1≤j≤N),vj表示第j个节目,N表示节目总数;
表示节目vj的第s集,Fj表示节目vj的总集数;
ck(1≤k≤K),ck表示第k个频道,K表示频道总数;
ctime(i,j,l)表示在第l条历史点播记录中用户ui点播节目vj的时长。
在步骤S2中,所述基于时间的用户兴趣偏好模型为:
其中:
pi'j表示基于时间的用户ui对节目vj的兴趣偏好;
α1表示基于节目的时间修正系数;
β1表示基于用户的时间修正系数;
表示用户ui对节目vj的基础兴趣偏好。
所述α1表示为:
所述β1表示为:
所述表示为:
其中:
ctime(i,j,l)表示在第l条历史点播记录中用户ui点播节目vj的时长;
Dj表示点播节目vj的总用户数;
Di表示用户ui点播的节目总数;
表示用户ui点播节目vj的总次数;
ptime(j)表示节目vj单个集数的时长;
M表示用户总数;
N表示节目总数。
在步骤S2中,所述基于频率的用户兴趣偏好模型为:
其中:
表示基于频率的用户ui对节目vj的兴趣偏好;
α2表示基于节目的频率修正系数;
β2表示基于用户的频率修正系数;
表示用户ui点播节目vj的总次数;
表示频道ck播放节目vj的总次数;
K表示频道总数。
所述α2表示为:
所述β2表示为:
其中:
Dj表示点播节目vj的总用户数;
Di表示用户ui点播的节目总数;
表示用户ui点播节目vj的总次数;
M表示用户总数;
N表示节目总数。
在步骤S3中,所述偏好模型为:
其中:
w1+w2=1;
其中:
rij表示用户对节目的总体兴趣偏好;
w1表示基于时间的用户兴趣偏好pi'j对总体兴趣偏好rij的影响权重;
w2表示基于频率的用户兴趣偏好对总体兴趣偏好rij的影响权重。
在步骤S4中,所述用户偏好矩阵表示为:
其中:
R={rij,i=1,2...M;j=1,2...N};
rij表示用户对节目的总体兴趣偏好。
本发明还提供一种电视观众兴趣建模系统,其包括:
数据采集单元、数据处理单元、建模单元和推荐单元;
所述建模单元包括时间/频率建模单元,偏好模型生成单元,偏好矩阵生成单元;
所述时间/频率建模单元,用于建立基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型;
所述偏好模型生成单元,用于建立用户对节目的偏好模型;
所述偏好矩阵生成单元,用于建立用户偏好矩阵;
系统工作时,所述数据采集单元利用节目数据采集装置获取电视观众在点播节目过程中的用户历史记录数据、节目基本属性数据和频道电子节目菜单数据并发送给所述数据处理单元;
通过所述数据处理单元生成用户历史点播记录、节目基本属性记录和频道电子节目菜单;
所述时间/频率建模单元根据所述用户历史点播记录、节目基本属性记录和频道电子节目菜单,统计同一节目被各频道播放的总次数、全体用户点播同一个节目的平均时长和次数以及单一用户点播所有节目的时长和次数,建立基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型;
所述偏好模型生成单元融合所述基于时间的用户兴趣偏好模型和所述基于频率的用户兴趣偏好模型,建立用户对节目的偏好模型;
所述偏好矩阵生成单元根据用户对节目的偏好模型建立用户偏好矩阵;
所述推荐单元根据所述用户偏好矩阵向用户推荐电视节目。
优选地,所述数据处理单元用于统一数据格式,将采集到的半结构化数据转换为结构化数据存储到数据库中,生成结构化的用户历史点播记录、结构化的节目基本属性记录和结构化的频道电子节目菜单并发送给时间/频率建模单元。
(三)有益效果
本发明提供了一种电视观众兴趣建模方法和系统,从节目集数、同一节目被各频道播放的总次数、全体用户点播同一个节目的平均时长和次数以及单一用户点播所有节目的时长和次数,建立一个新的用户兴趣偏好模型,能有效地反映用户兴趣偏好,提高推荐的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1表示本发明实施例所述电视观众兴趣建模方法的流程图;
图2表示本发明实施例所述电视观众兴趣建模系统的结构图;
图3表示本发明实施例基于时间的用户兴趣偏好建模方法示意图;
图4表示本发明实施例基于频率的用户兴趣偏好建模方法示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种电视观众兴趣建模方法,如图1所示,其包括如下步骤:
S1、通过电视采集系统获取点播节目数据并对所述数据进行处理;
根据所述处理后的数据生成用户历史点播记录、节目基本属性记录和频道电子节目菜单;
S2、根据所述用户历史点播记录、节目基本属性记录和频道电子节目菜单,统计同一节目被各频道播放的总次数、全体用户点播同一个节目的平均时长和次数以及单一用户点播所有节目的时长和次数,建立基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型;
S3、融合所述基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型,建立用户对节目的偏好模型;
S4、根据所述偏好模型建立用户偏好矩阵,进而根据所述用户偏好矩阵向用户推荐电视节目。
本发明另一个实施例还提出了一种电视观众兴趣建模系统,如图2所示,所述电视观众兴趣建模系统包括:
数据采集单元、数据处理单元、建模单元和推荐单元;
建模单元包括时间/频率建模单元,偏好模型生成单元,偏好矩阵生成单元;
时间/频率建模单元,用于建立基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型;
偏好模型生成单元,用于建立用户对节目的偏好模型;
偏好矩阵生成单元,用于建立用户偏好矩阵。
系统工作时,所述数据采集单元利用节目数据采集装置获取电视观众在点播节目过程中的用户历史记录数据、节目基本属性数据和频道电子节目菜单数据并发送给所述数据处理单元。
通过所述数据处理单元生成结构化的用户历史点播记录、结构化的节目基本属性记录和结构化的频道电子节目菜单。
所述时间/频率建模单元根据所述用户历史点播记录、节目基本属性记录和频道电子节目菜单,统计同一节目被各频道播放的总次数、全体用户点播同一个节目的平均时长和次数以及单一用户点播所有节目的时长和次数,建立基于时间的用户兴趣偏好模型和基于频率的用户兴趣偏好模型。
所述偏好模型生成单元融合所述基于时间的用户兴趣偏好模型和所述基于频率的用户兴趣偏好模型,建立用户对节目的偏好模型。
所述偏好矩阵生成单元根据用户对节目的偏好模型建立用户偏好矩阵。
所述推荐单元根据所述用户偏好矩阵向用户推荐电视节目。
优选地,所述数据处理单元用于统一数据格式,将采集到的半结构化数据转换为结构化数据存储到数据库中,生成结构化的用户历史点播记录、结构化的节目基本属性记录和结构化的频道电子节目菜单并发送给时间/频率建模单元。
需要说明的是:结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,是先有结构、再有数据。
半结构化数据是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分,是先有数据、再有结构。
本发明实施例提供了一种电视观众兴趣建模方法和系统,从节目集数、同一节目被各频道播放的总次数、全体用户点播同一个节目的平均时长和次数以及单一用户点播所有节目的时长和次数,建立一个新的用户兴趣偏好模型,能有效地反映用户兴趣偏好,提高推荐的准确度。
下面对各步骤进行详细描述。
优选,步骤S1包括如下步骤:
S11、利用基于IPTV的机顶盒平台获取电视观众在点播节目过程中的数据;
S12、根据所述数据,统一数据格式,并转换为结构化的数据存储到数据库中,生成结构化的用户历史点播记录、结构化的节目基本属性和结构化的频道电子节目菜单;
所述节目基本属性记录表示为:
Pj={vj,Fj,ptime(j)},
其中:
Pj表示节目vj的基本属性记录;
vj(1≤j≤N),vj表示第j个节目,N表示节目总数;
Fj表示节目vj的总集数;
ptime(j)表示节目vj单个集数的时长;
所述频道电子节目菜单表示为:
其中:
Gk表示频道ck的电子节目菜单;
ck(1≤k≤K),ck表示第k个频道,K表示频道总数;
vj(1≤j≤N),vj表示第j个节目,N表示节目总数;
表示节目vj的第s集,Fj表示节目vj的总集数;
stimej表示频道ck播放节目vj的开始时间;
etimej表示频道ck播放节目vj的结束时间。
所述用户历史点播记录表示为:
其中:
表示用户ui的第l条历史点播记录;
ui(1≤i≤M),ui表示第i位用户,M表示用户总数;
vj(1≤j≤N),vj表示第j个节目,N表示节目总数;
表示节目vj的第s集,Fj表示节目vj的总集数;
ck(1≤k≤K),ck表示第k个频道,K表示频道总数;
ctime(i,j,l)表示在第l条历史点播记录中用户ui点播节目vj的时长。
在具体实施时,这里的步骤S2中的基于时间的用户兴趣偏好模型可以通过多种方式实现,下面对其中一种实施方式进行具体介绍,如图3所示,所述的基于时间的用户兴趣偏好模型包括以下步骤:
A1、根据用户历史点播记录和节目基本属性记录Pj,得出用户对节目基础兴趣偏好Pij的表达式、基于节目的时间修正系数α1表达式和基于用户的时间修正系数β1表达式;
其中:
所述用户对节目基础兴趣偏好Pij的表达式为:
所述基于节目的时间修正系数α1表达式为:
所述基于用户的时间修正系数β1表达式为:
其中:
ctime(i,j,l)表示在第l条历史点播记录中用户ui点播节目vj的时长;
Dj表示点播节目vj的总用户数;
Di表示用户ui点播的节目总数;
表示用户ui点播节目vj的总次数;
ptime(j)表示节目vj单个集数的时长;
M表示用户总数;
N表示节目总数。
A2、根据所述用户对节目基础兴趣偏好Pij、所述基于节目的时间修正系数α1和所述基于用户的时间修正系数β1,得出所述基于时间的用户兴趣偏好模型为:
其中:
pi'j表示基于时间的用户ui对节目vj的兴趣偏好。
同样,在具体实施时,这里的步骤S2中的基于频率的用户兴趣偏好模型可以通过多种方式实现,下面对其中一种实施方式进行具体介绍,如图4所示,所述的基于频率的用户兴趣偏好模型包括以下步骤:
B1、根据用户历史点播记录和频道电子节目菜单Gk,得出用户点播同一个节目的总次数占各频道播放该节目的总次数的比例表达式、基于节目的频率修正系数α2的表达式和基于用户的频率修正系数β2的表达式;
其中:为了表述方便,用A表示所述用户点播同一个节目的总次数占各频道播放该节目的总次数的比例;
所述A表达式为:
其中:
表示用户ui点播节目vj的总次数;
表示频道ck播放节目vj的总次数;
K表示频道总数。
所述基于节目的频率修正系数α2的表达式为:
所述基于用户的频率修正系数β2的表达式为:
其中:
Dj表示点播节目vj的总用户数;
Di表示用户ui点播的节目总数;
表示用户ui点播节目vj的总次数;
M表示用户总数;
N表示节目总数。
B2、根据所述用户点播同一个节目的总次数占各频道播放该节目的总次数的比例A、所述基于节目的频率修正系数α2和所述基于用户的频率修正系数β2,得出基于频率的用户兴趣偏好模型为:
其中:
表示基于频率的用户ui对节目vj的兴趣偏好。
在步骤S3中,通过融合所述基于时间的用户兴趣偏好模型和所述基于频率的用户兴趣偏好模型,建立用户对节目的总体兴趣偏好模型为:
其中:
w1+w2=1;
其中:
rij表示用户对节目的总体兴趣偏好;
w1表示基于时间的用户兴趣偏好pi'j对总体兴趣偏好rij的影响权重;
w2表示基于频率的用户兴趣偏好对总体兴趣偏好rij的影响权重。
在步骤S4中,根据所述偏好模型建立用户偏好矩阵,进而根据所述用户偏好矩阵向用户推荐电视节目;
其中所述用户偏好矩阵表示为:
其中:
R={rij,i=1,2...M;j=1,2...N}
rij表示用户对节目的总体兴趣偏好。
综上,本发明实施例通过提供一种电视观众兴趣建模方法和系统,根据用户历史点播记录和节目基本属性记录Pj,得出用户对节目基础兴趣偏好Pij、基于节目的时间修正系数α1和基于用户的时间修正系数β1,再由所述Pij、所述α1和所述β1,得出所述基于时间的用户兴趣偏好模型;
同时,根据用户历史点播记录和频道电子节目菜单Gk,得出用户点播同一个节目的总次数占各频道播放该节目的总次数的比例表达式A、基于节目的频率修正系数α2和基于用户的频率修正系数β2;根据所述A、所述α2和所述β2,得出基于频率的用户兴趣偏好模型;
最后通过融合所述基于时间的用户兴趣偏好模型和所述基于频率的用户兴趣偏好模型,建立用户对节目的总体兴趣偏好模型,根据所述偏好模型建立用户偏好矩阵R,进而根据所述用户偏好矩阵R向用户推荐电视节目,此方法从全体用户点播同一个节目的平均时长和次数以及单一用户点播所有节目的时长和次数的方面调节用户对节目的偏好,能准确地向用户推荐电视节目信息。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
机译: 被配置为对感兴趣的地质体的地质构造进行建模的系统以及用于对感兴趣的地质体的地质构造进行计算机建模的方法
机译: 基于Web挖掘的上下文知识提取设备,可通过对整个Web内容分析的兴趣进行建模来构造数据,该方法和使用该方法的上下文感知移动广告系统
机译: 定义基于建模和仿真的空间计划的兴趣区域的结构设计系统和方法