首页> 中国专利> 基于个别网站的历史查询对新的查询进行转换的方法

基于个别网站的历史查询对新的查询进行转换的方法

摘要

本发明揭示了一种基于个别网站的历史查询对新的查询进行转换的方法。每个特定网站有自己的内容偏好和自己的用户群。当用户在某个网站进行查询,该查询与多数情况与该网站内容相关。本发明利用在该网站的历史搜索信息对可能有歧义的原始查询进行转换。之后基于该替代查询在广告引擎中进行搜索,再将搜索到的广告返回给用户,从而使得真正用于广告搜索的查询项与该网站的目标业务更加匹配,同时使得广告结果与用户的搜索意图更匹配。

著录项

  • 公开/公告号CN103136310A

    专利类型发明专利

  • 公开/公告日2013-06-05

    原文格式PDF

  • 申请/专利权人 微软公司;

    申请/专利号CN201110413826.7

  • 申请日2011-12-02

  • 分类号G06F17/30;

  • 代理机构上海专利商标事务所有限公司;

  • 代理人陆嘉

  • 地址 美国华盛顿州

  • 入库时间 2024-02-19 19:15:47

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-11-28

    授权

    授权

  • 2015-08-19

    专利申请权的转移 IPC(主分类):G06F17/30 变更前: 变更后: 登记生效日:20150727 申请日:20111202

    专利申请权、专利权的转移

  • 2014-12-31

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20111202

    实质审查的生效

  • 2013-06-05

    公开

    公开

说明书

技术领域

本发明涉及广告搜索技术,更具体地说,涉及在网站联盟(syndication network)中根据特定网站的信息对原始查询进行转换的技术。 

背景技术

商业广告引擎(比如bing,google)通常给很多其他的网站提供广告支持,这些网站拥有各自的页面、搜索输入界面及搜索引擎,但在进行后台搜索时,使用的是同一个广告引擎。当用户在某个网站进行搜索时,该网站返回两类结果:一类是搜索结果,由网站自身提供或者第三方搜索引擎提供;另一类是广告结果,由网站联盟的广告引擎提供。 

不同的网站具有不同的主题倾向和目标业务,因此对广告引擎提供的广告的喜好程度也不相同,网站会希望将与自己最为关注的目标业务相关的广告排列在靠前的位置,这样这些广告更有可能被用户点击,而用户的点击能够给网站带来收益。点击与自己最为关注的目标业务相关的广告的数量越多,网站得到的收益也就越高。 

在现有的网站联盟中,各个网站已经将共用的广告引擎提供的广告结果根据自己的目标业务进行了一定的处理。比如,网站“jobs。yahoo.com”与“bing”共用广告引擎,但两者的目标业务是不同的。“jobs.yahoo.com”的目标业务是工作机会和职业广告,而“bing”的目标业务是通用搜索引擎。于是,如果在这网站的网页上一同样的关键字进行搜索,得到的搜索结果是不同的,相应的,广告结果也应该不同。 

比如,同样在“jobs.yahoo.com”与“bing”中输入“computer”进行搜索,得到不同的搜索结果。 

“jobs.yahoo.com”对于“computer”的搜索结果中排列靠前的搜索结果都与工作职位相关,这是由于“jobs.yahoo.com”自身的特性而造成的。由于“jobs.yahoo.com”是一家以工作职位为目标业务的网站,用户期望看到 和工作职位相关的搜索结果和广告结果,他们只会点击和工作职位相关的网页或广告,而只有广告才能够为“jobs.yahoo.com”带来收益;用户不会点击与工作职位无关的广告,因此不能够为“jobs.yahoo.com”带来收益。 

“bing”对于“computer”的搜索结果中有关于计算机产品销售的网页占据了搜索结果的靠前位置。“bing”的目标业务是通用搜索引擎,其收益模式与类似于“jobs.yahoo.com”这样的专业网站不同,因此“bing”会选择对其收益最为有利的广告结果,这些广告结果与“jobs.yahoo.com”的结果有很大的不同。 

对于使用共用的广告引擎的网站联盟中的网站来说,需要从广告引擎反馈的广告结果中选择符合自己目标业务的广告,这样才能有效的提高点击率,提高收益。目前虽然已经对广告结果有了一些处理,但这些处理并非具有很高的效率和很好的适用性。在一些关键字的搜索中,这些处理能够达到一定的效果,但在相当多的关键字的处理中,目前的方案无法达到有效的处理,对于特定的网站来说,依旧会在其网页上将于自身目标业务无关的广告排列在靠前的位置。 

发明内容

本发明旨在提出一种能够基于网站联盟中的特定网站的历史查询对新的查询进行转换的方法从而提供更加准确的广告搜索结果的方法。 

在一个实施例中,本发明揭示了一种基于个别网站的历史查询对新的查询进行转换的方法。该方法首先在网站联盟中的一个个别网站接收用户的原始查询,该网站联盟包含数个独立的网站而该原始查询与该网站的主题相关。之后该方法从该网站获取所有用户的历史搜索信息,基于该历史搜索信息对所述原始查询进行转换,得到经转换的替代查询。最后基于该替代查询在广告引擎中进行搜索,将搜索到的广告显示给用户。 

在一个实施例中,本发明揭示了一种基于个别网站的历史查询对新的查询进行转换的方法。该方法首先在网站联盟中的一个个别的网站接收原始查询,该网站联盟包含数个独立的网站而该原始查询与该网站的主题相关。然后该方法从该网站获取所有用户在过去一段时间内的和原始查询相 关的倾向查询项。将该倾向查询项合并到原始查询中,得到经转换的替代查询。最后基于该替代查询在广告引擎中进行搜索并将搜索到的广告显示给用户。 

在一个实施例中,本发明揭示了一种基于个别网站的历史查询对新的查询进行转换的方法。该方法首先在网站联盟中的一个个别的网站接收原始查询,该网站联盟包含数个独立的网站而该原始查询与该网站的主题相关。然后从该网站获取候选查询并对候选查询进行筛选,该筛选是基于候选查询与原始查询的属性比对和相似度、以及候选查询的使用频率而进行,筛选得到与原始查询匹配的候选查询。使用该匹配的候选查询替换所述原始查询,得到经转换的替代查询。最后基于该替代查询在广告引擎中进行搜索并将搜索到的广告显示给用户。 

本发明能够针对网站联盟中特定网站的特性和历史数据对查询项进行针对性地转换,使得真正用于广告搜索的查询项与网站的目标业务更加匹配,从而获得更加具有价值的广告搜索结果。 

附图说明

本发明的上述的以及其他的特征、性质和优势将通过下面结合附图和实施例的描述而变得更加明显,在附图中,相同的附图标记始终表示相同的特征,其中: 

图1揭示了根据本发明的第一实施例的基于个别网站的历史查询对新的查询进行转换的方法的流程图。 

图2揭示了根据本发明的第二实施例的基于个别网站的历史查询对新的查询进行转换的方法的流程图。 

图3揭示了根据本发明的第三实施例的基于个别网站的历史查询对新的查询进行转换的方法的流程图。 

具体实施方式

本发明提出一种基于个别网站的历史查询对新的查询进行转换的方法。图1揭示了根据本发明的第一实施例的方法的流程图。本发明的主要 思想是:当网站联盟中的一个特定的网站接收到一个原始查询,比如用户登陆到该网站的网页上并输入了一个查询后,对该网站进行分析,从该网站处获得与其目标业务相关的信息。这些信息将被用于对原始查询进行转换,转换的过程是将与该网站的目标业务相关的比重增加,得到一个与网站的目标业务更加匹配的查询。在使用广告引擎进行搜索时,将使用转换后的查询项,这样得到的搜索结果与网站的目标业务更加相关。 

该方法适用于具有任何有特别业务特征的网站。参考图1所示,该方法100包括: 

102.在网站联盟中的一个个别网站接收用户的原始查询。该网站联盟包含数个独立的,具有各自的业务特征的网站,而该原始查询与该特定的网站相关。步骤102的一个实现方式是:用户在特定网站上输入查询进行搜索,就认为是输入了一个与该网站相关的原始查询。举一个例子说明,用户登陆到“jobs.yahoo.com”并输入了“computer”,则认为是用户输入了一个与“jobs.yahoo.com”相关的原始查询,该原始查询是“computer”。 

104.从该网站获取所有用户的历史搜索信息,基于该历史搜索信息对所述原始查询进行转换,得到经转换的替代查询。历史搜索信息与该特定的网站相关,通常来自于该特定的网站的历史数据,比如该网站曾经使用过的历史查询、得到的历史搜索结果、浏览的历史网页等等。该历史搜索信息具有两种使用的形式:一种方式是将历史搜索信息合并到原始查询中,得到经转换的替代查询,在这种方式中,历史搜索信息是一个倾向查询项。第二实施例涉及这种方式。另一种方式是使用历史搜索信息来替换原始查询,作为替代查询,在这种方式中,历史搜索信息也是一个查询,第三实施例涉及这种方式。 

106.基于该替代查询在广告引擎中进行搜索,将搜索到的广告显示给用户。 

图2揭示了根据本发明的第二实施例的方法,该方法200中,历史搜索信息是倾向查询项的形式,倾向查询项被合并到原始查询中。如图2所示,该方法200包括: 

202.在网站联盟中的一个个别的网站接收原始查询。该网站联盟包 含数个独立的网站,该原始查询与该网站的主题相关。步骤202与步骤102类似,此处不再重复描述。 

204.从该网站获取所有用户在过去一段时间内的和原始查询相关的倾向查询项。倾向查询项的获取方式有如下的两种: 

1)从该特定的网站的历史查询中获取倾向查询项。比如在该特定的网站的历史查询中搜索出现频率最高的查询项作为倾向查询项。再次参考前面所举的在“jobs.yahoo.com”上输入“computer”的例子,倾向查询项是从网站,即“jobs.yahoo.com”中分析得到,分析“jobs.yahoo.com”的历史查询记录,即所有在“jobs.yahoo.com”上输入的查询的记录,发现其中出现频率最高的查询项,或者说关键字是“job”,于是就将“job”选择为倾向查询项。 

2)从该特定的网站搜索的网页中获取倾向查询项。比如在该特定的网站搜索的网页中搜索出现频率最高的查询项作为倾向查询项。还是参考所举的在“jobs.yahoo.com”的例子,对通过“jobs.yahoo.com”进行的查询而搜索到的搜索结果,或者说网页进行分析,查找在这些网页上出现过的频率最高的查询项,发现是“job”,于是“job”就被选择作为倾向查询项。 

206.将该倾向查询项合并到原始查询中,得到经转换的替代查询。对于倾向查询项来说,其被视为是对于原始查询的一种额外的查询条件,以提高查询的准确率。倾向查询项将于原始查询合并而得到替代查询。比如,在前面所举的例子中,通过“jobs.yahoo.com”而输入的原始查询“computer”与倾向查询项“job”合并得到转换后的替代查询“computer+job”。 

208.基于该替代查询在广告引擎中进行搜索,将搜索到的广告显示给用户。 

图3揭示了根据本发明的第三实施例的方法,该方法300中,历史搜索信息也是一个查询并被用于替换原始查询。如图3所示,该方法300包括: 

302.在网站联盟中的一个个别的网站接收原始查询。该网站联盟包含数个独立的网站,该原始查询与该网站的主题相关。步骤302与步骤102以及步骤202类似,此处不再重复描述。 

304.从该网站获取候选查询。候选查询是从该指定的网站的历史查询中获得,为了确保候选查询与原始查询的关联性,候选查询与原始查询具有至少一个相同的查询项。再以通过“jobs.yahoo.com”而输入的查询“computer”为例,原始查询为“computer”,在“jobs.yahoo.com”的历史查询中,选择与原始查询具有至少一个相同的查询项,即所有包含查询项“computer”的查询作为候选查询。在此处,查询项是指查询中的一个字节,或者,对于文字查询来说,一个查询项指一个单词。更加具体地,查询项是汉语中的一个字或者英语中的一个单词。 

306.对候选查询进行筛选,该筛选是基于候选查询与原始查询的属性比对和相似度、以及候选查询的使用频率而进行,筛选得到与原始查询匹配的候选查询。对于候选查询的筛选包括三个方面的考虑: 

1)与原始查询在属性上的相符合程度; 

2)与原始查询的相似度; 

3)候选查询的使用频率。 

针对上述三个方面的考虑,提出了如下的限制条件: 

第一条限制条件是针对候选查询与原始查询的属性比对,候选查询与原始查询都是有一组查询项组成,每一个查询项被认为是一个字节(term),对于文字查询来说,一个查询项就是一个单词,比如对于“computer device”这个查询来说,认为其具有两个查询项(两个字节),分别为“computer”和“device”,该查询的字节长度为2。第一条限制条件要求候选查询与原始查询之间具有不超过下述一项的差异: 

候选查询与原始查询具有相同的字节(term)长度以及一项不同的查询项; 

候选查询比原始查询少一个字节; 

候选查询比原始查询多一个字节。 

第二条限制条件针对候选查询与原始查询的相似度的比对,该比对是依据倒置文本频率(IDF)而进行。具体而言,包括: 

计算候选查询与原始查询的倒置文本频率(IDF)。对于来自给定的网站的给定的查询项的文本频率(DF),是指在一段时间内盖查询项的搜索 频率,而倒置文本频率(IDF)可以计算如下: 

IDF(t)=log(maxDFDF(t))

其中maxDF是具有最高搜索频率的查询项的搜索频率。 

然后基于倒置文本频率计算候选查询与原始查询的相似度。设qi和qj为两个查询,比如原始查询和候选查询,则这两个查询qi和qj之间的相似度被计算为: 

S(qi,qj)=S1S1+S2

其中S1和S2分别为原始查询和候选查询的倒置文本频率。 

然后筛选相似度大于预定门限的候选查询,第二条限制条件要求原始查询和候选查询之间的相似度高于一个设定的阈值,该阈值可以根据应用的要求而进行调整。 

第三条限制条件是针对候选查询的使用频率的限制条件。可以预见到,符合第一条限制条件和第二条限制条件的候选查询会不止一个,于是,第三条限制条件对候选查询的使用频率进行了限制。一般会在符合第一条和第二条的限制条件的候选查询中选择具有最高的使用频率的候选查询。作为一种实现,可以选择具有最高点击率的候选查询。 

第一条限制条件和第二条限制条件可以确保候选查询与原始查询之间的语义相似程度,在符合用户查询要求的情况下尽可能体现网站的特性。而第三条限制条件确保候选查询的被使用频率,通常使用频率高的查询能够得到更多的搜索结果,也能创造更好的收益。 

308.使用该匹配的候选查询替换原始查询,得到经转换的替代查询。 

310.基于该替代查询在广告引擎中进行搜索,将搜索到的广告显示给用户。 

本发明能够针对网站联盟中特定网站的特性和历史数据对查询项进行针对性地转换,使得真正用于广告搜索的查询项与网站的目标业务更加匹配,从而获得更加具有价值的广告搜索结果。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号