下载此beplayapp体育下载

基于图的查询日志实体别名抽取方法.pdf


beplayapp体育下载分类:bepaly下载苹果 | 页数:约8页 举报非法beplayapp体育下载有奖
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该beplayapp体育下载所得收入归上传者、原创者。
  • 3.下载的beplayapp体育下载,不会出现我们的网址水印。
1 / 8 下载此beplayapp体育下载
beplayapp体育下载列表 beplayapp体育下载介绍
万方数据
万方数据
中。叭巳送钡牟檠钩傻募稀记录的子集——候选查询集合!:蜓〔檠鹈钩傻牟檠驮钩傻牟檠用户点击到同一链接。对于查询“人人网地址”,其指向的链接为“://畆甤”。对于查询“校内网地址”,其指向的链接也为“://因此,利用这两类特征,本文提出了基于图的查询日志别名抽取算法,框架如图尽抽取候选查询集合实验中查询日志包含冗余查询,数据量大,因此在别名抽取前需要对查询日志进行过滤,得到查询是有可能包含原名和别名的查询所构成的集合。我们的假设是,包含别名的查询和包含原名的查询至少指向一条共同的点击链接。基于此假设,抽取“人人网”的候选查询集合5牟街枞缦隆将“人人网”和查询日志中的查询逐条匹配。如果“人人网”是查询淖哟蚪ā畄加入集合对V械拿恳桓霾檠痲,获得它对应的点击链接每一个查询对应的点击链接可能有多个将尤肓唇蛹螩。中。对V械拿恳惶趿唇觕,获得杂Φ牟檠玵尤牒蜓〔檠螿。中。如图荆颐抢昧瞬檠涣唇有畔ⅲ了候选查询集合!。中的查询有可能包含别名。二层图构建在获取候选查询集合螅颐切枰3槿〕V械牟檠谋鹈⒍云渑判颉T诖瞬街中,本文首先构建别名候选图层,然后构建查询链接图层,然后将这两个图层进行链接,得到二层图。最后采用随机游走算法进行排序,得到最终结果。.鹈蜓⊥疾愕墓菇我们观察到对于原名和别名,它们很可能共享相同的上下文。我们的假设是,如果一个查询和包含原名的查询有相同的上下文,那么这个查询可能包含别名。在得到候选查询集合:螅疚氖褂没于模板的惴ㄉ别名一模板对和0逡槐鹈对,然后构建别名候选图层。构建过程如下。将原名尤朊螻中。将模板池置空。分析V械拿扛霾檠痲,若械脑K豱,则抽取咒的上下文,生成模板伽。其中,在木涫缀途湮蔡砑印”和“痵北签作为开始标记和结束标记。例如,对于原名“人人网”,如果写嬖诓檠叭巳送滓场保蛏赡0“首页痵薄=0褰屑尤肽0宄豔中,同时记录鹈荒0关系。为提高模板的石贝等:基于图的查询日志实体别名抽取方法图谕嫉牟檠罩颈鹈槿∷惴ǹ蚣图叭巳送焙蜓〔檠系纳晒畆瓹”。
万方数据
有效性,减少随机事件的影响,本文在这一阶段过滤掉模板池中只出现过一次的模板。依次取出模板池械哪0逍弧6杂赒,中的每一条查询魆匹配模板∞,则抽取出候选别名口,并将尤隢中,同时记录0逡槐鹈关重复第胶偷步,直至没有新的元素加入小利用上述步骤得到的鹈荒0对和板~别名裕约螻和菇ǘ滞肌6悦一个鹈0对和0逡槐鹈对,在图中添加相应的边来连接对应的别名节点和模板节点。如图尽.檠唇油疾愕墓菇为了验证使用查询日志进行别名抽取的有效性,我们对查询日志进行分析。我们抽取出查询日志中某些唇佣杂Φ牟檠吹慊鞔问行排序,如表尽畇甤./”,其对应的查询叭巳送焙““”和“新浪网”ノ1鹈R虼耍们得到假设:对于同一个链接,如果它和几个查询有很强的关联,那么这几个查询很可能包含同一实体对应的别名。利用此假设,我们构建查询链接图层的步骤如下。对械拿恳桓霾檠痝,将尤氩檠唇图层中,同时将杂Φ牧唇覼作为节点加入图层中,并添加边,。对新添加的绻嬖趜对应的查询在图层中,则将查询砑拥酵疾阒校碧砑颖重复上述两步,直至没有新的边和节点加入此二分图中,则构建出如图镜牟檠唇油疾恪.阃脊菇在构建别名候选图层和查询链接图层后,我们构建一个二层图。如图荆喜阄9菇ê玫谋名候选图层,一珽。是节点集合,包括原名蜓”鹈诤桶П鹈哪0逖怠边钉,,冢

基于图的查询日志实体别名抽取方法 来自beplayapp体育下载www.apt-nc.com转载请标明出处.

相关beplayapp体育下载 更多>>
非法内容举报中心
beplayapp体育下载信息
  • 页数8
  • 收藏数0收藏
  • 顶次数0
  • 上传人755273190
  • 文件大小457 KB
  • 时间2021-03-14