用户搜索意图引导下的Web网页动态泛化

2022-09-11

目前, 相关用户搜索意图研究主要包括两个方面。第一个方面为使搜索引擎具有良好交互功能, 显性或者隐性的得到用户意图。第二个方面就是精准实现用户意图分类。但是搜索引擎主要目的是针对不同搜索意图提供针对性信息, 其中用户意图的获得及分类只是手段, 目前研究大部分都是用户意图自身, 并不是如何对此意图进行满足。那么本文就分析基于用户搜索意图的web网页动态泛化, 以此能够返回和搜索意图相关结果。

一、问题描述

用户对搜索引擎提交关键词kw之后, 搜索引擎返回到文档集合。假设S指的是返回结果文档, 也就是S={s 1, s2, ...si, ..., sm}, 其中文档主要包括标题、文档片段及超链接。超链接URL能够得到每个si的内容, 并且得到格式及类型。将web网页的内容、格式、文档片段及类型、关键词表述成为概念层次图[1], 详见图1:

对于图1, 基于概念下降角度分析, 假如使用第i层概念搜索, 那么返回结果就是Si, 使用第i+1层概念搜索, 返回结果就是Si+1。在此种情况中, 假如用户选择第i层概念, 之后选择第i+1层概念, 之后使用i+2层概念, 那么此选择不仅会使结果越来越少, 还会越来越接近用户需求。基于概念提升角度分析, 在返回文档片段中使用关键词也能够返回到全新关键词列表中, 从而使信息型意图需求得到满足。在返回文档片段中抽取文档格式, 也鞥能够返回格式列表, 以此使事务型意图得到满足。所以, 概念提升结果能够为用户提供搜索导航, 概念下降能够使搜索结构和用户意图越来越接近[2]。

二、数据泛化模型

数据泛化指的是使低层次概念通过高层次概念相互置换的数据技术, 此种数据能够为用户提供全面考察数据途径。以上文分析搜索意图信息和意图关系比欧式, 对于搜索引擎返回web网页动态创建模型, 然后利用网页内容和格式等泛化提供搜搜意图导航, 之后最后满足用户不同意图需求, 此属于有效解决途径。泛化模型主要包括:其一, 内容泛化。主要指的是为用户提供关键词列表, 利用关键词能够精准描述返回结果, 从而使信息型意图得到满足;其二, 格式泛化。此种泛化主要目的为提供格式列表, 列表中主要包括返回结果文档格式, 从而使事务型意图得到满足;其三, 类型泛化。主要目的就是为广大用户提供导航型列表, 其中主要包括全部返回结果, 从而使导航型意图得到满足;其四, 上述描述三种意图关系和列表, 提供全新关键词和格式等实现下一步选择, 也就是搜索导航, 从而能够有效获得用户意图, 并且还能够返回与此意图相关结果[3]。图2为不同意图信息的需求和实现。

三、用户搜索意图获得方法的讨论

本文分析web网页泛化模型是将用户搜索意图为基础创建的, 但是在实现过程中并不是直接获得用户意图, 指的是在用户将初始搜索关键字提交的相应结果中, 利用文档格式、网页内容及导航类型泛化, 从而为不同搜索意图提供深入搜索导航, 从而选择用户, 使其得到相应搜索结果。目前, 相关用户兴趣及搜索引擎研究提出了多种方法, 此方法主要包括两种, 分别为:第一种, 对用户信息自动收集, 以此信息隐式实现用户意图分类, 也就是隐式方法。第二种, 显式给出搜索类别, 使用户进行选择, 此为显式方法。本文所提出的方法不需要创建用户模型, 也不需要和用户直接交互, 不需要大规模的数据集, 以返回结果就能够对网页模型自动刚更新。尤其是在和用户直接交互的过程中, 能够利用导航信息隐式得到用户搜索意图, 并且能够使此意图结果得到满足, 其中的导航信息与结果在文档内容变化过程中而变化。此只是考虑网页内容、导航类型及文档格式的泛化和现代泛化方法, 对导航型、信息型及事务型搜索意图方面具有一定的问题。所以, 在今后研究过程中, 要对搜索意图进行深入的细化, 对其中的信息需求进行全面的分析, 从而提供相应搜索结果[4]。

四、结束语

目前, 获得用户意图和实现用户意图分类属于主要研究问题。为了能够使用户搜索意图得到有效的满足, 在今后工作过程中可以通过以下方面实现:其一, 实现全新用户意图搜索, 从而对传统web网页动态泛化研究中的问题进行改进;其二, 完善文档特征抽取方法, 转百年简单单词搜索, 使其成为短语抽取, 从而使抽取过程融合全新领域知识;其三, 实现网页格式泛化结果细化;其四, 实现搜索内容的全面研究;其五, 使用大量搜索评价方法, 从而提高泛化模型评价的全面性, 完善其中不足。

摘要:基于搜索情况对每位用户搜索信息需求进行分析, 从而提出了基于用户搜索意图的web网页动态化模型, 主要目的就是对web网络动态化创建模型关键词及文档格式层次进行搜索, 以此以用户访问提供搜索导航, 但是并不是为了得到用户搜索意图, 而是创建用户搜索意图中web网页泛化。基于此, 本文对用户搜索意图引导web网页动态泛化进行分析。

关键词:用户搜索意图,web网页,动态泛化

参考文献

[1] 王亚辉.用户搜索意图视角下的Web网页动态泛化研究[J].信息通信, 2014 (12) :108-109.

[2] 林满佳.抵御加密Web流量分析的流量泛化技术[D].广州:广州大学, 2016.

[3] 张杨浩.基于搜索引擎日志的查询意图分类研究[D].重庆:西南大学, 2016.

[4] 王海涛.面向Web信息抽取的网页自动浏览导航与集成规则研究[D].南京:南京大学, 2014.

上一篇:化工热力学焓变熵变典型习题的解法讨论下一篇:小切口治疗95例阑尾炎的临床体会