查询服务主要工作
查询服务是搜索引擎和用户离得最近的一个模块。在这个模块中主要完成了以下3个工作:
5、 查询匹配
搜索引擎会将用户输入的语句进行分词,并且提取出有意义的查询关键词,然后返回网页中包含有这些关键词的网页。
例如下图,虽然用户查询的是“搜索引擎的原理”,但是搜索引擎会对这个查询进行分词,分成“搜索引擎”、“的”、“原理”三个词,然后删除没有意义的“的”,接着找出和“搜索引擎”、“原理”匹配的网页进行组合生成结果页面。
6、排序结果
预处理中为每个网页形成了一个独立二查询词的重要性指标,将这个指标和查询过程中的相关性指标结合形成最终排序结果,是搜索引擎给出查询排序结果的主要方法。
7、 文档摘要
一般的搜索引擎采用“动态摘要”的方式生成摘要,即在相应查询的时候根据查询词在文档中的位置,提取出周围的文字,在显示时将查询词标亮。
以上就是搜索引擎查询服务的简介,不难看出查询服务还需要一些细节的支持,例如中文自动摘要、搜索结果页的生成等等技术。
评论