第1章 绪论
本章主要介绍了与个性化搜索引擎相关的基本技术内容,主要包括Web信息检索、Web挖掘和Web个性化信息**服务等。
1.1 Web信息检索
随着互联网技术的快速发展,网络信息资源呈现一种爆炸式的增长态势,比如在2005年,Google搜索引擎能够遍历到的Web网页数量就已经达到近60亿。这些网络信息资源在给人们带来丰富知识和极大便利的同时,也暴露出一些亟待解决的问题。其中,*主要的问题表现在这种信息资源的增长速度远远超出了人们能够处理它们的能力,动辄千万吉的信息量让用户实际上难以获取所需的有效信息,更难以对收集来的海量信息进行分析和获取知识。奈斯比特在《大趋势》一书中准确形容了人们目前所处的困境,即信息是丰富的,而知识是贫乏的。
针对上述特点,人们在传统信息检索系统的基础上开发出新的Web信息检索系统,典型的系统就是搜索引擎。自从1994年问世以来,搜索引擎逐渐成为人们获取网络信息资源的主要方式,相关搜索引擎网站也是Web用户使用网络时**的访问站点。另外,它和免费电子邮箱、网络实时通信软件构成了当今门户网站用来吸引用户访问的三种主要方式。现在,相关搜索引擎厂商日益成为促进互联网产业发展的重要力量。
1.1.1 Web信息检索模型
广义的信息检索是指信息用户为处理和解决各种问题而查找、识别、获取相关的事实、数据、文献的活动及过程,而狭义的信息检索主要是指信息用户在计算机信息检索系统上进行的信息查询行为。具体的计算机检索行为包含脱机批处理检索、联机检索、光盘检索和网络化联机检索。Web信息检索是一种网络化的联机检索,它的检索对象就是互联网上的Web资源。
……