商品介绍
内容简介
本书是对信息检索领域基本理论、主要技术和应用方法的系统介绍和阐述。全书共分11章:信息检索概述;信息检索的数学模型;信息检索系统及其构成;文本信息检索技术与方法;多媒体信息检索技术与方法;web 与网络搜索引擎;信息检索评价研究;文本信息处理自动化技术;信息检索的基本方法与步骤;常用数据库及国际联机检索服务系统;常用网络搜索引擎服务系统。每章后面都提供了思考与练习题。另外,书后还附有主要参考文献列表和重要名词术语索引表。全书内容新颖丰富,资料翔实,概念清晰,分析阐述系统深入。
本书可作为高等院校信息管理与信息系统专业、计算机科学技术专业、情报学专业、图书馆学专业学生的教材或教学参考书,也可供各类信息中心、情报研究所、图书馆等机构工作人员以及广大信息用户学习参考。
作者简介
赵丹群,女,1966年生,管理学博士,北京大学信息管理系副教授。主要从事信息检索、信息计量学领域的教学和研究工作,主讲“信息存储与检索”、“算法与数据结构”、“信息计量学”等多门本科与研究生课程,主编、参编相关著作和教材10部,独立发表学术论文20余篇。曾多次获得北京大学优秀教学成果奖励。
目录
第一章 信息检索概述
1.1 信息检索的基本概念
1.2 信息检索的基本原理
1.3 信息检索的研究对象与研究方法
1.3.1 主要研究问题
1.3.2 相关学科及领域
1.4 信息检索的发展历史
1.4.1 手工检索时期
1.4.2 计算机化检索时期
1.4.3 网络化检索时期
思考与练习题
第二章 信息检索的数学模型
2.1 信息检索系统的形式化表示
2.2 集合论检索模型
2.2.1 布尔检索模型
2.2.2 模糊集合模型
2.2.3 扩展布尔模型
2.3 代数论检索模型
2.3.1 向量空间模型
2.3.2 潜在语义索引模型
2.3.3 神经网络模型
2.4 概率论检索模型
2.4.1 经典概率模型
2.4.2 基于Bayesian网络的检索模型
2.5 其他信息检索模型与数学理论
2.5.1 结构化检索模型
2.5.2 浏览模型
2.5.3 其他新型数学理论
思考与练习题
第三章 信息检索系统及其构成
第四章 文本信息检索技术与方法
第五章 多媒体信息检索技术与方法
第六章 Web与网络搜索引擎
第七章 信息检索评价研究
第八章 文本信息处理自动化技术
第九章 信息检索的基本方法与步骤
第十章 常用数据库及国际联机检索服务系统
第十一章 常用网络搜索引擎服务系统
主要参考文献和网络信息源
重要名词术语索引
免费试读(部分内容)
第一章 信息检索概述
1.1 信息检索的基本概念
在人类社会的发展过程中,信息检索(Information Retrieval,简称IR)的实践活动由来已久,但作为一个比较规范、正式的学术术语,它最早由美国学者穆尔斯(C.W.Mooers)在l949年提出并使用。近年来,随着人类社会信息环境的数字化、网络化进程日益加快,以及各类信息资源的爆炸性增长,“信息检索”这一学术名词逐渐变得流行起来,并被越来越多的社会成员所认识、了解和使用。那么,信息检索概念的准确含义是怎样的呢?
所谓“信息检索”,广义地说,是“信息存储与检索”(Information Storage and Retrieval),它是指将信息按照一定的方式组织和存储起来,并能根据用户的需要找出其中相关信息的过程。因此,从本质上讲,信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。对于“存”来说,主要指面向来自各种渠道的大量甚至海量信息资源而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找,并且尤其强调查找的快速与便利。这里,具体的存储载体可以选择卡片、书本、磁带/磁盘、光盘等;存储的内容可以是文献的书目信息、文摘或全文,也可以是图像、音频或视频的数字化信息;而具体的查找途径因存储信息类型的不同而不同,较为常见的有文献的作者、题名、主题或分类号码,图像颜色,物体形状,音乐的节奏或旋律,等等。
作为一种有目的和组织化的信息存取活动,信息检索中的“存”与“取”之间存在着密不可分的关系。首先,两者是相互依存的:不存储无从检索,不检索存储将失去意义;其次,两者又是互相矛盾和制约的:从存储的角度看,越简单越好,但过于简单的存储,势必影响到检索的质量与效率,即有效的检索需要以增加存储的代价作为前提。信息检索中“存”与“取”之间的这种互动关系在实际检索系统的开发与设计中,需要给予某种合理化的兼顾与平衡。
在通常情况下,大多数人讲到“信息检索”时,一般只涉及“取”,即主要关注如何从存储的信息集合中快速获取各种需要的信息。这时,信息检索也可以称为“信息查询”或“信息查找”(Information Search)。这是对信息检索概念的一种狭义理解。
……