信息检索包括信息的存储和查找这两个过程,它们的实现有赖于检索工具(系统)的存在。信息存储是编制检索工具(创建检索系统)的过程;信息查找是利用检索工具查找出与课题需要的有关文献资料的过程。所以任何检索工具都具有存储文献和查找文献两方面的职能。存储是检索的基础,而检索是存储的目的,两者相辅相成,互为依存。文献检索的核心就是要使检索词在文献的存储与查找这两个过程中所采用的特征标识达到一致。信息检索的基本原理如图1-1 所示。
图1-1 信息检索基本原理示意图
从图1-1 可见,在信息存储过程中,首先要对纳入检索工具中的每一篇文献的各种特征进行主题分析,找出若干个能代表文献内容的主要概念,并用文献检索语言对其加以标引,形成文献特征标识(如分类号、著者姓名、主题词等);然后将有关的文献特征标识著录下来,形成一条文献条目(记录);最后将所有的文献条目再按一定的规则排序,从而形成了具有检索功能的检索工具。
在信息查找过程中,首先要对所检课题进行主题分析,使之形成若干个能代表课题需要的主题概念;然后把这些主题概念转换成文献存储过程中所使用的检索语言,形成检索提问标识;最后利用这些检索提问标识到检索工具中去查找相关的文献。
由此可知,信息的查找过程是与存储过程相对应的逆过程,而连接这两个过程的纽带就是文献检索语言。信息检索的基本原理就是将检索提问标识与存储在检索工具中的文献特征标识进行比较,结果凡是文献特征标识与检索提问标识相一致,或者前者包含了后者,或者符合某些检索规则,那么,具有这些文献特征标识的文献就从检索工具中显示出来,它与检索课题所需要的文献大致相符,最后通过一定的方式去获取原始文献。