档案文献检索串讲资料

来源:百度文库 编辑:神马文学网 时间:2024/05/23 13:56:43
[推荐]档案文献检索串讲资料 提供人:youyou0615
第一章 档案文献检索系统概述
1. 广义的档案文献检索包括存储和查找两个具体过程。前者是指将档案中具有检索意义的特征标识出来,通过编制检索工具、建立数据库等方法使之成为有序的档案信息集合的过程;后者则是指在档案信息集合中选择、获取特定档案信息的过程。
2. 简答档案文献检索的基本原理:是实现档案需求与相关档案信息的匹配,即将特定的档案需求与存储在检索系统中的档案信息进行相符性比较,根据一定标准从中选择出符合需求的档案信息。匹配的实现是存储和查找互相作用的结果。
3.存储阶段的目的是:使档案信息达到高度的组织化。主要采取对档案文献进行标识化压缩处理的方法,即把档案文献中具有检索意义的特征用语词、代码等符号表示出来,通过编目、编写提要等方式将档案原件转换成一种篇幅较短的特殊文献形式,一般成为简短记录档案文献特征的一个条目,并按照一定的规则把这些条目组织起来,形成有序的档案信息集合,供查找之用。
4. 查找阶段的目的:是获取所需档案信息,主要方法是对档案需求课题进行标识化处理,形成检索提问,再将提问标识与档案信息集合中的标识进行相符性比较,选择出所需要的档案信息,也就是说,在存储的逆过程中把所需档案查找出来。(3、4题可合并一题)
5. 档案文献检索同其他文献检索一样,可以采取三种形式:
(1) 数据检索。这种检索是直接回答利用者所需要的有关特定主题的查询,检索出的结果是数据、公式、图表等。
(2) 事实检索。这种检索也是直接回答利用者所需特定主题的确定性检索,检索出的结果是某种事实。
(3) 文献检索。这种检索是要查出记载所需信息的档案文献,但检索结果所提供的并不是文献本身,而是文献线索,检索人员借助文献线索中提供的存址提取档案文献,再从文献中获得所需信息。
6. 试述档案文献检索系统的构成与功能?
从检索系统的整体功能出发,去设计规划各个因素或环节的构成方式及其相互关系,可以使整个检索系统的功能得到改善,从而获得较好的检索效果。档案文献检索系统包括两大部分:存储部分和检索部分。存储部分的主要功能是通过著录标引、编制检索工具、建立数据库等手段使档案信息有序化;档案部分的主要功能是通过编制检索策略实现利用者提问与档案信息的有效匹配。
在存储档案时,档案标引人员首先要对档案文献的内容进行主题分析,形成若干能反映其主题的概念,并借助于检索语言把这些概念转换成规范化的检索标识,这一段工作就是档案的著录标引。
在检索(查找)档案文献时,档案检索人员首先要根据利用者的提问确定其所需档案的实质内容,形成概念,然后同样借助于检索语言,把表示检索课题的概念转换成规范化的检索标识,并按实际需求把这些标识之间的逻辑关系表达出来,形成检索表达式。
7. 档案文献单元方式按照目录构成或计算机文档中数据排列方式的不同,可区分为文献单元方式和标识单元方式。
8. 文献单元方式:在计算机检索中又称为顺检方式、顺序文档。它以一份文献为一个条目,指明该文献的各种特征,即以文献为单元进行检索。
9. 标识单元方式:在计算机检索中又称为逆检方式、倒排文档。它以文献的一个属性标识为单元,指明含有该属性的全部文献,一般只有标识和文献号(档号)两个项目。
10. 检索效率是指在检索过程中满足利用者的全面性和准确性程度,它是衡量检索系统性能的一个最基本的指标。检索效率通常采用查全率和查准率两个指标来衡量和表示。
11. 查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。
12. 查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。
13. 简答查全率和查准率的关系
查全率和查准率之间存在着互逆关系的结论。也就是说,如果放宽检索以达到较好的查全率,那么查准率就会下降;反之,若是限制检索范围以改善查准率,则查全率就会变坏。当进行范围宽泛的检索时,查全率很高,可以达到90%左右,而这时查准率则很低;相反,当检索范围小,很专指时,则查准率较高,查全率较低。
14. 论述影响检索效率的因素:
(1)检索语言的性能。检索语言是沟通档案文献存储和查找两个过程的桥梁,对于特定需求信息与纳入检索系统的信息集合的准确匹配具有直接的影响。
(2)检索途径的数量。从理论上说,档案在存入检索系统之后,该系统向利用者提供的检索途径愈多,它被查到的概率也就愈高。
(3)著录标引的质量。检索标识是组织检索工具、进行检索的依据,因此,检索标识的准确性也是影响查全率、查准率的一个重要因素。
(4)检索策略的优劣。档案著录标引的结果对于文献存储的质量至关重要,那么,检索策略在查找过程中则具有决定性的作用。
(5)检索人员的素质。不论是手工检索系统还是机械检索系统,都要由检索人员来参与和控制检索过程,上述因素中除检索语言之外,均与检索人员的素质有关,因此检索人员的素质对于检索效率有直接的影响。
15.简档案文献检索系统评价的目的和作用
系统评价就是对系统的效率和价值进行测定,它是对系统进行科学管理的重要依据。主要目的是对系统整体及其组成要素的功能、特性和运营情况进行评测。
作用主要有三个方面:
(1)明确系统当前的性能特征,从而科学地、最大限度地发挥系统的功能。
(2)发现系统现存的缺陷及其原因,提出改进意见或其他对策。
(3)为设计和建立新的档案文献检索系统提供参考。
16.试述系统评价的指标体系:档案文献检索系统评价的指标主要包括数据覆盖率、检索效率、响应时间、可存取性、费用等。
(1)数据覆盖率又称为收录范围,指一个检索系统已收录数据量与应收录数据量的百分比,它反映该检索系统的资源拥有状况。
(2)查全率和查准率。二者实质上反映了系统运行结果与利用者检索要求的吻合程度,是衡量检索系统性能的最重要的指标。需要说明的是,在实际测评时根据公式计算出来的查全率和查准率常常不能完全准确地反映系统的实际检索效率,其主要原因是:
①对文献相关性的判断不可避免地带有主观性和模糊性。
②查全率是以检索系统中与某一检索要求相关的文献总数作为分母,计算检出的相关文献在全部相关文献中的比例,而检索人员和评价人员都难以确定这个总数是多少。
③在计算查全率、查准率时,“相关文献”被同等看待,不作任何区分,而实际上,在一组相关文献中,每一份文献的相关程度是有差异的。
(3)响应时间。它是指一次检索过程中从利用者向检索系统提出问题到检索系统完成匹配过程,形成检索结果,交付利用者所需的全部时间。
(4)可存取性。是指一个档案文献检索系统的易用程度。
(5)费用。构造和维持一个档案文献检索系统需要投入一定的费用,利用者检索档案文献也要有一定的支出,这些投入包括货币和活劳动两种形式。
17.简系统评价步骤
(1)制订评价方案。包括确定对该系统进行评价时采用哪些评价指标。
(2)评价对象调查。可根据评价对象以及评价指标的特点采用问卷调查、抽样调查等不同的方法。(3)测试。根据样本进行检索测试,然后对检索结果的相关性、响应时间、系统易用程度等进行判断。
(4)数据处理与分析。对调查测试的各种原始数据进行整理、计算,得出有关评价对象的各种性能指标。
(5)对评价结果进行分析,提出改进意见。
第二章 检索语言
1.检索语言:是根据检索的需要而创制的人工语言,专门用于各种手工的和计算机化的文献信息检索系统,表达文献主题概念和检索课题概念。
2.简答检索语言的基本功能
主要有以下四个方面:
①对文献的主题加以标引的功能;
②对内容相同及相关的文献主题加以集中或揭示其相关性的功能;
③对大量文献信息加以系统化或组织化;
④便于将标引用语和检索用语进行相符性比较。
3.产生检索语言第一项基本功能的结构:
(1)编码型标识结构。
(2)组配型标识结构。
(3)层次型结构标识。
4.产生检索语言第二项基本功能的结构:
(1)等级结构
(2)参照系统结构
(3)轮排聚类结构。
5.按构成原理,可分为分类检索语言、主题检索语言和代码检索语言三大类型。
6.简答构成原理
(1)分类检索语言。其特点是用分类号来表达各种概念,把各种概念按知识分类进行系统组织和排列,有很好的系统性。
(2)主题检索语言。其特点是用取自自然语言的语词来表达各种概念,把各种概念完全按字顺排列而不管其相互关系如何,其标识有很好的直接性。
(3)代码检索语言。它一般只就事物的某一方面特征,用某种代码系统来加以标引和排列。
(4)引证关系追溯法。即引文索引法,是显示科学论文之间互相引证而形成的论文网的一种方法。
7.主题检索语言包括标题词语言(标题法)、单元词语言(单元词法)、叙词语言(叙词法)和关键词语言(关键词法),它们可统称为主题法系统。
8.简答先组式语言与后组式语言有何区别
先组式语言就是文献标识在编表时就已固定组配好,或绝大部分已固定组配好,如体系分类法和标题词法。后组式语言就是文献标识到标引和检索时才组配起来,如单元词法和叙词法。
第三章 分类检索语言及《中国档案分类尖》
1.简答注释的作用
具体可归纳为三点:
(1)当类目的含义不够明确时,用注释来明确。
(2)当类目之间的关系不可能用等级结构来显示时,用注释来显示。
(3)当在分类方法上有某些需要说明的地方时,用注释来加以说明。
2.论述分类检索语言的特点和作用
特点:
(1)它是一部类目的汇编,对表达事物概念的类目起登录作用;
(2)它是一个类目的体系,从学科分类、事物分类或职能分类等角度揭示类目之间的关系;
(3)它是一部类目的“词典”,除类目名称本身外,还借助于等级体系形式以及注释,对类目起定义作用;
(4)它是一种类目的排列表,通过线性排列形式和分类号,明确规定着各个类目在分类体系中的位置和次序。
作用:
(1)它是进行分类标引和组织分类检索工具的规范。
(2)它能作为对文献资料进行分类排架的依据。
(3)它是检索者从分类途径检索文献资料的指南。
(4)它是文献工作人员工作中常用的参考手册。
3.简答分类应遵守哪些规则:
第一,在每一次划分时,只使用一个划分标准,不能同时使用两个或两个以上的划分标准,否则会出现划分后所得各子类互相交叉、重叠的混乱现象;
第二,划分后所得各子类的外延之和应等于其母类的外延,避免不完全划分的错误和多出子类的错误;
第三,要选择反映事物本质的符合分类目的的属性作为划分标准。
4.简答类目划分
类目的划分包括分类标准的选择和分类标准使用次序的选择两个问题。
(1)分类标准的选择决定着提供什么检索途径。分类标准的选择是指在一类事物的各种可作为分类标准的属性中,选择什么属性作为分类标准。
(2)分类标准使用次序的选择,决定着形成什么样的分类体系结构。分类标准的使用次序,是指当某一类事物连续划分需要采用几种分类标准时,这几种分类标准使用的先后次序。
5.论述自然序列对同位类排列的要求及其在《中国档案分类法》中的运用
自然序列对同位类的排列要求是:连续性、规律性、稳定性、重要类目的突出性。其中最重要的是连续性。在《中国档案分类法》中采用了如下几种自然序列:
(1)按社会及各种现象的发展过程排列。
(2)按从低级事物到高级事物的次序排列。
(3)按生产流程或制作流程的次序排列。
(4)按习惯次序排列。
(5)按时间顺序从古到今排列。
(6)按地理位置由近及远排列。
6.同位类排列的人为序列的主要形式:人为序列就是按照事物的重要程序排列。这种排列法虽带有人为性,但如能合理安排,也能产生很好的效果。人为序列包括:(1)从重要事物类目到次要事物类目的排列次序。(2)从有较多文献论述的事物类目到只有很少文献论述的事物类目的排列次序。(3)从抽象的、理论的、一般性问题的类目到具体的、应用的、个别性问题的类目的排列次序。
7.列类的方法与原则
(1)正规列类法。即对一个外延较广的概念或范围较大的类目。
(2)列举列类法。即虽是采用某一个分类标准来编列一系列子目,但其子目之和少于被划分的上位类,未列子目的事物概念或者设一其他类加以概括。
(3)重点列类法。即只列出少数几项重点内容作为子目,其余内容仍包括在上位类中。
(4)罗列列类法。有两种情况:一种是并非根据某个明确的划分标准;另一种是根据某一分类标准构成一系列子目。
(5)对应列类法。即采用相关专业的同一分类标准来构成相应的一组子目。
(6)集中列类法。即根据检索上的特殊需要,把按照一般划分原则应分散的内容集中列类。
(7)突出列类法。即将个别重要事物单独列类。
(8)归附列类法。即将按学科、专业、职能分类不能集中在一起事物按某种联系归附于有关类目。(9)合并列类法。即将若干个相近的并列概念合并设立一个类目。
(10)交替列类法。即对可以隶属于两个或两个以上学科、专业、职能的事物在各有关类下都设立子目。
(11)专表列类法。
8.简答类目注释的作用与方式
概括起来说,注释的作用是明确类目的涵义,明确类目之间的关系,明确分类方法。一部分类表的注释可适当多一些,但必须是必要的。特别应注意的是:注释必须准确、简短、明白,力求避免作那些含糊的、自相矛盾的、冗长的、不必要的甚至是错误的注释。要写好注释,写注释的人员就要对分类体系非常明了。注释要与分类体系协调而不能与分类体系相抵触。对类目作注释,既不强求一律,也要有一定规范。可根据具体情况,采用合适的注释方式和措辞。
9.简答分类标记的配置
分类标记即分类号,它是由具有自然顺序的标记符号构成的。分类号是类目的代号,是分类检索语言的语词。现代分类法都用分类号作标识。
使用分类号作为分类检索语言语词的优点在于:
(1)可以明确各个类目之间的先后次序,便于排列目录和组织馆藏;
(2)用分类号标引文献比较简单;
(3)在检索时容易将代表检索课题的分类号与代表文献内容的分类号作相符性比较;
(4)层累制分类号在一定程度上可以表达各个类目之间的从属关系和并列关系;
(5)层累制标记法和分段标记法在一定程度上可以帮助分辨一个类目的涵义。
10.标记制度是指分类号的构成方法,可分为顺序制、层累制和混合制三种。
11.简答标记制度的分类
标记制度是指分类号的构成方法,可分为顺序制、层累制和混合制三种。
(1)顺序制。即用若干个数字或字母编成固定长度的连贯的号码,按分类体系中类目的直线排列顺序,不分级别依次标志全部类目。
(2)层累制。即用一位数字或一个字母来标志大类,再加一位数字或一个字母来标志它的下位类……如此层层累加数字或字母,用来表达类目的层层划分以及类目之间的隶属和并列关系。
(3)混合制。一般是将分类号分成两部分,一部分用层累制,一部分用顺序制。
12.试述体系分类法的局限性
(1)体系分类法自身存在着一个难以克服的矛盾——集中与分散的矛盾。这一矛盾使得体系分类法在适应利用者需求方面表现出很大的局限性。
(2)体系分类法主要采用列举式的列类方法。
(3)体系分类法严格的逻辑体系给增加、删减类目造成困难。
13.简答《中国档案分类法》的分类原则
《中国档案分类法》是以不同历史时期的国家机构、社会组织,从事社会实践活动的职能分工为基础,并紧密结合档案记述和反映的事物属性关系,来建立从总到分,从一般到具体的逻辑体系。《中国档案分类法》是一部完整的体系分类表,它主要由编制说明、大纲、简表、详表、辅助等组成部分构成。这些组成部分分别具有自己的结构和功能,各自发挥着独特作用,并互相配合丰富和增强体系分类表的整体功能。
14.简答分面组配式分类法
是根据概念的分析和综合原理编制的文献分类法,又称分面分类法、组配分类法、分析—综合分类法。它将主题概念分解为简单概念,按照它们所属的方面或范畴,分别编列成表。标引时用两个或多个简单概念的分类号的组合来表达一个复杂的主题概念。
15.简答分面分类法的特点
第一,分面组配式分类法虽然类目较少,但能通过类目的组配表示众多的主题概念,标引文献的能力强于体系分类法。
第二,可以较自由地扩大或缩小检索范围,能从多途径检索文献,还可以进行比较精确的组配检索,在检索性能和检索效率方面都优于体系分类法。
第三,采用分段标记制度,便于分类标记,便于分类表的增补和修订,检索较为灵活。
第四,可用于组织分类目录以及建立分类检索系统等。
第四章 主题检索语言及《中国档案主题词表》
1.简答主题检索语言的特点和性能
它的特点是:语词标识几乎都是事物的名称,关于同一事物的文献全部被集中标引在同一语词标识下,所以要在主题检索系统中查全同一事物的档案就比较容易。
它的性能有:
(1)控制主题检索系统所用的语词标识,以保证其具有较高的检索效率。
(2)引导使用者周密选用检索词,以便准确、全面地标引和检索文献。
(3)方便标引人员和检索人员查找所需检索词。
2 .简叙词的优点有哪些
叙词法就其基本性质而言,是一种采用表示单元概念的规范化语词的组配来对文献主题进行描述的后组式词汇型概念标识系统。叙词法比其他主题检索语言具有更好的性能,体现了检索语言的发展趋势。绝大部分计算机检索系统都采用叙词法。
3.简叙词法的构成原理
(1)按主题集中文献;
(2)用规范化的、可以通过组配来表达复杂概念的语词直接标引文献主题;
(3)用参照系统、分类索引、等级索引、轮排索引和主题词关系图等多种方式来显示主题概念之间的相互关系;
(4)用字顺序列直接提供主题检索途径;
(5)用于标识单元方式手工检索系统或用于计算机检索系统时,具有标引深度大,能够实现多途径检索,扩大、缩小或改变检索范围灵活,适应多种检索要求等优点。
4.简答主题词的组配
概念组配是决定其特点的基本原理。概念组配即概念的分析与综合。概念组配与字面组配在形式上有时相同,有时不同;从性质上说,两者有着原则性的区别。字面组配,其实质是词的分拆与组合;概念组配,其实质是词义的分析与综合。两者检索效果有很大差异。
5.简主题词组配的作用
(1)可以控制词汇量。
(2)可以对同一项情报进行多途径检索。
(3)可以自由扩大、缩小或改变检索范围。
(4)可以及时地反映新事物、新学科。
6.简《中国档案主题词表》特点
其特点仅在于:
(1)在文书档案用词方面,为体现文献保证原则,因而所选的词与一般主题词表有较大区别。而就科技档案和某些专门档案的主题词表而言,其区别不大。
(2)其范畴索引也如档案分类表一样,以国家机构和社会组织从事社会实践活动的职能分工为基础来建立分类体系和对主题词进行归类。
(3)为保持历史原貌,便于标引和检索,对古代档案用词也予收录。
(4)档案主题词表除个别的以外一般不需要标注外文同义词和设置双语种对照索引。
7.简《中国档案主题词表》的结构体系
(1)主题词字顺表;
(2)主题词分类索引;
(3)主题词等级索引;
(4)主题词轮排索引;
(5)词双语种对照索引;
(6)专有主题词索引;
(7)正式主题词索引和款目词索引;
(8)主题词关系图。
8.每条词款目大体可分为款目词、标注项和参照项三部分。
9.简字顺表的功用
一是提供从字顺查词的途径;
二是可通过参照系统,获知与所查词有密切联系的词,既可提高选用主题词的准确性,又有助于检索中扩大、缩小、改变检索范围;
三是可以通过其标注的范畴类号和族首词,比较容易地进入范畴索引和词族索引;四是还可获得主题词的其他信息。
10.范畴索引:是将主题词按其概念所属学科、专业或职能性质划分成大类,在大类之下再分若干小类,在小类下则将主题词和非主题词按字顺排列的一种索引。
11.简词族索引的功能
词族索引是把主表中具有属分关系、包含关系和整体部分关系的正式主题词,按规定属分级别展开全显示的一种词族系统。词族索引的功能是可以从一族中外延最广的主题词出发,找到其全部同族词,并且可以明确它们之间的层层隶属关系,从而弥补主题词字顺表族性检索功能差的缺点。在机检系统中是实现自动扩检、缩检及上位词登录的重要手段。
第五章 检索语言的发展与应用
1.检索语言基本上可分为分类检索语言和主题检索语言两大类。
2.简等级体系分类检索语言的主要特点
按照不同的学科和专业集中文献,用等级结构直接显示主题概念之间的关系,用分类符号作为标引和检索的依据,它便于从事物的有序性和知识的系统性方面来认识和查找文献。而《中国档案主题词表》属于叙词型主题检索语言。
3.简叙词型主题检索语言的主要特点
按文献所论述的事物主题集中文献,用参照系统显示主题概念之间的关系,用规范化的词语作为文献主题概念的标识,可以直接按事物的名称进行标引和检索。分类检索语言和主题检索语言的功能不尽相同,不能互相代替,但也不互相排斥,二者各有长短。
4.论分类检索语言和主题检索语言二者的生成原理的相同之处
首先,从本质上来说,二者都使用了分类的方法。分类检索语言和主题检索语言都要求一个基本的步骤——分类,两者的区别仅在于类的排列上。分类检索语言是公开地采用分类方法,而主题检索语言是采用隐蔽的分类体系——参照系统,当叙词表设置范畴索引和词族索引时,它运用分类方法便转入公开。
其次,从二者的基本构件来看,它们的实质是相同的。主题检索语言和分类检索语言两者皆是“立类”,主题检索语言是“以名立类”,分类检索语言是“以类立名”,两者的差别只是类集的方式和采用的标识不同。
第三,分类号、检索词作为文献主题的标识系统,它们都具有下列4种功能:
(1)对文献的主题加以标引;
(2)对内容相同及相关的文献主题加以集中或揭示其相关性;
(3)对大量文献信息加以系统化或组织化;
(4)便于将标引用语和检索用语进行相符性比较。
5.简自然语言在档案文献检索中的应用途径
(1)作为检索语言中入口词运用于档案检索。
(2)作为检索语言专用的入口词表运用于档案检索。
(3)作为自由词与主题词相结合运用于档案检索。
(4)采取自然语言的关键词法运用于档案检索。
(5)采取自由标引后控词表检索法运用于档案检索。
第六章 档案著录
1.档案著录工作的要求
档案著录是指在编制档案目录时,对档案的内容和形式特征进行分析、选择和记录的过程。
基本要要求是:
(1)准确性,即著录结果全面、客观、准确地揭示档案的内容特征和形式特征。
(2)规范化,即推行标准化著录,按照统一规定的著录项目、著录格式、标识符号、著录项目细则进行著录。
2.简《档案著录规则》及主要项
《档案著录规则》规定了单份或一组文件、一个或一组案卷的著录项目、著录格式、标识符号、著录用文字、著录信息源及著录项目细则。
著录的项目共分七项:
(1)题名与责任说明项。
(2)稿本与文种项。
(3)密级与保管期限项。
(4)时间项。
(5)载体形态项。
(6)附注与提要项。
(7)排检与编号项。
3.简著录级别的选择
著录级别分为文件级、文件组合级、案卷级和案卷组合级。在选择著录级别时,首要的问题是要保证适当的检索深度,在此基础上力求减少不必要的重复劳动,提高著录速度。一般说来,机关档案室、综合性档案馆的著录应以文件级著录为主。不同的档案馆、室在著录时可根据档案的实际情况和利用者的需求特点,自行选择适当的著录级别。
第六章 档案著录
1.档案著录工作的要求
档案著录是指在编制档案目录时,对档案的内容和形式特征进行分析、选择和记录的过程。
基本要要求是:
(1)准确性,即著录结果全面、客观、准确地揭示档案的内容特征和形式特征。
(2)规范化,即推行标准化著录,按照统一规定的著录项目、著录格式、标识符号、著录项目细则进行著录。
2.简《档案著录规则》及主要项
《档案著录规则》规定了单份或一组文件、一个或一组案卷的著录项目、著录格式、标识符号、著录用文字、著录信息源及著录项目细则。
著录的项目共分七项:
(1)题名与责任说明项。
(2)稿本与文种项。
(3)密级与保管期限项。
(4)时间项。
(5)载体形态项。
(6)附注与提要项。
(7)排检与编号项。
3.简著录级别的选择
著录级别分为文件级、文件组合级、案卷级和案卷组合级。在选择著录级别时,首要的问题是要保证适当的检索深度,在此基础上力求减少不必要的重复劳动,提高著录速度。一般说来,机关档案室、综合性档案馆的著录应以文件级著录为主。不同的档案馆、室在著录时可根据档案的实际情况和利用者的需求特点,自行选择适当的著录级别。
第七章 档案标引
1.简档案标引不同方式
(1)按使用的标引语言可分为自由标引和受控标引。
(2)按提供检索标识的数量可分为浅度标引和深度标引。
(3)按主题分析方法可分为概括标引和分析标引。
(4)按标引单元可分为综合标引和分散标引。(5)按利用者需求可分为全面标引和对口标引。
2.按照国家标准《文献主题标引规则》的规定,主题因素分为5种,即主体因素、通用因素、位置因素、时间因素、文件类型因素。
3.简主题因素分为哪几种
(1)主体因素,是指反映文件或案卷中所论述的主题的关键性概念,作为该文件或案卷的检索入口。
(2)通用因互素,是指某些通用的词汇或概念。这些词汇或概念本身不具有专业的属性,但它与主体因素相结合,可以加强主题的专指性。
(3)位置因素,是指文件或案卷所论述对象的空间和地理位置的概念,包括国家、地区、机构等方面的标识。
(4)时间因素,是指文件或案卷所论述对象存在的时间概念,包括朝代、年度等方面的标识。
(5)文件类型因素,是指文件类型和形式方面的概念。
4.简题名不能直接、准确地反映档案内容主题,一般有下列几种情况
(1)题名概念过窄,包括不了档案的实际内容,特别是档案中有参考价值的内容,题名不可能全部列举。
(2)题名概念过宽,而实际内容较窄。
(3)题名含义模糊,不能准确地反映档案内容。
(4)题名中无主题含义。
(5)题名与原文不符。
5.简主题分析中应注意的问题
(1)要准确把握被标引档案的主体因素,避免主体因素含混或主次不清的现象。
(2)要注意揭示档案的隐含主题。
(3)要注意考虑利用者的需求方式。
6.简档案主题分析的质量标准包括以下几方面
(1)既不要遗漏档案中有参考、检索价值的内容,又不要将无参考检索价值的内容或档案中根本不存在的东西作为分析的结果;
(2)正确判断档案中叙述的重点内容;
(3)正确表述档案的内容,即形成正确的概念。
7.简主题分析误差大致可归纳为下列三种
(1)主题分析不充分,析出的主题少于文献实际含有的有参考价值的东西,结果会造成漏检;
(2)主题分析无控制,将无关重要的内容分析为主题,结果会造成误检;
(3)主题分析错误,析出的主题与文献实际内容不符,结果既会造成漏检,也会造成误检。
8.简档案概念转换的质量标准包括以下几方面
(1)正确运用分类表和主题词表,选用符合专指性要求的分类号和主题词;
(2)根据档案的价值确定标引深度,对主题分析结果的标引要有所选择取舍,不要遗漏有价值的情报;
(3)给出的检索标识应符合一致性要求,即对同一主题概念的表达要前后一致。
9.简标引结果审核的具体内容
(1)分析出的主题是否少于档案中实际含有的具有参考、检索价值的内容;
(2)是否将无关重要的内容分析为主题;
(3)主题的概括是否准确、恰当;
(4)标引的类号和主题词是否正确;
(5)标引是否一致:
(6)标引中是否有技术性错误;
(7)应有的互见和轮排类号、轮排主题词是否已给出。
10.论述分类标引技巧
分类标引技巧主要是指档案主题在分类表中没有完全相符的类目时的标引方法,包括上位标引、组配标引、靠类标引和暂定性标引等。
(1)上位标引。某一档案的主题在分类表中没有相应专指的类目可归,而只得归入范围较大的上位类的标引方法称为上位标引。
(2)组配标引。指扩大使用范围的组配标引,是当某一档案在分类表中没有确切类目时采用的一种解决办法。
(3)靠类标引。当某一档案的主题在分类表中无专指的类目可归,又不可能采用上位标引和组配标引时,将其归入与其有某种联系的相关类,称为靠类标引。
(4)暂定性标引。当某一档案内容在分类表中无类可归时,分类人员根据其职能性质,在有关大类里新增类目暂作安置,待分类表编委会发出增设类目通知,或新版分类表修订出版后再重新标引。这种标引技巧可称为暂定性标引。
11.简主题标引的定义及与分类标引的同异
主题标引是将档案的主题内容纳入词表体系的过程。主题标引与分类标引都是针对档案内容给予相应检索标识的过程,但是,由于两者使用不同类型的情报检索语言,所以标引方法有所不同。甚至可以说,主题标引与分类标引有重大区别。分类标引是针对档案内容的职能分工或事物性质进行标引,每份档案归入所反映的社会职能分工或事物性质的类目。
12.简主题标引的一般规则
(1)了解所用主题词表各个组成部分的特点,以便在标引选词时根据具体情况,选择最有效的查词途径,迅速查到所需的主题词。
(2)在标引选词时应仔细、耐心,多查几处,注意每个词的参照项和注释项,反复推敲。
(3)标引用词必须是主题词表中的正式主题词,并且必须严格按照词表中的书面形式使用,不得有任何改动。
(4)要根据本单位的需要和档案的价值,掌握适当的标引深度。
(5)标引时应遵守专指性原则,即必须选用主题词表范围内最专指的主题词进行标引。
13.简自由词标引在下列情况下可以使用
(1)采用组配标引其结果出现多义时;
(2)虽可靠词标引,但这些概念的被标引频率较高时;
(3)词表中明显漏选的词,包括未收录的地名、人名、机构名、产品名、文件名等各种专有名称;(4)表达新生事物的词。
14.简标引时应遵守主题词标引的优先顺序
(1)当主题词表中有专指词时,必须用专指词标引;
(2)当无专指词时,可采用组配标引,在组配标引中优先考虑交叉组配,然后考虑方面组配;
(3)对词表中没有专指词,也不适合组配标引的主题概念,可以采用靠词标引,在靠词标引中优先考虑上位词标引,然后考虑近义词标引;
(4)对用上述方法标引都不适合的主题,可以进行自由词标引。
15.简主题词组配标引规则
(1)组配标引应是概念组配,而不是字面组配。
(2)避免用不必要的词进行堆砌。
(3)避免概念不明确、逻辑不合理、内容不科学的不符合一般思维规律的组配。
(4)遵守专指性规则,选用与主题概念关系最密切、最邻近的主题词进行组配,不能越级组配。
(5)遵守主题词标引的优先顺序。
(6)当一个概念可用多种组配方案标引时,应使用确切的组配方案。
(7)专有名词不得用普通主题词组配表示。
16.论计算机检索系统与手工检索系统的比较
(1)一种手工检索系统一般只提供一种检索途径,例如分类检索系统只能提供分类检索途径,主题检索系统只能提供主题检索途径,而计算机检索系统则不同,它的数据库可以容纳多种检索标识,所以,一个计算机检索系统相当于多种手工检索系统。
(2)各种手工检索系统的条目格式各不相同,因此对一份档案要编制许多格式不同但又著录项目大同小异的条目。而在计算机检索系统的数据库中,对一份档案只需编制一条详细记录。
(3)每种手工检索系统都有与其他检索系统不同的排序方法,计算机检索系统的主文档只用一种排序方法,但输出时可采用多种排序方法,甚至字顺排列也可同时采用不只一种排序方法。
(4)手工检索系统与计算机检索系统中条目的结构以及识别每个著录项目所用的标识符号不同。
(5)计算机检索系统采用磁性载体,必须利用计算机才能进行检索。检索效率一般比手工检索高。(6)计算机检索系统像一个目录加工厂,可以按需要输出各种各样的目录,还可将数据从一磁性载体转录到另一磁性载体上,这就是所谓“一次输入,多次多种输出”的功能。
17.简计算机检索系统中档案标引工作的特点
(1)作双重标引。即对一份档案同时标引分类号和检索词。
(2)进行深度标引。即除了标引档案的基本主题内容以外,对于其中的局部主题内容,只要在检索中确实有意义的,都可以进行标引。
(3)可使用自由词作补充标引。但是,自由词标引也须注意进行一定的规范,以提高其检索效率。(4)使用关联符号。这是因为在计算机检索系统中检索词是后组式的。
(5)加机编主题目录或主题索引的标题符号。在为计算机检索系统进行档案标引时,若准备生产书本式主题目录或索引,就要为此加注标题符号。
(6)可进行上位登录。所谓上位登录,是指在给出一个检索词或一个分类号时,也同时给出它的所有各级上位词或上位类号。上位登录是通过程序由计算机自动进行的。上位登录的作用也可用其他方法达到。
(7)使用著录—标引工作单。为计算机检索系统进行档案编目时,项目比较全,而且要求非常严格,所以一般都要填写著录—标引工作单。
18.简目前我国档案部门大多采用题名关键词自动标引的原因:主要有两方面:一是应用计算机辅助管理的单位大多采用二次文献检索的方法,二是计算机对自然语言的理解技术还很不成熟。从题名中自动提取关键词的方法主要有词典匹配法和分词抽词标引法。
19.词典匹配法标引时可采用以下规则提高标引质量:
(1)概念组配规则
(2)最长组配规则
(3)特定词规则
(4)并列词规则。
20.简题名关键词自动标引应注意的问题
(1)题名必须准确地反映档案文献的主题内容。
(2)要建立或选用一个高质量的词典库,其中的词应具有相当的可用性、包容性和通用性。
(3)建立同义词词典。在这个同义词链上还有主题词“自行车”,不但起到提高查全率的作用,也实现了对关键词的规范。
21.简影响档案自动标引质量的主要原因有
(1)我国目前主要采用的是题名关键词自动标引,但不少文件、案卷题名不能准确揭示其内容主题,从而失去了自动抽词的基本前提。
(2)我国目前的关键词自动标引还处于形式标引阶段,还没有实现语义、语境分析,分词、词组配方面的各种自动技术也还不够成熟。
(3)自动标引用的词典库质量还不高。
22.简对自动化标引的质量控制方法主要有以下几方面
(1)选择性能较好、与本单位档案实际相适应的自动标引软件。
(2)加强审校工作,并形成制度,未经审校的自动标引结果不能存入数据库。
主题词标引审校的内容大致有:
①主题分析是否准确。
②选词是否得当。
③根据需要调整标引软件。
第八章 档案检索工具
1.简档案检索工具的作用
(1)检索作用
(2)报道和交流作用
(3)管理作用。
2.检索工具体系的功能取决于两个因素
一是每一种检索工具的质量,
一是各种检索工具之间的配合与协调。
3.简档案检索工具体系的基本要求
(1)要有一定数量的不同种类的检索工具。
(2)不同种类的检索工具要能够功能互补。
(3)检索工具设置要与利用需求相吻合。
4.简明见式检索工具
明见式检索工具有很多种类,其主要特点是每一个条目的检索标目显露在外,以便于查找。明见式检索工具一般采用卡片式,用不同的方法将卡片以鱼鳞式错落排列并固定下来进行翻动检索。
5.简表式检索工具
表式检索工具包括不同形式的用于记录检索标识的表格,有坐标式索引,圆盘式索引等。坐标式索引通常以纵坐标表示文献检索标识分组,横坐标表示文献编号,如档号。制作时在表中相应位置填写检索标识,检索进可从特定检索标识查找该文件档号。
6.简比孔卡、比号卡检索工具的优缺点
优点:
第一,设备简单,便于编制,使用也很方便;
第二,可以根据需要对标引词进行组配检索;
第三,可根据需要选择适当的标引深度,检索速度快。
缺点有:
第一,一张标引词卡片所容纳的文献号是有限的,检索时容易产生漏检;
第二,对标引词必须按照字顺或音序排列,操作结束后必须将取出的卡片放回原处;
第三,比孔卡、比号卡检索提供的文献信息单一,只能提供文献号,利用者需根据文献号再去查找文献卡或原件才能满足检索要求。
7.简边缘穿孔的主要优点
(1)具有多元检索的功能。
(2)排卡方便。普通卡片要按照一定顺序排列,形成一个体系。
(3)查检速度快。边孔卡在扫描和匹配技术上向前跨进了一步。
(4)设备简单,操作简便。边孔卡比起计算机检索费用低廉得多,而且技术比较简单,易于掌握。
第九章 检索策略
1.简检索策略的含义与作用
检索策略就是为实现检索目标而制定的计划和方案。制定检索策略是对整个检索过程的谋划和指导,目的是使检索人员按照明确的目标,采用科学的程序和灵活的技巧实检索过程,以求最大限度地使检索结果接近以至满足利用者的需求目标。
2 .简制定检索策略的基本步骤
制定一个好的检索策略需要掌握很多信息和知识,大致包括3个方面:
一是利用者的需求信息;
二是现有检索系统的特性与功能,数据库的标引规则及词表结构等;
三是必要的检索方法与调节技术,所检课题的专业知识等。
制定检索策略的基本步骤是:
(1)选择检索途径
(2)选择检索标识
(3)确定检索词之间的逻辑关系。
3.简加权检索
是指在检索时,给每一检索词一个表示其重要程度的数值,权值多少视检索词在档案文献中所占的重要程度而定,然后对含有这些检索词的档案文献进行加权计算,其和在规定的阈值以上者,作为答案输出。
4.简加权检索主要有两个方面的作用
(1)可获得较理想的查全率和查准率。采用了加权检索,赋予每个检索词一定的权值,就可以从数量上掌握这个“度”,从而获得较为满意的查全率和查准率。
(2)可在输出时对档案进行排列。当一次检索过程检出数量较多的档案时,利用者常常希望能根据每份档案的相关程度排列,在加权检索中,输出的每份档案都有权值,可以按照提问者兴趣相关性递减的顺序进行排列,排在前面的是相关性最高的,依次递减。
5.简加权检索与布尔逻辑检索的不同点
二者的主要不同点在于,布尔检索的结果只有或是或非的二值逻辑,而加权检索按照检出文献对于检索提问的切题程度分等级输出,这样一方面更加灵活,有可供利用者选择检索结果的余地,另一方面也有助于提高查准率。因此,有人把布尔检索方法称为定性检索方法,而把加权检索方法称为定量检索方法。
6.简制定检索策略中提高查全率的方法
(1)降低检索词的专指度,可从词表或检出文献中选一些上位词或相关词补充到检索表达式中。
(2)调节检索式的网罗度,如删去某个不甚重要的概念组面。
(3)进行族性检索,可采用上级、同级分类号检索,也可以采用一组近义词、同义词或相关词用OR连接在检索式中。
(4)进行截词检索,可以采用前截断、后截断、前后截断等截词方法。
(5)增加检索途径,如将主题途径与非主题途径结合起来使用。
7.简族性检索
可采用上级、同级分类号检索,也可以采用一组近义词、同义词或相关词用OR连接在检索式中。
具体做法有以下3种:
(1)全族检索。
(2)同位类检索。
(3)上组配检索法。
第十章 档案计算机检索系统
1.简建立档案机读目录的基本要求
(1)档案目录数据要标准、规范。采集档案目录数据,应严格按照有关档案著录标引的国家标准、行业标准进行。
(2)编制好接收档案目录数据的计算机程序。这项工作应由了解档案工作的计算机专业人员或有编程能力的档案专业人员完成。
2.简档案机读目录数据库的建立需要做哪些工作
(1)对档案目录数据进行分析。档案目录数据从不同角度反映了档案特征,是计算机检索档案的重要依据和基础。建库之前,必须结合档案检索系统的功能设计,对各种档案目录数据及其关系进行分析。
(2)设计数据库结构表。明确了各个数据库的功能之后,要对每个数据库中每个字段属性的类型和长度进行定义。
3.简顺序式倒排
分别建立主题词库和主题词倒排库。主题词库中包含主题词、首指针和个数等字段。这种方法的优点是查询速度快,根据主题词中每个主题词所对应的首指针和记录的个数,就能很快定位到倒排库中该主题词所对应的档号。缺点是生成速度慢,维护困难。
4.简链式倒排
分别建立主题词库和主题词倒排库,主题词库中包含主题词和首指针,其中首指针指向该主题词所对应的档号在倒排库中的位置。主题词倒排库中存放各个主题词所对应的档号和一个指针,这个指针指向同一个主题词所对应的下一个档号在倒排库中的位置。这样,在倒排库中就形成一个由指针连起来的档号链,链上包含同一个主题词所对应的所有档号,我们将这种倒排库称之为链式倒排库。这种方法的优点是:生成速度快,维护查询方便。但查询速度比第一种方法慢一些。
5.简计算机处理方式分类
(1)脱机批处理检索。批处理检索是把用户的查找要求进行分批处理,对用户提问不立即回答,而是集中起来,一起送入计算机,统一处理。
(2)联机检索。用户或检索中心的检索人员通过计算机终端或网络工作站,以人——机对话方式直接对档案数据进行检索、浏览、输出。
(3)网络式检索。联机检索的技术基础是计算机网络,随着计算机网络的发展,把各检索中心的主机连在一起,可实现档案资源的共享,可把地理位置分散的资源集中起来,共享硬件资源和软件资源。(4)档案缩微品计算机检索。这个系统包括计算机向缩微胶片存储档案信息和计算机对缩微胶片的检索。
6.档案计算机检索系统的开发过程包括四个阶段:系统分析,系统设计,系统实现(程序编制与调试)和系统运行与维护。
7.论系统分析
系统分析是收集和分析现有系统实际善的过程,目的是了解其特性和问题,了解建立新系统的必要性和可能性,确定新系统应该具有的功能。
(1)用户需求调查,初步确定系统目标,形成用户需求说明书。用户提出建立档案检索时,必然要提出种种具体要求,这是原始的系统目标,是第一手材料,值得特别重视。说明书中列出系统目标的四项基本要素:系统用户、系统资源、系统能力和系统方针。
(2)可行性分析,对系统目标进行全面的综合考察和审定,完成系统分析报告。
①对现有检索系统的分析。
②对所要建的新系统分析。
③对各种方案分析。
④技术可行性分析。
⑤经济可行性分析。
⑥社会条件方面的可行性。
⑦开发的风险性。
8.系统设计阶段需要考虑三个因素:第一是用户,第二是资源,第三是数据。
9.简系统验收
(1)系统情况介绍。
(2)系统文件资料验收。
(3)软件程序验收。
(4)演示。
(5)系统验收。
10.简系统维护有哪些方面
主要集中在以下四个方面:
(1)紧急维护。
(2)日常性维护。
(3)满足用户特殊档案需求。
(4)改善系统性能。
第十一章 缩微品的检索
1.简 CAR系统的类型
(1)独立型。即由一台计算机和缩微影像终端机构成的独立的缩微胶片计算机辅助检索系统,在计算机内存储含有缩微品存址的档案著录条目。
(2)网络型。即将多台高分辨率的图像/数据终端与存有缩微品索引的中心计算机数据库及缩微品文献库相连接构成的系统。
2.简CAR系统的特点
(1)信息存储成本低,信息稳定性和载体耐久性好,证据价值高。
(2)检索速度快、效果好。与普通缩微品检索方法相比,计算机具有快速检索和多途径检索的优越性能,数据库中只存储二次文献和缩微影像数据索引,不仅可以在一个单位内组成检索系统,而且还可以利用现代通讯设备进行远程查询和传递,组成信息网络系统。
注:前面没有标简(简答)或论(论述)的题为选择题,这个是我校对过的笔记,以前那部分的没有校对过,大家以这个为准。