不能读取工具条配置

地情资料数据库设计(梅森) 2011/01/27

梅森

 

本地情资料数据库是为地方志系统“量身定做”,当然其他地情研究部门、档案部门、综合部门的相近数据库也可以参考设计。

一、为何要设计地方志特征的地情资料数据库

当今社会已经进入互联网时代,未来地方志事业的发展,与社会更加紧密的是地情资料数据库,我们经常高呼“读者用志”,实际上读志用志的基础是为社会提供大量的有价值的资料。

有人问:目前各省市地方志地情网页有大量的资料,为何还要提倡建“地情数据库”?我回答:这些地情库基本是地方志书、地情书的文字版翻成电子版,没有资料的原始出处,书版资料与修志的资料长编比较量要小的多(五分之一至十分之一)。有人问:要比资料量,档案馆的档案资料、图书馆的统计资料、统计部门的统计资料,还有各种现代网站的资料何其多也,地情资料数据库如何比得?我回答:地方志的地情数据库是经过人工筛选、删节、注明资料来源,具有存史价值的二次文献性资料,这一特点其他原始的一次性文献资料如何比得。就好比地方志系统的业务人员像秘书对待“首长”一样,为了节约首长的时间,把选好、筛好、节录好的资料呈现给社会的广大需求者。所以说,建立数据库就要建立自己行业特征的数据库,否则地方志这个边缘行业的数据库如何在有着强大政治、经济背景的网站缝隙中寻得自己一块立身之地。有人问:如此规模宏大的地情资料数据库如何建立?我回答:像中国地方志机构目前的现状,其人力、能力,包括参照公务员管理后以“管”为主的管理方式,的确很难建立。但地方志系统可以通过每一轮修志,通过编纂志书的同时编资料长编,组织参加志书编纂的社会党、政、军、民、学各方面修志人员共同建立,最后为社会利用。

二、数据库构架

数据库资料来源和储存利用构架是什么呢?我想,我们还是通过一个示意图表示吧:

 image

 

注:双向箭头表示资料双向利用,如社会有关部门修志,可以把资料长编放入地情资料数据库,也可以从数据库中调资料修志。单箭头为资料单向流动,社会各方面从地情资料数据库调资料使用。

地情资料数据库是通过资料长编编制形成的。有人要问如何形成?告知:三种资料整理类型,六种资料来源电子卡片模版,另加资料代码、资料内容时间,形成批量(单卡也可以),通过设计的软件功能自动进入地情资料数据库。“代码”代表数据库内部分类,“资料内容时间”是同类资料卡片确定的纵向位置,纵横结合形成每一资料在数据库位置的坐标点。

资料数据库代码示例:

8  八、农业

8-1  1.农业综合

8-2  2.农业生产条件

8-3  3.农业产业结构

8-4  4.种植业

8-5  5.林业

8-6  6.畜牧业

8-7  7.渔业

8-7-1  ①渔业综合

8-7-2  ②水产资源

8-7-3  ③海洋渔业

8-7-4  ④淡水渔业

8-7-5  ⑤水产品加工与经营

8-7-6  ⑥渔业服务业

8-7-7  ⑦水产养殖

8-8  8.农业产业化经营

8-9  9.乡镇企业

8-10  10.农村能源建设

8-11  11.农垦

8-12  12.农场

8-13  13.农业行政管理

各地数据库框架设计,共性的内容要素可参考《地方志书内容要素探微——数字化地情资料库框架设计参考》(方志出版社2009年9月版),可以根据本地特点增减并留。如西北地区某地的数据库就不可能有“海洋”,东南沿海地区某地的数据库就不可能有“沙漠”。数据库是层层的树状分类,上下基本为领属关系,横向基本为平列关系。各业均设“综合”库,如农业有“农业综合”、工业有“工业综合”、外贸有“外贸综合”,可以把本业综合性内容放在综合子库中,如2000年工业概况就可以放在“工业综合”中,综合库还可以起到本大类资料临时存放点的作用。

三、地情资料数据库资料输入系统

以地方志资料长编的电子卡片为数据库资料最基本单元,按资料内容的时序将电子卡片输入相关子库,无穷尽收集资料,总而形成具有二次性文献资料特征的地情资料数据库。

资料卡片根据资料状况包括“汇辑型”、“纂辑型”、“撰述型”三种类型;根据资料来源特征加工成为六种资料来源电子卡片,指“文献资料电子卡片模版”、“ 文书档案资料电子卡片模版”、 “报刊资料电子卡片模版” 、“网络资料电子卡片模版”、 “口碑资料电子卡片模版” 、“图片资料电子卡片模版”的资料电子卡。

汇辑型资料长编电子资料卡片辑录属于本门类(篇目)的事物内容资料。整理方式保留资料原始语句,主要是节录、剪裁原始资料,不重新撰文。重要文献资料,可全文收入。段落内容有删节的,应在删节处加删节号“\[……\]”。纂辑型资料长编电子资料卡片,主要收录经筛选、取舍、归并、综合而成的资料,资料整理者可加编者语联缀。此资料卡片形式主要用于对多个松散资料的综合加工,或面上情况的综合。纂辑型资料大多有多个资料来源,故必须说明所综合的资料的分别来源。撰述型资料长编电子资料卡片用自己的文字对资料进行融合撰写,但不失资料的原意。主要用在资料量大、繁琐的资料,需要整理者概括综合。

“电子卡片模版”的著录要素包括资料门类代码、资料内容时间、关键词、资料内容标题、资料来源、资料整理者姓名、资料整理时间、资料正文等。具体各种资料来源的不同著录要素参见《上海通网站﹒http://www.shtong.gov.cn综述.市志培训﹒上海市级志书资料长编类型及电子卡片模版》。

(1)文献(著作)资料电子卡片模版的著录格式为:作者、书名、出版地、出版单位、出版日期、版次、卷(册)号(期号)、页码。(2)文件著录格式为:发文单位、文种、文号、密级、文件标题、发文日期。(3)报刊著录格式为:作者、文章标题、报刊名、刊发时间、版次。(4)网络资料著录格式为:作者(或署名),文章名称,网页地址、日期,属于特定栏目的要注明栏目名。(5)口碑资料著录格式为:被采访人单位和姓名、采访主题、采访时间、采访地点、采访人。(6)图片资料著录格式为:图片标题,作者,拍摄时间、地点、图注。

资料定位。电子资料卡片分类按时间顺序编排,形成资料长编入库。如“872+1999.8.9”就是1999年8月9日水产资源的资料。

然而,资料时间有时不是精确、统一的,如有时是“是年”、“本年”,有时是“春”、“夏”、“秋”、“冬”。是年、本年放置于本门类(子库)资料卡片最后。“是月”“本月”排本月最后。何时至何时,根据起始时间确定卡片放置位置。另外,公历4月30之后排“春”,7月31日之后排“夏”、10月31日之后排“秋”、次年1月31日之后排“冬”。

“关键词”是每张电子资料卡片在整理时均要填写的,以方便今后的检索利用。关键词包括地名、人名、建筑名、事件名、事物名等,根据资料内容由整理者填具。同样一个关键词如果到一定的数量,通过设计的软件系统就会进入设计好的关键词库中,呈现出来的是关键词表。这样,“周梅森”与“梅森”就不会混淆。关键词表为便于检索,自动按首字笔画排列。

四、资料数据库资料检索利用系统

建立以数据库框架、内容门类为主体的多元型检索系统。

(一) 树状检索

前置内容分类代码表,提供门类(资料库架构系统)树状检索。在树状检索中代码变得不是很重要,但在资料入库时代码与时间的复合定位尤为重要。

如查“1989年的淡水渔业”资料,首先点击“农业”,打开为“农业综合”、“农业生产条件”、“农业产业结构”、“种植业”、“林业”、“畜牧业”、“渔业”、“农业产业化经营”、“乡镇企业”、“农村能源建设”、“农垦”、“农场”、“农业行政管理”等。再点击“渔业”,打开的是“渔业综合”、“水产资源”、“海洋渔业”、“淡水渔业”、“水产品加工与经营”、“渔业服务”、“水产养殖”。再点击“淡水渔业”,填“1989”,那么“1989年的淡水渔业”资料卡片就按照时间顺序呈现在点击者的面前。此时的电脑屏幕,左边1/4设计为内容所在的树状门类目录,右边3/4设计为资料内容。

(二)关键词检索

打开关键词表,点击自己所需的资料。如点击“汶川大地震”,那么所有的汶川大地震资料都集中在点击者面前。点“都江堰灾后重建”,所有“都江堰灾后重建”资料都按照顺序呈现在点击者面前。

(三)自设主题词检索

如果检索者既不想采取树状检索,也不想通过关键词检索,可以自己设主题词进行模糊检索。此时,计算机先在关键词库搜索,搜索不到再像其他资料库、网站那样全文模糊搜索。(百度就是这样搜索的)

 五、设计流程与地情资料数据库最终设计目标

 (一)资料入库设计

 1.设计提供资料存入的数据库框架

 2.为框架编制代码

 3.设计六种资料电子卡模版菜单。打开“资料电子卡”菜单,显示6种模版图标,选择使用。

 4.模版同时具有简单的资料整理的工作平台作用。包括删改的系列手段,如角注(注文点脚注符号才打开注文)、删节号、划线(试删除)、电子笔删改等,以便确定最终资料卡片保留的文字内容。

 5.设计代码自动调整手段,根据实际情况数据库子库会有少量的增减,原代码随之自动调整。调整范围包括:代码表、已输入数据库的资料卡代码、数据库框架代码。(尽量把数据库框架设计的较为稳定,即使调最好在低级层次调整,以免计算机能力达不到)

 6.设计资料卡片批量或单个进入数据库软件系统。资料电子卡按照代码和资料内容时间两数据,点一“进入”,电子卡就自动进入自己的坐标点;同时只要资料电子卡具备代码和资料内容时间,资料也可以批量导入。

 7.通过软件设计,入库后的资料,管理者仍有修改、补充、说明的可能。

(二)数据库中资料编辑设计

1.库中具有资料编辑平台

2.在平台上整理资料或调度资料

(1)编辑删节资料手段。(2)根据电子卡片的关键词调度资料,自动生存关键词表,随着电子卡关键词的不断输入,电脑的记忆系统通过记忆,把有一定词量的词显示于关键词库,关键词按笔画检索编排。(3)如果编辑某类资料内容,可以把同一代码的资料集中成为资料长编予以编写。(4)如果调度地域资料,可以通过关键词检索系统归类,如点成都,所有成都资料集中一起,并按时序排列。如再点街道,成都街道也集中了。点击人名、机关名等等均可以。(5)设定“开放”和“留库”,把不公开的资料留在库中。(6)编辑利用资料,包括编辑平台,储存系统,形成的(志书等)文本从数据库编辑平台提走。(7)数据库资料可分类拷(复制)给有关部门利用。

(三)软件设计达到三种资料检索功能

1树状分类检索;2关键词检索;3模糊语言检索(如同百度)

 

(作者单位:上海市地方志办公室)