郭万隆
地方志是深具中国特色的文化事业,其历史可上溯至汉,建国后,我国编修方志的优良传统得到了继承发展,特别是十一届三中全会以后,社会主义新方志的编修工作更是在全国范围内全面展开。旧志也罢,新志也罢,都是笔巨大的、宝贵的精神财富。然而在只有以纸张印刷为传播媒介的时代,决定了它不可能大规模印刷,也不可能在大范围流通,其价值还远远没有被广大读者认识,很多人不知地方志为何物,甚至不清楚三个字怎么写,这对方志事业的发展显然是不利的。
随着计算机和互联网的发展,以网络为媒介的信息传播空前繁荣,网络媒体以其海量信息、惊人速度和便捷灵活的使用方式成为新世纪迅猛发展的信息载体,这就为方志的利用、扩大其社会影响力提供了一个很好的机会。目前,全国已有接近10家省市级地方志机构在网络上建立了属于自己的阵地(上海市地方志办公室网站的一期建设也进入尾声,总字数约在5000万的22部区县志、30余部专业志及年鉴都已入库,网站进入内部试运行,力争今年与广大用户见面)。虽然栏目、界面各不相同,但核心是一致的,即把印刷型的志书转化为数字式在网站上发布,同时配以相关的手段进行查看,简单地说,有两种方式可以利用网站上发布的志书信息,一是浏览,一是检索。
浏览模拟的是平常读者的阅读习惯,即从目录入手查找信息,用户关心的主要是有没有要找的东西,而不太注意其对不对。
如果想进一步使所查信息达到准确性、全面性,浏览的方式就无能为力了,特别是那些涉及细小概念的内容,目录上根本反映不出来。印刷型的志书解决之道是编制索引,但从事过的同志应该有体会,费神不说,还不能保证全面。这样检索就可以大显身手了,它模拟的其实就是索引的方法,但其覆盖面可以达到所有网上浏览的志书,只要内容中有该检索词,不管篇章节标题中是否存在,统统反映出来,这就大大加强了索引的深度,保证了查找信息的全面性。举个例子,检索“杜月笙”,除了《川沙县志》、《黄浦区志》、《上海工运志》、《上海工商社团志》等中有其传记可供参考外(这些从浏览入手也可找到),更多的是一些细小信息,比如图书馆事业志的第一篇第三章第二节中就记载:东方经济图书馆曾邀请他做过董事。这样的例子比比皆是,其好处也是不言而喻的。另外从某种意义上说,信息的全面性也是准确性的前提,比如查找“王洪文”,我们看到,《上海纺织工业志》中有其传记,《中共上海党志》中也有,但很快发现,同一个人,生年不同,一个是1934年,一个是1935年,这里不讨论哪个正确,而是想说明,全文检索系统提供给用户这样一种可能,即在宏观上把握信息,比较、鉴别各材料的真实性,经过这样查考的信息,用起来才放心。
对于那些只想查找某个范围内信息的用户来说,还有一种方式可供选择,即在高级检索下,选择所要寻找的志书,缩小范围进行全文检索。
全文检索还有不完善的地方,一是查准率,查找“黄金”,出来的很多信息是关于“黄金荣”的(反之不成立,查找“黄金荣”,不会出来“黄金”的内容),对数据库中信息的格式也要求绝对准确,字与字之间不允许存在空格,否则就无法检索到;第二个是同义词检索问题,比如以“电脑”二字检索,含有“微机”、“电子计算机”、“PC”等内容的信息是无法查到的,虽然这些词都是同一个意思。还有一个最大的问题就是不支持抽象含义词语的检索,比如,想要寻找上海的古典园林资料,非得知道各个园林的名称,一种做法是浏览《上海园林志》第一篇内容,记下名称,然后分别将此作为检索词进行全文检索,以获得散见在其他志书中的信息。但是要查找“上海之最”这样的内容就麻烦了,志书里根本不可能有这样的类目,靠浏览是无法解决的,各地方志网站普遍的做法是在志书板块之外,设立特色栏目,像黑龙江的“中国龙志”网上开辟的“物产特色”和“龙江风物”就是如此,前者罗列出大兴安岭、小兴安岭、大庆油田、黄金资源、东北虎等内容,后者则主要是关于少数民族风情的以及与之相关的事物(大马哈鱼、海东青),设立上有很大的灵活性(虽然东北虎、大马哈鱼、海东青都是动物,却分别安排在不同的栏目中,因为后两者与少数民族的生活、历史联系密切),内容上可以不断增添,类似志书编纂中的特记、专记。如果还想进一步查找该资料在各个志书中的记述,则又可以利用全文检索系统进行进一步查找。这样,栏目就起到一个为用户提供检索词入口的功能。山东省情网也是如此,方志之外,又辟出“山东之最”、“民俗风情”、“齐鲁名士”等栏目。吉林、安徽、福建省情网上都有类似的栏目。
虽然全文检索存在这样那样的不足,但与其方便、快捷、全面的优点相比都是微不足道的,况且在使用过程中,用户也可以摸索出提高准确率、查全率的方法。
如此看来,对于地方志网站而言,全文检索系统绝不是一个可有可无的东西,其使用上的方便、准确程度(也就是所谓的友好性),决定了该网站的质量。有了它,广大用户就掌握了一把开启知识宝库的金钥匙,浩如烟海的信息从此信手拈来,死知识从而可以成为活的、可以利用的资源。因此在数据入库过程中就应注意,只要是需要检索的信息,哪怕不是地方志的内容,也必须依照其形式入库。全国现存的8000多种旧志(上海有100余部,约2000卷),将来必定也是要上网的,为了保证能够检索,这部分志书也需要依照现有的格式才能入库。
可以预计,以网站等数字化形式存在的方志,有可能成为未来志书的主流,所以在编纂志书的过程中是否应考虑将来上网的方便呢?为了避免上述同义词滥用的情况发生,是否应该注意:用词的规范不但应贯彻在一部志书中,而且要贯彻在所有志书的编纂中呢?是否可以利用"同义词表"进行规范,或者制订出适合大部分志书的凡例来呢?而不管怎样的做法,是否应该最低限度地保证性质相同的志书用词一致呢?
(作者单位:上海市地方志办公室)