LOCKSS项目对档案数字资源长期保存的启示

随着数字化进程的不断深入,数字资源长期保存的问题已经受到越来越多的关注和重视。在图书、档案领域国内外有很多研究项目,提出了多种解决方案,其中美国斯坦福大学的LOCKSS(Lots Of Copies Keep Stuff Safe,大量拷贝确保数据安全)项目以其 Peer-to-Peer的分布式保存策略在全球引起了广泛关注。

01

LOCKSS项目介绍

LOCKSS项目源于2000-2002年Sun公司与斯坦福大学之间的一项合作,主要致力于解决电子期刊的永久保存与利用问题。它通过建立出版商与图书馆、图书馆与图书馆之间的协作平台,提出了从电子资源出版、发布到永久性保存与利用等一整套解决方案。出版商通过发布LOCKSS权限声明和资源清单对允许保存的内容进行限定;图书馆在本地部署LOCKSS BOX,根据出版商的权限声明和资源清单获取和存储出版的内容,并将本地LOCKSS BOX注册加入到LOCKSS分布式保存网络;用户在出版商内容因故(网络拥塞、退订、自然灾害、战争等)不能访问时通过本地LOCKSS BOX获取内容。一旦数据摄入完成,LOCKSS BOX中的内容将不再依赖出版商数据库,通过不断与分布式保存网络中其他 LOCKSS BOX节点中的相同内容进行对比及同步,LOCKSS BOX确保本地保存的内容始终是正确的。

LOCKSS项目对档案数字资源长期保存的启示

各图书馆分布式节点

2004年初,LOCKSS项目组发布了LOCKSS系统正式版。基于Java技术的LOCKSS系统是一个开源的分布式系统,它无需中心级管理就能运行在一些廉价的PC机上。一个完整的LOCKSS系统包括三部分内容:顶层的出版商数据库、中间层的图书馆 Caches点(一个 Caches就是本地图书馆内的一台存储电子出版物的计算机,一个图书馆可以拥有多个Caches)、底层的用户群。Caches与出版商数据库之间实现初始电子资源的采集,即图书馆根据授权从出版商数据库摄入电子资源。中间层Caches既包括同一图书馆内部的多个 Caches,也包括不同图书馆间的Caches,各个Caches之间彼此互连,呈网状结构分布,这种结构实现了Caches之间互相备份支持的目标。底层是用户,每个Caches都提供本地服务,也可以将多个Caches集成后为特定的用户群提供服务。

LOCKSS项目对档案数字资源长期保存的启示

为了从机制上确保电子资源安全,LOCKSS系统对于每一份电子资源都至少保存6个备份,即保存在6个分布式LOCKSS BOX节点的Caches中并保持相互之间的数据同步。由于不同的图书馆位于不同的物理位置,统一接入LOCKSS分布式网络,成为其中的一个节点。这样,即使某一个节点由于黑客入侵、误操作、设备物理损坏、灾难等意外情况出现数据损坏的情况,也不会对整个网络的电子资源安全构成威胁。只要当该节点修复之后再次接入网络,又可以从其他节点中恢复数据。

LOCKSS项目对档案数字资源长期保存的启示

02

项目启示

不得不说,在20年前就能设计出这么先进的分布式存储架构,LOCKSS系统的设计者还是非常有前瞻性的,这和现在流行的基于区块链技术的分布式架构如出一辙!虽然区块链网络中的数据不一定存在本地数据库或者缓存中,也可以存在链上,但对于大容量的数据存储而言,考虑到系统性能,目前常见的做法也只是将数据的哈希值上链保存,数据本身还是存储在分布式节点的本地数据库或者文件系统中。

那么LOCKSS项目给当前的档案数字资源长期保存工作有什么启示呢?首先,我们必须得认识到,不管是LOCKSS项目的分布式存储网络还是基于区块链的分布式网络并不适用于档案数字资源的长期保存,因为档案数字资源具有较强的敏感性和保密属性,在绝大多数情况下,档案保管机构之间的网络是不通的,甚至很多情况下,重要档案数字资源需要离线保存。档案机构之间的联网很多情况下不是为了档案数据安全存储,而是为了开放档案的共享利用。但是,LOCKSS项目这种“大量拷贝确保数据安全”的思想是值得档案保管机构借鉴的,尤其是对于档案数字资源的长期保存而言。

03

电子档案库房解决方案

翼存(上海)智能科技有限公司推出的电子档案库房解决方案就借鉴了LOCKSS项目“大量拷贝确保数据安全”的理念。所谓电子档案库房(Electronic Archives Repository,EAR)就是保存电子档案的库房,为了确保电子档案的安全,电子档案库房一般采用离线的方式保存电子档案。由于电子文件易修改、环境依赖、存储载体可分离等特性,单一的备份载体显然无法满足档案数字资源长期安全保存的需要,比较切实可行的措施是采用不同介质多套备份组合的方式来确保档案数据安全。可以预计,将来各级各类档案部门都会形成磁、光、电、胶等多种档案数字资源备份载体。因此,电子档案库房实际保存的是存储电子档案的物理载体,比如磁盘、光盘、磁带、胶片等。

另外,由于载体本身的不可直读特性,还需要配置各种载体的读取设备;由于各种载体的保管条件要求不同,还需要配置各种存放不同特性载体的保管设备,这些载体读取和保管设备统称电子档案库房装具。电子档案库房示意如下图所示:

LOCKSS项目对档案数字资源长期保存的启示

在电子档案库房中,我们采用了4-3-2-1数据长期保存(备份)策略,基于不同的备份载体,实现档案数据的多套备份,满足档案管理规定的异质、异地、离线备份要求。

4套数据

1套在线/1套近线/1套异地/1套异质

3种载体

磁盘/光盘/胶片

2套离线

光盘1套/胶片1套;其中1套异地

1套异质

胶片

LOCKSS项目对档案数字资源长期保存的启示

欢迎更多的人投身到档案领域,投稿留言并发表真知灼见;关注我们,共同为人类文明的传承而努力奋斗!

—— END ——

LOCKSS项目对档案数字资源长期保存的启示

数字罗塞塔计划

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022年8月15日 下午2:11
下一篇 2022年8月15日 下午2:25

相关推荐

  • 基金会科研项目申请书范文基金会科研项目申请书范文

    基金会科研项目申请书范文 尊敬的基金会领导: 我代表 [姓名] 基金会向贵基金会提交科研项目申请书。 本申请项目的名称为 [项目名称],是一项 [项目概述] 的科研项目。 [项目概…

    科研百科 2024年7月9日
    27
  • 工程招投标与合同管理

    工程招投标与合同管理是建筑行业中至关重要的两个环节。在工程招投标过程中,承包商需要向招标机构提交一定数量的申请材料,并通过严格的资格预审和招标过程,以获得参与竞标的资格。在合同管理…

    科研百科 2024年9月22日
    11
  • 可以多人协作的办公软件(多人办公系统)

    多人办公系统是现代企业必须拥有的一件重要设备,能够提高团队协作效率,减少沟通障碍,从而提高工作效率和生产力。本文将介绍多人办公系统的工作原理、优点和使用方法。 多人办公系统是一种用…

    科研百科 2024年8月28日
    22
  • vscodeweb低代码

    VSCode是一款功能强大的代码编辑器,而VSCode Web则是其在Web平台上的版本。低代码开发是一种快速构建应用程序的方法,通过使用可视化界面和少量的编码,开发人员可以快速创…

    科研百科 2024年2月28日
    42
  • 学校预算经费管理办法

    学校预算经费管理办法 为加强学校预算经费管理,规范预算经费的使用,保障学校的正常运营和发展,根据《中华人民共和国预算法》等相关法律法规,结合学校实际情况,制定了学校预算经费管理办法…

    科研百科 2024年7月12日
    48
  • 工程监督管理局(工程监督管理系统)

    工程监督管理系统 随着现代工程领域的迅速发展,工程监督管理系统已成为确保工程质量、安全、进度和成本的关键工具。工程监督管理系统是一种自动化的计算机系统,用于对工程项目进行实时、全面…

    科研百科 2024年6月6日
    44
  • 智能地磅称重软件如何管理磅房(地磅称重管理软件下载)

    衡安智能地磅称重软件使用专业的射频识别技术、红外线监控设备、监控摄像系统、智能化道闸控制等多类防做弊设施,智能软件自检测与警报技术,辅以多级别使用管理权限和数据加密功能,完全杜绝做…

    2022年8月23日
    187
  • 四期科研项目名称是什么意思(四期科研项目名称是什么)

    项目名称: 探索未知世界 自人类诞生以来,我们一直在探索未知的世界。从寻找宇宙的起源到探索地下的洞穴,从探索海洋的深处到探索外太空的星球,我们的探索精神从未停止。但是,我们并不知道…

    科研百科 2024年8月3日
    18
  • 果断收藏!这5方面进行严格控制,才能保证工程质量(工程质量严格把控)

    工程施工管理的重要内容包括质量、进度和投资管理,这三项管理工作是相互制约、相互影响的统一体。在施工阶段,工程的质量尤其重要,是决定工程建设成败的关键。 影响工程质量的因素有很多,主…

    科研百科 2022年11月13日
    231
  • 协同办公 软件

    协同办公软件: 让工作更加高效 随着数字化时代的到来,协同办公软件已经成为现代企业必不可少的工具之一。协同办公软件可以帮助企业更好地组织和管理员工,提高工作效率,提高团队协作和沟通…

    科研百科 2024年9月18日
    10