行业新闻

行业新闻

首页 > 新闻中心 > 行业新闻 > 智慧档案馆数据化管理功能的实现

智慧档案馆数据化管理功能的实现

2021-04-23 热度:506 ℃

档案馆是各类信息资源的主要保存和服务机构,长期致力于数字记忆保护工作,其中既包括文本内容的长期保存, 也包括元数据的有效获取。[1]面对大数据时代这一新型学术  需求,智慧档案馆数据化管理应当借助数字技术,提高资源的语义化、智慧化水平,扩大信息共享的范围和深度,积极创新服务方式和方法。

 

智慧档案馆数据化管理的必要性

1.1 档案数据化转型。档案馆收藏和保存了社会活动中的各政府机构和职能机构的重要文件、特殊手稿以及具有文化、历史和文学意义的珍贵资料。档案通常属于未公开发表的唯一版本资料,更具有珍贵性与稀缺性的特点。另外,档案的史料价值和证据价值也决定了其必然成为网络基础设施建设中的主力军。新环境下,档案馆必须转换思路,变藏为用,变被动为主动。

档案数据化转型指的是在档案中,以数据作为载体和表现形式的那部分档案,其外延既包括档案内容、结构、背景数据,也包括非档案内容本身但档案产生的软硬件环境数据、档案业务活动过程中产生的数据以及应该归档但未进行归档的政务数据等,既具有档案性也具有数据性。

1.2 做好数据的前端控制和版本的永续存储。对于数据的质量控制和长期存储来说,档案馆具有理论和经验优势。档案专家应该积极加入数据的前端控制和版本的永续存储方案设计、实施和维护的各个阶段中,帮助实现数字环境下的动态、原生数字数据进行实施数据采集、质量监控和版本的永续存储,以备后期人文研究查考、利用。[2]因此,必须保证  数据安全、可靠、完整。可读的措施付诸数据“采集-处理- 呈现”的全过程中,才可以有效防止数据的丢失和损坏。档案专家应该积极介入专题数据库及服务平台的建设,在系统设计阶段实行前端控制,对数据生成和管理质量进行监控, 保证项目的后续实施效果和版本的永续存储。

 

智慧档案馆数据化管理功能的实现路径

2.1 数字技术支持让档案数字资源有了更为宽广的生存空间。尽管网络技术和数字技术飞速发展,让档案数字资源有了更为宽广的生存空间,存储技术、搜索技术、编目技术的出现使档案数字资源各个管理环节更加趋于自动化、智能化、高效化,并且管理成本也在大幅降低。但对于其中档案内容的数字化来说,智慧技术并不能取代数字技术。智慧档案馆对实体档案可以运用射频识别标签实现泛在感知,可以运用3D库房技术实现实时监测,但将实体档案转化成为不受时空利用限制的数字化资源则需要数字技术,数字技术将传统载体档案进行扫描、转录等,以数字信号形式保存在计算机中,同时还可以结合数字技术实现声影档案展示,为用户提供虚拟体验。如果没有数字技术实现的数字化馆藏,那么智慧档案馆的智慧将要大打折扣。

2.2 数字技术将人工智能与传统文字识别技术进行结合。传统的文字识别技术是将图像进行二值化和灰度化后, 将文字作为前景信息,其他部分作为背景信息,通过区分两者的明暗不同来判别哪些是识别区域,再对文字识别区域进行切割和分类,最后基于统计模型进行纠错和识别。但传统识别方法在面对复杂的识别环境时难以提高识别准确率,如多语言混合、低分辨率、非均匀光照、艺术字体、复杂版式等情况,研究人员为了克服这些难点,尝试了很多种方法。近年随着深度学习的兴起,打破了传统OCR的技术瓶颈。传统的机器学习需要先确定特征和标签,然后用一系列算法对这些数据进行计算,然后保存模型,最后对分类的准确性进行预测。这种方法有其缺点,如果提取的特征数量过多,可能会因为偏向于某个特征而出现过拟合的情况,如果提取的特征数量过少,则可能没办法进行精确分类,出现欠拟合的情况。

传统神经网络算法采用全连接的网络结构,一个28× 28的矩阵可能需要11万多个参数,参数实在太多,计算量巨大,在图像识别中显然不是很适合。于是开始考虑卷积神经网络。卷积神经网络的思想是在识别一个物体时,通常通过某个局部特征就能识别出该物体为何,并不需要全部识别


发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

相关文章

《档案馆高压细水雾灭火系统技术规范》

《档案馆高压细水雾灭火系统技术规范》

为规范档案馆高压细水雾灭火系统的设计、施工、验收和维护管理,2009年,国家档案局发布了《档案馆高压细水雾灭火系统技术规范》(DA/T 45— 2009,以下简称《规范》),该规范实施至今已有10余年...

两单位挂牌“全国示范数字档案室”

两单位挂牌“全国示范数字档案室”

本报讯(记者吕宁丰 通讯员梅正亮)18日,由国家档案局主办,江苏省档案局承办,南京市档案局协办的“全国数字档案室建设推进会”在南京召开。建邺区档案局、南京市审计局分别做经验交流,国家档案局还在两家单位...

扶贫办档案整理归档解决方案(一)

扶贫办档案整理归档解决方案(一)

归档文件“件”的区分与修整首先是以我为本(以发文单位为主)。凡是本单位所产生的发文(红头文)必须归档,其它单位(包括上级、同级和下级机关)的来文,需要办理的文件(办件)必须归档,重要的文件材料应该归档...

图纸扫描分析

图纸扫描分析

  随着国民经济领域中各种基础建设的开展与深入, 空间信息的需求量正迅速增长, 空间信息系统市场随之迅速扩展。而数据采集及其质量一直是该信息系统建设和运行的 关键问题, 如何提高数据采集的精...

中国政府采购评审

中国政府采购评审

第一章  总则  第一条为加强对浙江省政府采购评审活动的管理,规范政府采购评审专家的评审行为,提高政府采购工作质量和效率,根据《中华人民共和国政府采购法》(以下简称《政府采购法》)、《中华...

智慧城市背景下智慧档案馆建设优劣势分析

智慧城市背景下智慧档案馆建设优劣势分析

一、智慧城市与智慧档案馆智慧档案馆的出现,始于“智慧地球”、“智慧城市”理念的提出。2008年,IBM公司正式提出了“智慧地球”的概念。2009年,“智慧地球”成为了美国国家战略的一部分。2010年,...

国际档案日的由来和意义

国际档案日的由来和意义

1948年6月9日至11日,位于巴黎的联合国教科文组织召开了一场专家会议,来自世界上许多国家的档案工作者参加了会议交流,经大家讨论决定成立国际档案理事会(International Council o...

财政部国库司有关负责人就 《关于在政府采购活动中查询及使用信用记录 有关问题的通知》答记者问

财政部国库司有关负责人就 《关于在政府采购活动中查询及使用信用记录 有关问题的通知》答记者问

 为了落实国务院有关要求,推进社会信用体系建设、健全守信激励失信约束机制,财政部制定印发了《关于在政府采购活动中查询及使用信用记录有关问题的通知》(财库〔2016〕125号,以下简称《通知》)。近日,...