关于我们 工作机会 联系我们
English 中文
首页 解决方案 图书馆和档案馆 正文

数字图书馆

阅读: 编辑: 管理员

方案背景:
      数字图书馆是以数据库技术、全文检索技术等为支撑,以建设图书馆资源数字化加工、信息智能采集与整合、信息内容管理、信息发布与全文检索、个性化信息服务等应用系统为应用目的,构建数字图书馆信息采集、信息管理与信息服务平台,实现馆藏文献存储的数字化、知识服务的智能化、馆际资源共享的最大化。
      一、总体结构
      系统体系构架
 
      系统功能结构
      数字图书馆解决方案主要是以CGRS 全文据库为应用支撑平台,围绕图书馆各种信息资源的采集和数字化加工整理、信息的存储和管理、信息的发布和服务、信息利用与挖掘等, 跨越信息的生命周期,构建数字图书馆数字资源加工、采集与整合平台,内容管理平台,信息发布检索服务平台。
      二、系统功能:
      1:纸本文献数字化加工:纸本文献数字化加工是数字图书馆资源制作与获取的重要手段。数字资源加工与管理系统融合了高速扫描、OCR 识别和全文检索三项技术,可以将数以万计的特色纸本馆藏文献快速、自动地转换成标准的PDF 格式,便于读者浏览、交换、存档和全文检索。整个系统最终经由扫描录入、图像处理、版面分析、识别、校对、版面还原、文件自动生成、批量数据入库等工序处理最终完成数字化加工流程。整个加工工序可以设置自动处理,人工干预很少,生成的文件既可以实现全文检索,又能够实现摘抄。
      文献编辑与格式转换:文献编辑与通用文档转换系统作为信息编辑与标引的有效工具, 可以实现对Office、PDF、HTML、ISO2709 等格式的电子文档进行预处理、编辑、标引和格式转换等标准化处理。系统支持编辑与标引好的信息资源自动上载、入库,实现数据的直接入库功能。数据入库自动建立索引,实现数据实时发布;系统支持本地、远程信息采集、提交上载;具有文件批处理功能,可以实现大批量文件的处理操作。
      互联网信息采集:智能互联网信息采集系统(CGSEEK5.1)作为互联网信息内容快速获取的工具,支持各种标准格式信息资源的采集,如HTML 页面、文本信息、图片、声音、视频等。对于采集下来的页面内容,系统可以进行内容分析、智能提取、过滤、分类,自动加载到后台全文及多媒体数据库中,丰富图书馆特色数据库信息资源。另外,系统支持OAI 等标准协议,可以通过互联网采集系统,建立重点学科导航库,方便嵌入到图书馆门户网站相关栏目中。
      学位论文提交:用户经过系统相应的身份验证后,进入学位论文网上提交系统,按照规定的格式对论文进行著录,对于论文正文,可以分成一个或多个文件进行提交。提交后, 用户可以在网上进行论文检索与浏览,在系统管理员授权的情况下,作者也可以进行论文修改等操作。
      2:内容管理
      图书馆数字资源绝大部分是以非结构化形式存储的,如各类电子文档、图片、音频、视频、WEB 页面等,称之为内容。我们采用CGRS 全文数据库进行有效地管理与利用。
      信息管理
      信息资源管理是以CGRS 全文数据库作为后台管理系统,全面整合与管理各种标准的信息资源,如OFFICE、PDF、HTML、TXT、XML、ISO2709 等。
      系统具有与RDBMS 接口网关,实现以主流关系型数据库(Sybase、Oracle,SQLServer 和DB2) 作为后台数据库的图书馆自动化业务集成系统的无缝连接,实现在两类数据库中一条记录的自动同步更新记录级实现自动关联。系统具有强大数据库管理及维护功能,如
      数据库定义、建立、备份、恢复、逻辑删除、物理删除、重组、增量备份、记录查重等功能。
      用户管理
      用户权限管理:系统提供独立于操作系统的用户权限管理,用户操作审计、分析与统计,日志分析与统计等功能。系统允许最多管理30000个用户,用户根据实际需要可以自定义用户数。
      用户计费管理:系统提供与用户计费系统接口,用户可以根据读者使用信息资源的情况,制定相关的计费标准,方便地进行统一的信息检索与浏览计费系统开发。
      3:信息服务:
      WEB信息发布:系统支持多栏目、多数据库的信息内容统一自动发布;系统提供基于模板技术,发布的信息和表现形式分离,所见即所得地发布信息;信息实时发布,页面动态生成与内容自动更新功能;系统实时无延时地发布各种信息;页面发布时自动生成页面链接,无需人工操作。
      全文检索:系统提供全方位全文检索手段,支持多种检索运算符,支持包括外部特征与正文内容的各种逻辑组合检索、多字段复合检索、距离检索、二次检索、历史检索、相关词扩展检索、分类导航检索、西文(字符)字段支持前方一致检索、短语与句子检索功能等;系统提供基于同义词典的扩展检索功能,能够满足特殊应用领域的高查准率和高查全率的要求,词典可维护;支持对检索结果的各种排序:对检索结果可按与检索表达式的相关性和重要性程度排序;基于字段的排序;后进先出的快速排序。
      异构资源统一检索:系统实现将图书馆常用的各种异构资源,如人大复印资料、维普、CNKI、书生电子书、超星电子书、方正电子书、万方数据等,组织成一个有机的整体,在WEB方式下为用户提供统一的信息检索服务。系统允许用户可同时选择多个资源,从同一个检索入口对多个资源提交检索请求,检索结果统一显示。
      系统不仅能统一检索图书馆常用的国内、国外商用数据库外,还提供对外部数据资源,如对图书馆新增的数据库、门户网站、搜索引擎及其他网络资源进行统一检索功能,方便用户获得全面的信息资源。
      关联检索:系统提供图、文、声、像多媒体关联检索功能,满足用户快速获取相关资源的需要;系统具备多数据库关联检索和跨服务器多数据库关联检索功能,提供自由关联、外部关联、词典关联和特征关联四种关联方法。
      全文传送与信息推送:用户自定义专题信息内容,系统根据用户设置信息要求,定时在图书馆自建数据库中搜索,把符合用户要求的全文信息自动推送到用户指定的邮箱中。目前专题信息订阅推送服务可以用于图书馆全文传送服务,构建全文信息传送系统。
      数字参考咨询:用户通过系统可以快速建立FAQ数据库,将图书馆常见的问题与解答存放在FAQ 数据库中,可以方便读者的进行查询与浏览;另外,系统提供实时在线虚拟参考咨询平台,实现交互式的在线数字化咨询服务。
      系统提供自建数据库打包成光盘专题数据库工具。该工具能够把整个数据库制作成光盘数据库,也可以在多个数据库选择部分内容制作成专题数据光盘,方便馆际之间进行特色馆藏资源的交流。
      三、安全方案
      • 检索代理:通过检索代理服务器对数据进行访问,检索用户只能访问到检索代理服务器,无法进入数据库服务器,在数据库服务其(内部网)前设置了一个“堡垒型”防火墙,拒绝黑客进入数据库服务器和局域网,增加数据库安全性。
      • 用户操作统计与分析:用户检索的记录保存在数据库中,并提供检索记录的查询、浏览、打印、统计与分析等功能。通过统计分析记录查询数据库中的内容被用户操作(包括浏览)的情况,如用户每次查询登录曰期、时间、登录IP 地址、检索用时、检索次数、下载信息的情况分析、统计等。
      • 独立于操作系统的用户管理、身份验证机制:提供系统、数据库、记录及字段级的安全控制手段;用户使用信息资源的授权机制、用户文献存取数量控制;用户IP 地址限制;数据操作审计和日志功能,控制台运行日志和故障分析工具。

相关资源
成功案例
  湖南农业大学数字图书...
  常熟市数字档案馆
我们如何可以帮助您?
  可以直接写邮件给我们?
网站地图 | 保密声明 | 隐私声明 Copyright© 2004 - 2009 UwaySoft All Rights Reserved
京ICP备09030000号