文献数据库数据加工规范

出版时间:2009-11  出版社:知识产权出版社  作者:张建勇 编  页数:178  
Tag标签:无  

前言

国家科技图书文献中心(以下简称NSTL)网络服务系统面向全国用户提供全面的科学技术文献数据检索和原文传递服务。NSTL的文献数据库建设主要包括期刊论文、会议论文、学位论文、科技报告、标准、专利等多种文献类型。数据加工规模庞大,每年加工的题录、文摘和引文数据量以千万条计,并且还在以比较快的速度增长。NSTL文献数据加工工作由9家成员馆共同承担。NSTL自成立以来,一直十分重视数据加工的标准化和规范化建设,2001年正式发布了《国家科技图书文献中心——文献数据加工细则》规范和约束数据加工的格式和内容,以提高数据加工的标准化和规范化水平。2002~2006年NSTL组织协调的《我国数字图书馆标准规范建设项目》,先后完成并推出了与数字图书馆建设相关的一系列标准和研究报告,其中多项标准涉及NSTL现有建设的多种数据资源。2008年,为进一步提高数据库建设的标准化和规范化水平,NSTL适时启动了文献数据加工细则的修订工作,遵循数字图书馆标准规范项目的相关标准和其他研究成果,从数字图书馆资源组织和现代网络信息服务的角度,重新修改和细化NSTL的数据加工规范。为此,NSTL专门成立了文献数据加工规范修订小组,修订小组的成员由各成员单位具有丰富数据加工经验的管理人员、元数据研究人员、编目人员、信息技术人员等共同组成。修订小组详细调研了文献数据加工领域的国内外的研究进展,深入研究了Dc和相关元数据的研究成果,分析了国内外同类文献信息服务系统,包括Pubmed、Web of Science、Inspec、NTIS、Science Direct等的数据格式和相关样例。听取了NSTL成员单位的数据加工人员、服务人员和系统开发人员对数据的要求,围绕数据元素的必要性、全文服务的要求、系统发布的需求等各方面因素,对数据格式和数据元素进行了多次深入的讨论。经过充分的文献调研和集体讨论,确定以我国数字图书馆标准规范项目的相关数据标准为基础,适当扩展服务中需要的数据元素,参考DC元数据的数据组织体系,组织和撰写新的NSTL文献数据库数据加工规范。按照元数据框架和数字图书馆元数据标准的规定,突出了各类型文献数据元素的特点并尽可能复用,建立了各类型文献的元数据层次结构,让使用者易于理解和执行。比如,根据期刊文献的特点将元数据结构分为母体文献层、馆藏信息层、篇名数据层、参考文献层,每一层次都确定一个数据元素集,每个数据元素都按照ISO11179标准,详细著录其标签、名称、定义、必备性、可重复性、注释、示例等元素项。最后形成的数据加工规范文档结构为:按文献类型分别组织,首先概述每一种文献类型的内涵和外延,其次说明该类型文献的数据结构和数据关系,再次分别定义该类型文献每一层次数据元素集和数据元素列表。列举完所有文献类型后,最后将所有数据元素按字顺排列详细说明。文献数据加工规范确定的数据交换格式为业界通用的xML格式,各类型文献的xML Schema详见本规范的正文部分。XML Schema主要用于NSTL业务系统之间的数据交换,以及NSTL与外部系统之间的数据交换。

内容概要

本书是国内第一部在文献数据库建设中基于元数据理论制订的数据加工和管理的规范性文档。该规范系统描述了各类文献数据的元数据描述框架、元素集的构成和元素集之间的关系。规范编制科学严谨、适用面广,具有较强的实用价值。本书对文献数据库数据加工的管理,系统数据加工的规范化建设有一定的参考作用和借鉴价值。本书适合数据加工管理人员、数据库设计人员和其他信息处理人员阅读和使用。

书籍目录

第1章 编制原则和方法 1.1 功能需求说明 1.2 规范制定原则  1.2.1 模块化原则  1.2.2 可扩展原则  1.2.3 统一化原则  1.2.4 需求原则  1.2.5 互操作原则 1.3 资源描述框架  1.3.1 元数据结构  1.3.2 元素定义方法  1.3.3 形式化描述一XMLSchema的应用第2章 术语表第3章 期刊论文描述元数据规范 3.1 概述 3.2 期刊论文元数据描述集中各元素集关系 3.3 论文描述元素集 3.4 论文作者描述元素集 3.5 期刊描述元素集 3.6 期刊卷期描述元素集 3.7 期刊收藏单位描述元素集 3.8 论文参考文献描述元素集 3.9 管理信息描述元素集第4章 会议论文描述元数据规范 4.1 概述 4.2 会议论文元数据描述集中各元素集关系 4.3 会议论文描述元素集 4.4 论文作者描述元素集 4.5 会议录描述元素集 4.6 会议文献收藏单位描述元素集 4.7 管理信息描述元素集第5章 学位论文描述元数据规范 5.1 概述 5.2 学位论文元数据描述集中各元素集关系 5.3 学位论文描述元素集 5.4 学位论文作者描述元素集 5.5 学位论文导师描述元素集 5.6 学位论文馆藏描述元素集 5.7 管理信息描述元素集第6章 文集汇编描述元数据规范 6.1 概述 6.2 文集汇编元数据描述集中各元素集关系 6.3 论文描述元素集 6.4 论文作者描述元素集 6.5 文集汇编母体文献描述元素集 6.6 文集汇编收藏单位描述元素集 6.7 管理信息描述元素集第7章 科技报告描述元数据规范 7.1 概述 7.2 科技报告元数据描述集中各元素集关系 7.3 科技报告描述元素集 7.4 科技报告作者描述元素集 7.5 科技报告馆藏描述元素集 7.6 管理信息描述元素集第8章 元素定义 8.1 abstract 8.2 abstract_alternative 8.3 affiliation 8.4 affilation_ahernative 8.5 ahernative 8.6 author_name 8.7 author_name_alternative 8.8 author_sequence  8.9 catalog_code 8.10 checkin_time 8.11 citation_authorl 8.12 citation_author2 8.13 citation_author3 8.14 citation_editor in chief 8.15 citation_issue 8.16 citation_orig_info 8.17 citation_page 8.18 citation_publisher 8.19 citation_sourcetitle 8.20 citation_title 8.21 citation_type 8.22 citation_url 8.23 citation_volume 8.24 citation_year 8.25 classification 8.26 classification_scheme 8.27 cn 8.28 coden 8.29 conference_date 8.30 conference_name 8.31 conference_no 8.32 conference_place 8.33 conferencesponsor 8.34 create_time 8.35 degree 8.36 degree_offering_org 8.37 doi 8.38 eisbn 8.39 eissn 8.40 email 8.41 end_page 8.42 end_year 8.43 fulltext_flag 8.44 holding_number 8.45 host_classfication 8.46 host_editor 8.47 host_language 8.48 host_title 8.49 host_title_alternative 8.50 ISBN 8.51 ISSN 8.52 issue 8.53 keyword 8.54 keyword_alternative 8.55 language 8.56 library_code 8.57 local_doi 8.58 major 8.59 other_language 8.60 paper_id 8.61 paper_no 8.62 paper_type 8.63 processing_mode 8.64 processing_unit 8.65 publisher 8.66 publishing_place 8.67 qualification_date 8.68 record_level 8.69 reportno 8.70 research_subject 8.71 start_page 8.72 start_year 8.73 subjectheading 8.74 submit_date 8.75 subscription_number 8.76 supervisor 8.77 supervisor_affiliation 8.78 supervisor_affiliation_alternative 8.79 supervisor_email 8.80 supervisor_name_alternative 8.81 supervisor_sequence 8.82 thesaurus 8.83 title 8.84 total_page_number 8.85 total_referencenumber 8.86 type 8.87 university……第9章 数据形式化描述XML Schema和数据样例第10章 附录

章节摘录

插图:1.1 功能需求说明本规范主要用于指导NSTL馆藏文献资源的数据描述和管理,包括期刊论文、会议论文、学位论文、文集汇编和科技报告。期刊论文、会议论文及文集汇编都是结集出版的文献,学位论文和科技报告则通常是单篇成册出版。本规范从功能上可支持:文献选择,包括:①按类型选择文献,②根据文献主题和内容选择文献,③根据文献引用频次选择文献;文献识别,包括:①根据文献特征识别,②识别文献作者及其所在机构,③通过全球通用的DOI识别文献,④通过NSTL本地通用的Local DOI识别文献,⑤识别所描述对象是否有纸本全文;文献获取,包括:①检索文献主题和文摘,②支持多语种的文献检索,③支持()pen URL链接服务器对检索结果的调用,帮助实现原文获取,④支持在NSTL成员馆范围内的全文获取;加工管理,包括:①实现按文献品种分配加工任务,避免重复加工,②按本/册管理加工进度,③根据加工深度要求(加工题录、文摘或是引文),安排加工任务,④支持OAI协议对数据的收割。1.2 规范制定原则1.2.1 模块化原则模块化被视为现代元数据最重要的特征。模块化的关键是根据实际使用的需要,将资源对象区分为若干个实体,对资源的描述,即是对多个不同实体的组合和描述。2007年DC年会上提出的“新加坡框架”以新的方式阐述了元数据模块化设计思路。根据新加坡框架的定义,一个DC元数据应用纲要至少要包括功能需求、领域模型和描述集合纲要这几部分。功能需求定义了应用纲要所需要支持完成的设计功能,以及其他一些功能需求;领域模型主要定义应用纲要所描述的基本实体概念以及它们之间主要的相互关系。领域模型既可以用文本描述,也可以采用像UML这样更为规范的描述方法;描述集合纲要是一个信息模型,定义了描述集合的结构限定,描述集合纲要以计算机可读的XML格式书写,定义了一组元数据记录,它是应用纲要可遵循的实例。

编辑推荐

《文献数据库数据加工规范》是由知识产权出版社出版的。

图书封面

图书标签Tags

评论、评分、阅读与下载


    文献数据库数据加工规范 PDF格式下载


用户评论 (总计1条)

 
 

  •   书写的很好,内容很赞
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7