出版时间:2006-2 出版社:清华大学出版社 作者:[美]埃克马尔(Chaudhri,A.B.)阿瓦斯(Rashid,A.)罗伯托(Zicari,R.) 页数:432
Tag标签:无
前言
随着Internet和信息技术的高速发展,XML已经成为Internet上信息交换和表示的重要标准,XML数据的数量正在呈指数级增长,如何高效、系统、科学地管理这些GB、TB乃至PB级的XML文档已成为数据库研究领域中的一个重要挑战。我们非常高兴能够向广大读者推荐这本XML数据管理方面系统而全面的专业书籍。到目前为止,我们还没有看到过任何一本与本书类似的书籍。在本书中,读者既可以找到对最新出现的纯XML数据库的研究和分析,也可以深入了解支持XML的关系数据库系统的相关信息和知识。同时,本书也详尽地给出了各种评测基准以及用于测试XML数据库性能的分析技术。. 本书的翻译工作主要由邢春晓、张志强、李骅竞..
内容概要
本书由活跃在XML领域最前沿的专家编写,展示了使用XML进行信息建模的最好方式,涉及了各种数据管理问题的关键,提供了对各种XML解决方案优缺点的深入分析,介绍了一些自定义的内部解决方案,是一本出色地把XML数据管理领域中的实践经验和理论分析结合在一起的书。 本书由5个相对独立的部分组成,包括的主题有: ·良好的语法和格式在XML信息建模中的作用。 ·开放源系eXist的特性和API。 ·IBM DB2通用数据库及其对XML应用的支持。 ·Oracle用于管理以XML文档为中心的XML Type类型。 ·一种在关系数据库中存储XML文档的通用体系结构。 ·Tamino数据库的XML存储、索引、查询和数据访问特性。 ·Berkeley DB XML以纯XML方式存储XML文档的能力。 ·Xperanto用于解决信息集成需求的方法。 ·Microsoft SQL Server 2000对输出输入XML数据的支持。 ·用于评估XML数据库性能的XOO7、XMach-1、XMark以及其他评测基准。 本书可供高等院校学生学习高级数据库课程时使用,也可作为XML和关系数据库专业人员的参考手册。
书籍目录
第1部分 什么是XML第1章 利用XML进行信息建模 21.1 引言 21.2 XML是一个信息领域 21.3 XML如何表达信息 31.4 XML中的模式 41.5 XML信息建模的常见问题 61.5.1 将属性作为数据元素使用 71.5.2 将数据元素作为元数据使用 71.5.3 使用不充分的标签 91.6 一种非常简单的设计XML的方法 101.7 小结 12第2部分 纯XML数据库第2章 Tamino——Software AG公司 的纯XML服务器 142.1 引言 142.2 Tamino的体系结构与API 142.3 XML存储 162.3.1 集合和文档类型 172.3.2 模式 172.3.3 访问其他数据库——Tamino X-Node 202.3.4 将数据映射到相关的功能——Tamino X-Tension 222.3.5 国际化的问题 242.3.6 索引 252.3.7 在磁盘上的组织 262.4 查询XML 272.4.1 查询语言——Tamino X-Query 272.4.2 会话和事务 272.4.3 对结果的处理 282.4.4 执行查询 282.5 工具 292.5.1 浏览数据库 292.5.2 编辑模式 292.5.3 访问WebDAV 302.5.4 X-Application 302.6 完整的数据库功能 312.7 小结 31第3章 eXist纯XML数据库 323.1 引言 323.2 系统特性 323.2.1 无模式的XML数据存储 323.2.2 数据集合 333.2.3 基于索引的查询处理 333.2.4 用于全文检索扩展 333.3 系统体系结构 343.3.1 可插拔的存储后端 343.3.2 部署 343.3.3 应用开发 353.4 开始使用eXist 353.5 查询语言的扩展 353.5.1 指定输入文档集合 363.5.2 文本查询 363.5.3 突出的特性 373.6 应用开发 373.6.1 使用XML:DB API编写Java应用 373.6.2 使用SOAP访问eXist系统 393.6.3 与Cocoon集成 413.7 技术背景 433.7.1 查询执行的不同方式 433.7.2 索引方案 443.7.3 索引与存储的实现 463.7.4 查询语言处理 483.7.5 查询性能 503.8 小结 51第4章 嵌入式XML数据库 524.1 引言 524.2 嵌入式数据库简介 524.3 嵌入式XML数据库 534.4 为嵌入式XML数据库开发应用程序 544.4.1 Berkeley DB XML系统概述 554.4.2 配置 564.4.3 建立索引和索引类型 564.4.4 XPath查询处理 584.4.5 对事务进行编程 604.4.6 两阶段加锁和死锁 614.4.7 减少资源竞争 634.4.8 检查点 644.4.9 故障后的恢复处理 654.5 小结 65第3部分 XML和关系数据库第5章 IBM支持XML的数据管理 产品体系结构和技术 685.1 引言 685.2 现有产品和技术概要 685.2.1 DB2通用数据库 685.2.2 信息集成技术 685.3 当前的体系结构和技术 695.3.1 共享的体系结构和技术 695.3.2 XML Extender的体系结构 705.3.3 XML Extender技术 715.3.4 同时使用XML Collection和XML Column 755.3.5 XML数据转换 765.3.6 XML数据的查询、解析和验证 765.3.7 XML Extender的联邦支持 775.3.8 SQL/XML支持的体系结构 775.3.9 SQL/XML支持技术 785.3.10 数据管理Web服务体系结构 805.3.11 数据管理Web服务技术 815.3.12 信息集成体系结构和技术 835.4 未来的体系结构和技术 855.4.1 一个设想 855.4.2 应用接口、数据类型和API的目标 855.4.3 存储、引擎和数据管理器的目标 875.4.4 为什么需要在一个系统中同时支持XML和关系存储 895.4.5 为什么从长远来看不考虑对象—关系方法 895.4.6 紧密相关的技术领域 905.5 小结 905.6 注意 90第6章 Oracle9i对XML的支持 926.1 引言 926.2 将XML存储为CLOB 946.2.1 使用CLOB和OracleText包 946.2.2 OracleText中的查询谓词 956.2.3 XML特有的功能 966.2.4 前提条件 976.3 XMLType 996.3.1 对象类型XMLType 996.3.2 Java中的XMLType处理 1016.4 使用XSU实现细粒度存储 1016.4.1 标准映射 1026.4.2 检索 1046.4.3 修改 1066.5 从关系数据建立XML文档 1086.5.1 SQL函数existsNode和extract 1086.5.2 SQL函数sys_XMLGen 1086.5.3 SQL函数SYS_XMLAgg 1106.5.4 PL/SQL包DBMS_XMLGen 1116.6 数据库的Web访问 1126.6.1 XSQL原理 1126.6.2 将XML数据发布到数据库中 1146.6.3 参数化 1156.6.4 Servlet调用 1166.7 专有的Oracle特征 1176.7.1 URI支持 1176.7.2 解析器 1216.7.3 类生成器 1216.7.4 特殊的Java Bean 1236.8 小结 123第7章 Microsoft SQL Server 2000对XML的支持 1257.1 引言 1257.2 XML和关系数据 1257.3 SQL Server的XML访问 1267.3.1 通过HTTP访问 1267.3.2 通过SQLOLEDB、ADO和.NET使用XML特征 1287.4 将SQL查询的结果序列化为XML 1287.4.1 raw方式 1307.4.2 auto和nested方式 1307.4.3 explicit方式 1317.5 在XML上提供关系视图 1337.6 SQLXML模板 1367.7 在关系数据上提供XML视图 1377.7.1 注释模式 1377.7.2 使用XPath进行查询 1387.7.3 使用Updategram的修改 1407.7.4 批量加载 1417.8 小结 142第8章 将XML文档存储到关系数据库中的通用体系结构 1438.1 引言 1438.2 系统体系结构 1458.2.1 安装Xerces 1458.3 数据模型 1458.3.1 关系数据库中的DOM存储 1478.3.2 嵌套集合模型 1478.4 创建数据库 1488.4.1 物理数据模型 1488.4.2 创建用户定义的数据类型 1498.4.3 创建表 1508.4.4 从仓储中序列化一个文档 1568.4.5 手工创建一个XML文档 1608.5 连接仓储 1628.5.1 xmlrepDB类 1628.6 上载XML文档 1688.6.1 xmlrepSAX类 1688.6.2 数据条目的存储过程 1728.6.3 uploadXML类 1778.6.4 extractXML类 1898.7 查询仓储 1928.7.1 Ad Hoc SQL查询 1928.7.2 文本搜索 1958.7.3 一些其他的存储过程 1958.7.4 生成XPath表达式 1978.8 未来的进一步完善 2008.9 小结 200第9章 一种建立高性能XML仓储的对象—关系方法 2019.1 引言 2019.2 XML使用实例场景纵览 2029.3 高层系统体系结构 2039.4 细节设计描述 2079.5 小结 220第4部分 XML应用第10章 生物信息中的知识管理 22210.1 引言 22210.2 分子生物学背景简介 22310.3 生命科学正致力于使用XML对信息建模 22610.4 一个基因信息模型 22810.5 NeoCore XMS* 23410.6 将BLAST集成到NeoCore XMS 23710.6.1 序列搜索类型 23810.7 小结 242第11章 XML在IBM DB2通用数据库中的使用案例分析 24311.1 引言 24311.2 案例分析1:重要客户优先 24311.2.1 公司情况 24311.2.2 问题的解决 24411.2.3 进一步的扩展 24611.3 案例分析2:改善现金流转 24711.3.1 公司情况 24711.3.2 问题的解决 24711.3.3 进一步的扩展 25111.4 小结 25111.5 注意 251第12章 使用XML和J2EE技术设计并实现工程数据管理系统 25312.1 引言 25312.2 背景及要求 25312.3 概述 25412.3.1 安全服务 25412.3.2 查询服务 25512.3.3 图像查询服务 25512.3.4 打印服务 25612.4 设计选择 25612.4.1 在OAI中使用XML 25612.4.2 将输入的XML文档转换为对象 25712.4.3 将数据库中的数据转换成XML 25812.4.4 将图像数据转换成XML 25812.4.5 数据库的存取 25812.4.6 验证 26012.5 未来发展方向 26112.5.1 XSLT 26112.5.2 Web服务 26112.5.3 大量数据传输能力 26212.5.4 消息机制 26212.6 小结 263第13章 GIDB系统中使用支持XML的技术实现地理数据交换 26413.1 引言 26413.2 GIDB中的METOC数据集成 26613.2.1 背景 26613.2.2 实现 26713.3 GIDB Web地图服务的实现 27113.4 GIDB中GML的导入和导出 27513.5 小结 278第14章 利用可重用组件的分布式系统配置适配器实现空间网(SWW) 28014.1 引言 28014.2 高级概念描述:研究问题 28014.2.1 未来的通信和卫星群 28214.3 系统框架的组件集成 28414.4 实例 28514.5 研究高级概念、SWW和交叉领域的下一代NASA机构 28714.6 高级概念的开发 28814.6.1 研究方法 28814.6.2 研究任务 28914.7 小结 296第15章 归纳数据库中的XML统一框架 29715.1 引言 29715.2 过去的工作 29815.2.1 提取和评价关联规则 29815.2.2 数据分类 30115.2.3 归纳数据库 30315.2.4 PMML 30515.3 数据模型:XDM 30715.3.1 基本概念 30815.3.2 使用XDM的分类 31115.3.3 XDM中的关联规则 32015.4 XDM的优势 32915.5 发展为自适应的开放系统 33015.6 相关工作 33115.7 小结 333第16章 设计和管理XML数据仓库 33416.1 引言 33416.1.1 为什么用XML的视图机制 33416.1.2 主要内容 33416.1.3 概要 33516.2 体系结构 33516.3 数据仓库规范 33616.3.1 XML文档的视图模型 33616.3.2 数据仓库规范的图形化工具 33816.4 元数据管理 33916.4.1 数据仓库 33916.4.2 视图定义 33916.4.3 中介模式定义 34216.5 数据仓库的存储和管理 34216.5.1 存储XML数据的不同策略 34316.5.2 XML数据到关系数据库的映射 34316.5.3 视图存储 34416.5.4 数据提取 34416.6 DAWAX:定义和管理数据仓库的图形化工具 34516.6.1 数据仓库管理器 34516.6.2 不同的DAWAX包 34516.7 相关工作 34616.7.1 XML查询语言 34616.7.2 存储XML数据 34616.7.3 XML数据集成系统 34616.8 小结 347第5部分 性能和测试基准第17章 XML管理系统的评测基准 35017.1 引言 35017.2 评测基准的规范 35017.3 评测基准的数据集 35117.3.1 评测基准中的查询语句 35217.4 现有的XML评测基准 35317.4.1 XOO7评测基准 35317.4.2 XMach-1评测基准 35717.4.3 XMark评测基准 35917.5 小结 364第18章 Michigan评测基准:用于XML查询性能测试的微型基准 36618.1 引言 36618.2 相关工作 36718.3 评测基准的数据集 36818.3.1 对数据特征的讨论 36818.3.2 评测基准数据的模式定义 37018.3.3 生成字符串属性和元素内容 37118.4 评测基准的查询语句 37318.4.1 选择 37318.4.2 基于值的联结 37718.4.3 基于指针的联结 37718.4.4 聚集 37718.4.5 更新 37818.5 评测基准的使用 37818.6 小结 379第19章 数据库中存储XML文档方式的比较 38119.1 引言 38119.2 XML文档的数据模型 38119.2.1 非类型辨识的DOM实现 38219.2.2 类型辨识的DOM实现 38319.3 存储XML文档的数据库 38419.3.1 关系数据库 38419.3.2 面向对象数据库 38719.3.3 目录服务器 38719.3.4 纯XML数据库 39119.4 评测基准规范 39119.4.1 对关系数据库进行评测 39119.4.2 对面向对象数据库进行评测 39219.4.3 对目录服务器进行评测 39219.4.4 对纯XML数据库进行评测 39319.5 测试结果 39319.5.1 性能评价 39419.5.2 空间效率的评价 39519.5.3 小结 39619.6 相关工作 39619.6.1 对存储和获取XML文档过程的研究 39719.6.2 XML和关系数据库 39719.6.3 XML和对象-关系数据库 39819.6.4 XML和面向对象数据库 39819.6.5 XML和目录服务器 39919.6.6 XML数据库的评测基准 39919.6.7 评测XML数据库的原则 40019.7 小结 400第20章 支持XML的数据库和纯XML数据库的性能分析 40220.1 引言 40220.2 相关工作 40320.3 方法 40420.4 数据库设计 40520.5 讨论 40820.6 实验结果 40920.6.1 数据库大小 40920.6.2 SQL操作(单条记录) 41020.6.3 SQL操作(多条记录) 41220.6.4 报告 41320.7 小结 414第21章 结论 416参考文献 419
编辑推荐
《XML数据管理:纯XML和支持XML的数据库系统》由5个相对独立的部分组成,包括的主题有: ·良好的语法和格式在XML信息建模中的作用。 ·开放源系eXist的特性和API。 ·IBM DB2通用数据库及其对XML应用的支持。 ·Oracle用于管理以XML文档为中心的XML Type类型。 ·一种在关系数据库中存储XML文档的通用体系结构。 ·Tamino数据库的XML存储、索引、查询和数据访问特性。 ·Berkeley DB XML以纯XML方式存储XML文档的能力。 ·Xperanto用于解决信息集成需求的方法。 ·Microsoft SQL Server 2000对输出输入XML数据的支持。 ·用于评估XML数据库性能的XOO7、XMach-1、XMark以及其他评测基准。
图书封面
图书标签Tags
无
评论、评分、阅读与下载