数据库的导入规范

上传人:ji****n 文档编号:45654878 上传时间:2018-06-18 格式:DOC 页数:2 大小:27.50KB
返回 下载 相关 举报
数据库的导入规范_第1页
第1页 / 共2页
数据库的导入规范_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据库的导入规范》由会员分享,可在线阅读,更多相关《数据库的导入规范(2页珍藏版)》请在金锄头文库上搜索。

1、我最早使用的一个关系型 DBMS 就是 Microrims R:Base 4000. R:Base,与其 PC 竞争对 手 dBase 不同的是,它是真正的关系型数据库管理系统,是在 20 世纪 80 年代初作为 NASA RIM(关系信息管理,Relational Information Management)系统的一个 PC 版本开发 出来的。而我最欣赏的功能之一是它允许用户在导入过程中查看示例数据。尽管像 bcp、DTS、新的 SQL Server 2005 集成服务这样的工具以及各种移植工具和向导已经 将数据导入过程自动化到 SQL Server 之中,但这不意味着我们可以一劳永逸。本

2、月, Ron Talmage 提供一些关于导入数据导入数据的非常好的常识性建议。 SQL Server DBA(Database Administrator,数据库管理员)发现他们经常使用 T-SQL 导入和处理数据。 为什么呢?因为一些数据传输需要技术成熟的 SQL 所具备的强大功能。最近我刚好完成了 另一个数据导入的案例,该案例触动我汇编了一份供我使用的行为规范列表。确保将载入的原始数据暂存为确保将载入的原始数据暂存为 varchar 数据类型数据类型源自所谓的旧式系统的原始数据通常以文本格式传送,因此我首先总是将原始数据载 入一个单独的暂存数据库。我从不尝试将数据直接载入一个成品数据库。

3、我做的事情是将所有 原始文本数据载入相应的原始表,表中的列为 varchar 数据类 型。(DTS 将自动完成该过程,这样很好。但是,DTS 还会将列命名为 COL001,因此您 不用事先提供列名。)varchar 的主要优点是它能够接收任何数据 甚至是“坏”数据。如 果您尝试从一个没有对用户输入的数据进行严格检查的旧式系统加载数据,那么被忽略的 数据或写入异常文件的数据可能比加载的数据还多,如果您不想冒这样的风险,除非接收 每一个可能的值。将字符载入 varchar 数据类型的列则可以做到这一点。在暂存表在暂存表/列名时不要使用非字母数字字符列名时不要使用非字母数字字符您可能无法控制在包含原

4、始数据的表中如何对列进行初始命名,但是我会尝试修改可 能包含空格或其他非常规字符的旧式列名。当列名或表名包含非字母数字的字符时,我们 必须使用方括号或双引号对其进行分隔。这种代码不但编写起来比较困难,而且可读性较 差。不要在列名中使用关键字不要在列名中使用关键字源自旧式系统的数据通常包含能够破坏 SQL 查询的描述性列名。例如,房地产数据 可能会包含一个名为 KEY 的列,它用来反映放置在待售房屋上的钥匙箱。然而,KEY 也 是 T-SQL 中的一个关键字 (!),如果使用这样的列名,查询操作在直接引用该列名时将失 败。因此,最终您必须用方括号或双引号分隔含有关键字的列名。确保使用正确的数据类

5、型创建一个暂存表确保使用正确的数据类型创建一个暂存表下一步是创建一个或多个额外的暂存表,这些表有“正确的”数据类型。我喜欢使暂存 表和目标 OLTP(Online Transaction Processing,联机事务处理)数据库中的目的表具有相 同的列名。不管怎样,重要的是原始数据中每列的数据类型在载入暂存时都将执行检查并 予以改正。在 SQL Server 表中找到坏数据比在加载失败的外部文件中找到坏数据容易得 多。确保将新列添加到暂存表中确保将新列添加到暂存表中当暂存数据没有相应的列时,您可以添加这些列,然后拆分或合并载入的数据。例如, 即使目的表分解出街道名和门牌号,地址仍然可能作为一

6、个简单的字符串载入暂存表。那 么您可以在暂存表中添加街道名列和门牌号列,将旧式地址分解为两个列。这样做的优点 是,原始数据与新拆分的数据并存,因此您能够通过比较列来测试脚本。确保使用本地副本来测试填充的产品数据确保使用本地副本来测试填充的产品数据当您准备好要插入暂存表的数据时,可以首先通过将其插入成品表的本地副本来测试 这些数据。有时您只需清空表;有时,您必须填充表。确保保留产品约束确保保留产品约束在副表上总是保留产品约束。这样,您就能够测试暂存表数据满足这些约束的程度。 这些约束包括 NULL、默认值、检查、主键和外键约束。首先保证副表列上的 NULL 或 NOT NULL 属性与目标系统的

7、相同,然后再逐步检查其他所有约束。如果您的测试表明暂 存数据插入过程满足所有约束,那么您距离成功就只有一步之遥了。确保在一个产品数据副本上测试确保在一个产品数据副本上测试虽然将导入数据插入空表将遇到很多潜在的问题,但是不会遇到所有的问题。在通过 了所有之前的测试后,确保您将在一个目标数据或成品系统的副本(或至少是一个合理的子 集)上测试导入。您能够接收的最终错误类型将由数据配置决定,而且这是此项测试能够检 测到的。那么,您就能够在数据库副本中检查结果,甚至可能将应用程序重定向到该副本 以便进一步测试和验证。 【专栏作家 Tom Moreau 补充说, “使用每日成品更新数据进行测 试可以为数据移植做准备。如果原来的系统没有足够的约束而新系统有,那么坏数据将进 入原来的系统并破坏您的移植。 ” - Ed.】如果导入过程至此通过了所有测试,那么您可能已经准备好进行导入数据了,或者至 少可以将导入过程交给质量管理员 (QA, Quality Assurance) 了。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号