1 模型就是抽象化
这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换过程。
2 举一个小例子
现实世界 概念世界 逻辑世界 计算机世界
信用 特性 属性 列(字段、数据项)
张三 个体 实体 记录
客户 整体 同质总体 表文件
客户与产品 整体间联系 异质总体 数据库
3. 数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的分析数据、描述数据和细节数据
4 数据仓库物理模型的优化问题
1.合并表:几个表的记录分散存放在几个物理块中时,多个表的存取和连接操作的代价会很大。
2.建立数据序列:按照某一固定的顺序访问并处理一组数据记录。将数据按照处理顺序存放到连续的物理块中,形成数据序列。
3.引入冗余:一些表的某些属性可能在许多地方都要用到,将这些属性复制到多个主题中,可以减少处理时存取表的个数。
4.表的物理分割:每个主题中的各个属性存取频率是不同的。将一张表按各属性被存取的频率分成两个或多个表,将具有相似访问频率的数据组织在一起。
5.生成派出数据:在原始数据的基础上进行总结或计算,生成派出数据,可以在应用中直接使用这些派出数据,减少I/O次数,免去计算或汇总步骤,在更高级别上建立了公用数据源,避免了不同用户重复计算可能产生的偏差。
5 。
从用户的角度分析
从技术的角度分析
6 。
1.索引创建策略
建立索引时,按照索引使用的频率,由高到低逐步添加。
按主关键字和大多数外部关键字建立索引
2.事实表索引的创建
事实表中一定要设置主键
3.维表索引的创建
4.数据加载索引的创建
关系型数据库、多维数据库和对象数据库 。
5 多维数据库
总结起来就是:横向的是一个空间。(一张表) 纵向又是一个空间。(一张表)。
1.MOLAP的创建
阶段:
选择功能
确定分析数值
构造分析维
定义逻辑模型
数据库设计的部分:
举例:用PERSON 实体和PERSON_TYPE 实体来描述人员。比方说,当John Smith, Engineer 提升为John Smith, Director 乃至最后爬到John Smith, CIO 的高位,而所有你要做的不过是改变两个表PERSON 和PERSON_TYPE 之间关系的键值,同时增加一个日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE 表就包含了所有PERSON 的可能类型,比如Associate、Engineer、Director、CIO 或者CEO 等。还有个替代办法就是改变PERSON 记录来反映新头衔的变化,不过这样一来在时间上无法跟踪个人所处位置的具体时间。
此例子:说明了处理的一种方式、。多角度考虑问题。
复合主键:
Create Table 表名 (字段名1 Int Not Null,
字段名2 nvarchar(13) Not Null Primary Key (字段名1, 字段名2), 多个字段标示唯一的实体。
在SQL查询效率上 复合主键和单主键 都是一样。 但是 操作来说只是要比单个的主键复杂一些。
分享到:
相关推荐
数据仓库总结
数据仓库个人总结的内容,适合初学者。(定义、特征、数据组织结构等)
企业大数据中台、数据仓库、大数据平台建设的经验总结,包含数据治理平台、从0到1建设数据仓库、数据中台建设经验总结、数据湖等全套大数据领域的经验总结。
数据仓库:维度建模,个人的一些经验总结,供大家学习使用。
随着人们对大型数据系统研究、管理、维护等方面的深刻识认和不断完善,在总结、丰富、集中多行企业信息的经验之后,为数据仓库给出了更为精确的定义,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间...
数据仓库与OLAP分析实验帮助大家理解数据仓库与数据挖掘
大数据中台、数据仓库、大数据平台、数据治理经验总结
学习总结内容。。
Apriori算法 具体做法:对于所研究的事务数据库D,首先找出频繁1-项集的集合,记为L1 ;再用L1找频繁2-项集的集合L2 ;再用L2找L3 …如此下去,直到不能找到频繁k-项集为止。找每个Lk需要一次数据库扫描。
第一章 数据仓库基本概念 1 1.1 背景介绍 1 1.2 OLTP与OLAP 2 1.3 数据仓库系统的查询特点 3 1.4 详细数据与小结数据(DETAIL DATA与SUMMARY DATA) 5 1.5 数据仓库与数据集市(DATA WAREHOUSE与DATA MART) 7 1.6 ...
数据仓库与数据挖掘考试习题汇总 知识点总结
绪论 2 1.1项目背景 2 1.2 提出问题 2 2 数据库仓库与数据集的概念介绍 2 2.1数据仓库 2 2.2数据集 2 3 数据仓库 3 3.1 数据仓库的设计 3 3.1.1数据仓库的概念模型设计 3 3.1.2数据仓库的逻辑模型设计 3 3.2 数据...
随着人们对大型数据系统研究、管理、维护等方面的深刻识认和不断完善,在总结、丰富、集中多行企业信息的经验之后,为数据仓库给出了更为精确的定义,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间...
共存多套开发规范、流程,目前也存在需要完善及补充、细化的地方,因此对现有的多套规 范进行重新梳理、分析及总结,取长补短,立足更远的未来,形成一套统一的,标准的流程 及规范,满足DT时代下数据仓库的数据研发...
本文作为我这些年实施数据仓库的总结,如有错误,请各位同仁指正。文档条理不是很清楚,而且也有很多口水话,我不想搞成一个真正的官方文档,所以很随意,符合我的性格。很多问题我只是提出来了,解决方案没有想好,...
一、背景概述 基于Northwind数据库实现数据仓库构建与OLAP分析 二、准备数据源 三、根据业务需求设计数据仓库 四、使用Integration Services实现数据仓库与ETL 五、使用Analysis Service实现数据分析
该文档详细探讨了基于数据仓库基础上的数据挖掘技术,作为目前研究的火热的数据挖掘技术,对于它的研究现状和研究技术进行了详细总结。
数据挖掘及数据仓库知识点总结.doc
本文档描述以一个具体的基于DSS决策系统之需要,具体实践数据仓库的理论,通过实施过程遇到的问题之解决和深层次思考,总结了实践中反映的典型问题,对从事数据仓库建设工作具有十分有价值的参考意义。