Chap03 DATABASES AND DATA WAREHOUSES
Chap03 DATABASES AND DATA WAREHOUSES
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
••••••
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
•• ••
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • •• • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • •
• • • •• •• • • • 3-1
••••••
Chapter
•••••
•••••
•••••
•••••
•••••
•••••
DATABASES AND DATA
•••••
•••••
•••••
•••••
•••••
•••••
•••••
Building Business Intelligence
•••••
•••••
•••••
•••••
•••••
WAREHOUSES
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
relational database.
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-3
•••••
•••••
•••••
•••••
•••••
•••••
an organization.
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-4
•••••
•••••
sales
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-6
•••••
•••••
INTRODUCTION
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Businesses need business intelligence (BI)
•••••
•••••
•••••
•••••
•••••
•••••
Business intelligence – knowledge about your
•••••
•••••
•••
•••••
•••••
•••••
customers, competitors, business partners,
•••••
•••••
•••••
•••••
•••••
environment, and internal operations
•••••
•••••
•••••
•••••
Enables effective decision making
•••••
•••••
•••••
•••••
•••••
•••••
Information on steroids
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-8
•••••
•••••
•••••
•••••
•••••
INTRODUCTION
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
IT tools help process information to create business
•••••
•••••
•••••
•••••
•••••
•••••
intelligence according to…
•••••
•••••
•••
••••• OLTP (online transaction processing)
•••••
•••••
•••••
•••••
•••••
•••••
OLAP (online analytical processing)
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-9
•••••
•••••
•••••
•••••
•••••
INTRODUCTION
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
OLTP – gathering and processing transaction
•••••
•••••
•••••
•••••
•••••
•••••
information and updating existing information to
•••••
•••••
•••
•••••
•••••
reflect transaction
•••••
•••••
•••••
••••• Databases support OLTP
•••••
•••••
•••••
•••••
•••••
•••••
Operational database – database that supports OLTP
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-10
•••••
•••••
•••••
•••••
•••••
INTRODUCTION
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
OLAP – manipulation of information to support
•••••
•••••
•••••
•••••
•••••
•••••
decision making
•••••
•••••
•••
••••• Databases can help some
•••••
•••••
•••••
•••••
•••••
•••••
Data warehouses support only OLAP, not OLTP
•••••
•••••
•••••
•••••
•••••
Data warehouses – special forms of databases that
•••••
•••••
•••••
•••••
•••••
•••••
support decision making
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-11
•••••
•••••
•••••
•••••
•••••
INTRODUCTION
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-12
•••••
•••••
•••••
•••••
•••••
INTRODUCTION
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Thischapter – database and data warehouse
•••••
•••••
•••••
•••••
•••••
•••••
concepts
•••••
•••••
•••
•••••
•••••
Extended Learning Module C – how to design a
•••••
•••••
•••••
•••••
•••••
•••••
database
•••••
Extended Learning Module J – how to implement a
•••••
•••••
•••••
•••••
•••••
Databases Are…
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Collections of information
•••••
•••••
•••••
•••••
•••••
•••••
Created with logical structures
•••••
•••••
•••
•••••
•••••
•••••
With logical ties within the information
•••••
•••••
•••••
•••••
•••••
•••••
With built-in integrity constraints
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-15
•••••
•••••
•••••
•••••
•••••
•••••
Structures
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
In databases, row numbers are irrelevant
•••••
•••••
•••••
•••••
•••••
•••••
In databases, columns have logical names such as
•••••
•••••
•••
•••••
•••••
•••••
Order Date and Customer Name
•••••
•••••
•••••
•••••
•••••
Data dictionary – contains the logical structure of
•••••
•••••
•••••
•••••
•••••
•••••
the information in a database
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-18
•••••
•••••
Information
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Logical ties must exist between the tables
•••••
•••••
•••••
•••••
•••••
•••••
Logical ties are created with primary and foreign keys
•••••
•••••
•••
•••••
•••••
•••••
Primary key – field (or group of fields in some cases)
•••••
•••••
•••••
•••••
•••••
•••••
that uniquely describe each record
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-19
•••••
•••••
Information
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Foreign key – primary key of one file that appears in
•••••
•••••
•••••
•••••
•••••
•••••
another file
•••••
•••••
•••
•••••
•••••
Foreign keys help create relationships among tables
•••••
•••••
•••••
•••••
•••••
•••••
Table = file = relation (don’t confuse yourself)
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-20
•••••
•••••
Information
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-21
•••••
•••••
Constraints
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Integrity constraint – rule that helps ensure the
•••••
•••••
•••••
•••••
•••••
•••••
quality of information
•••••
•••••
•••
•••••
•••••
Examples
•••••
•••••
•••••
•••••
••••• Primary keys must be unique
•••••
•••••
•••••
•••••
•••••
•••••
Foreign keys cannot be blank
•••••
•••••
•••••
•••••
•••••
Sales price cannot be negative
•••••
•••••
•••••
•••••
••••• Phone numbers must have an area code
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-22
•••••
•••••
•••••
•••••
•••••
DBMS TOOLS
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Database management system (DBMS) – helps
•••••
•••••
•••••
•••••
•••••
•••••
you specify the logical organization for a database
•••••
•••••
•••
•••••
•••••
and access and use the information within a
•••••
•••••
•••••
•••••
•••••
database
•••••
•••••
•••••
•••••
Word processing software = document
•••••
•••••
•••••
•••••
••••• Spreadsheet software = workbook
•••••
•••••
•••••
•••••
•••••
•••••
DBMS software = database
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-23
•••••
•••••
•••••
•••••
•••••
DBMS TOOLS
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
5 software components
•••••
•••••
•••••
•••••
•••••
•••••
•••••
1. DBMS engine
•••••
•••
•••••
•••••
•••••
2. Data definition subsystem
•••••
•••••
•••••
•••••
•••••
•••••
3. Data manipulation subsystem
•••••
•••••
•••••
•••••
•••••
4. Application generation subsystem
•••••
DBMS TOOLS
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-25
•••••
•••••
•••••
•••••
•••••
DBMS Engine
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
DBMS engine – accepts logical requests, converts
•••••
•••••
•••••
•••••
•••••
•••••
them into their physical equivalent, and accesses the
•••••
•••••
•••
•••••
•••••
database and data dictionary
•••••
•••••
•••••
•••••
•••••
DBMS engine separates the logical from the physical
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-26
•••••
•••••
•••••
•••••
•••••
DBMS Engine
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Physical view – how information is arranged, stored,
•••••
•••••
•••••
•••••
•••••
•••••
and accessed on a storage device
•••••
•••••
•••
•••••
•••••
Logical view – how you (knowledge worker) need to
•••••
•••••
•••••
•••••
•••••
•••••
arrange and access information
•••••
Databases – you work only with logical views
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-27
•••••
•••••
•••••
•••••
•••••
Views
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
View – allows you to see the contents of a database
•••••
•••••
•••••
•••••
•••••
•••••
file
•••••
•••••
•••
•••••
•••••
Similar to a spreadsheet view
•••••
•••••
•••••
•••••
••••• Make changes
•••••
•••••
•••••
•••••
•••••
•••••
Sort
•••••
•••••
•••••
•••••
•••••
Query
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-30
•••••
•••••
•••••
•••••
•••••
Views
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
•• Sort Find
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
Add a new record
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-31
•••••
•••••
•••••
•••••
•••••
Report Generators
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Report generator – helps you quickly define formats
•••••
•••••
•••••
•••••
•••••
•••••
of reports and what information you want to see in a
•••••
•••••
•••
•••••
•••••
report
•••••
•••••
•••••
•••••
•••••
Save report formats to use later
•••••
•••••
Uses a wizard interface
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-32
•••••
•••••
•••••
•••••
•••••
Report Generators
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
Specify the fields you want Specify the layout of
•••••
•••••
•••••
in a report the report
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-33
•••••
•••••
•••••
•••••
•••••
Report Generators
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-34
•••••
•••••
•••••
•••••
•••••
QBE Tools
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Query-by-example (QBE) tool – helps you
•••••
•••••
•••••
•••••
•••••
•••••
graphically design the answer to a question
•••••
•••••
•••
•••••
•••••
“What driver most often delivers concrete to Triple A
•••••
•••••
•••••
•••••
•••••
•••••
Homes?”
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-35
•••••
•••••
•••••
•••••
•••••
QBE Tools
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-36
•••••
•••••
•••••
•••••
•••••
SQL
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Structured query language (SQL) – standardized
•••••
•••••
•••••
•••••
•••••
•••••
fourth-generation language found in most DBMSs
•••••
•••••
•••
•••••
•••••
Performs same task as QBE
•••••
•••••
•••••
•••••
•••••
•••••
Uses sentence structure instead
•••••
•••••
•••••
•••••
•••••
•••••
Mostly used by IT people
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-37
•••••
•••••
•••••
•••••
•••••
queries
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
Concurrency control
•••••
•••••
•••••
•••••
••••• What happens if two people simultaneously try to
•••••
•••••
•••••
•••••
•••••
•••••
change the same information?
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-41
•••••
•••••
•••••
•••••
•••••
MINING
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Data warehouses support OLAP and decision making
•••••
•••••
•••••
•••••
•••••
•••••
Data warehouses do not support OLTP
•••••
•••••
•••
•••••
•••••
•••••
Data-mining tools are tools for working with data
•••••
•••••
•••••
•••••
•••••
•••••
warehouse information
•••••
•••••
•••••
•••••
DBMS software = database
•••••
•••••
•••••
•••••
•••••
•••••
Data-mining tools = data warehouse
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-43
•••••
•••••
•••••
•••••
•••••
Query-and-Reporting Tools
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Query-and-reporting tools – similar to QBE tools,
•••••
•••••
•••••
•••••
•••••
•••••
SQL, and report generators in the typical database
•••••
•••••
•••
•••••
•••••
environment
•••••
•••••
•••••
••••• Also similar to pivot tables in Excel
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-49
•••••
•••••
•••••
•••••
•••••
Intelligent Agents
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Use various AI tools such as neural networks and
•••••
•••••
•••••
•••••
•••••
•••••
fuzzy logic to form the basis for “information
•••••
•••••
•••
•••••
•••••
discovery” and building BI
•••••
•••••
•••••
•••••
•••••
Help you find hidden patterns in information
•••••
•••••
Chapter 4 focuses on these
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-50
•••••
•••••
•••••
•••••
•••••
Statistical Tools
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Help you apply various mathematical models to the
•••••
•••••
•••••
•••••
•••••
•••••
information stored in a data warehouse to discover
•••••
•••••
•••
•••••
•••••
new information
•••••
•••••
•••••
••••• Regression
•••••
•••••
•••••
•••••
•••••
•••••
Analysisof variance
•••••
•••••
•••••
•••••
•••••
And so on
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-52
•••••
•••••
•••••
•••••
•••••
Data Marts
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Data warehouses are organizationwide
•••••
•••••
•••••
•••••
•••••
•••••
Data marts have subsets of an organizationwide data
•••••
•••••
•••
•••••
•••••
•••••
warehouse
•••••
•••••
•••••
•••••
•••••
Data mart – subset of a data warehouse in which
•••••
•••••
•••••
•••••
•••••
•••••
only a focused portion of the data warehouse
information is kept
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-53
•••••
•••••
•••••
•••••
•••••
Data Marts
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-54
•••••
•••••
•••••
•••••
•••••
•••••
Warehouse
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Do you need a data warehouse?
•••••
•••••
•••••
•••••
•••••
•••••
DBMS may offer all you need
•••••
•••••
•••
•••••
••••• Do all employees need the entire data warehouse?
•••••
•••••
•••••
•••••
•••••
•••••
Consider a data mart
•••••
•••••
•••••
•••••
•••••
•••••
How up-to-date must information be?
•••••
•••••
•••••
•••••
•••••
“Snapshot” concept
•••••
•••••
•••••
•••••
•••••
•••••
What data-mining tools do you need?
•••••
•••••
•••••
•••••
••••• Training can be expensive
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-56
•••••
•••••
•••••
•••••
•••••
INFORMATION OWNERSHIP
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Strategic management support
•••••
•••••
•••••
•••••
•••••
•••••
The sharing of information with responsibility
•••••
•••••
•••
•••••
•••••
•••••
Information cleanliness
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-57
•••••
•••••
•••••
•••••
•••••
Responsibility
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Ifyou create it, you “own” it
•••••
•••••
•••••
•••••
•••••
•••••
You will also share it with others
•••••
•••••
•••
•••••
•••••
•••••
Because you “own” it, you are responsible for its
•••••
•••••
•••••
•••••
•••••
•••••
quality
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-60
•••••
•••••
•••••
•••••
•••••
Information Cleanliness
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Database and data warehouse information must be
•••••
•••••
•••••
•••••
•••••
•••••
“clean”
•••••
•••••
•••
••••• No errors
•••••
•••••
•••••
•••••
•••••
•••••
No duplicates
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-61
•••••
•••••
•••••
•••••
•••••
Information Cleanliness
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
Extraction, transformation, and loading (ETL) –
•••••
•••••
•••••
•••••
•••••
•••••
what information you want from each database, how
•••••
•••••
•••
•••••
•••••
the information is associated, and what rules to follow
•••••
•••••
•••••
•••••
•••••
in consolidating the information to ensure its
•••••
•••••
•••••
•••••
•••••
cleanliness in a data warehouse
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-62
•••••
•••••
•••••
•••••
•••••
CAN YOU…
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
1. Describe business intelligence and its role in an
•••••
•••••
•••••
•••••
organization.
•••••
•••••
•••
•••••
•••••
•••••
2. Differentiate between databases and data
•••••
•••••
•••••
•••••
•••••
warehouses with respect to their focus on OLTP
•••••
•••••
•••••
•••••
•••••
and OLAP.
•••••
relational database.
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-63
•••••
•••••
•••••
•••••
•••••
CAN YOU…
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
••••••
•••••
•••••
•••••
••
•••••
•••••
•••••
•••••
••••
•••••
•••••
•••••
4. Define the five software components of a database
•••••
•••••
•••••
•••••
management system.
•••••
•••••
•••
•••••
•••••
•••••
5. List and describe the key characteristics of a data
•••••
•••••
•••••
•••••
•••••
warehouse.
•••••
•••••
•••••
•••••
•••••
•••••
6. Define the four major types of data-mining tools in a
data warehouse environment.
•••••
•••••
•••••
•••••
•••••
•••••
an organization.
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
•••••
• • • • • McGraw-Hill © 2007 The McGraw-Hill Companies, Inc. All rights reser
••••• 3-64