전자적(electronically)으로 저장되고 사용 되는 관련있는(related) 데이터 들의 조직화된 집합(organized collection)
- DBMS(DataBase Management Systems)
사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템
PostgreSQL, MySQL, ORACLE, SQL server 이 대표적이다.
DB를 정의하다 보면 부가적인 데이터가 발생하는데 이를 메타 데이터라고 한다.
Database를 정의하거나 기술하는 Data
catalog라고도 부름
데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹등
메타 데이터 또한 DBMS를 통해 저장/관리 된다.
database + DBMS + 연관된 applications
줄여서 database 라고도 부른다.
data models
- DB의 구조를 기술하는데 사용될 수 있는 개념들이 모인 집합
- DB 구조를 추상화해서 표현할 수 있는 수단을 제공한다.
- data model은 여러 종류가 있고 추상화 수준과 DB 구조화 장식이 조금씩 다르다.
- DB에서 읽고 쓰기 위한 기본적인 동작들도 포함 한다.
- DB구조란 데이터 유형, 데이터 관계, 제약 사항 등을 포함한다.
data models 분류
- conceptual (or high-level) data models
- 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이루어진 모델
- 추상화 수준이 가장 높음
- 비즈니스 요구 사항을 추상화 하여 기술할 때 사용
- 대표적으로 entity-relationship model 이 있다.
logical (or representational) data models
- 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
- 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
- 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화 할 수 있는 모델
- relational data model, object data model, object-relational data model 이 있고 가장 많이 사용 하는 모델은 relational data model 이고 아래 와 같다.
- physical (or low-level) data models
- 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지 기술할 수 있는 수단을 제공
- Data format, Data orderings, Access path 등등
- access path: 데이터 검색을 빠르게 하기 위한 구조체(index 같은 것이 있다.)
schema & state
database schema
- data model을 바탕으로 database의 구조를 기술한 것
- schema는 database를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않는다.
database state
- database에 있는 실제 데이터는 자주 바뀔 수 있다.
- 특정 시점에 database에 있는 데이터를 database state 또는 snapshot이라고 한다.
- 혹은 database에 있는 현재 instances의 집합이라고도 한다.
three-schema architecture
- database system을 구축하는 architecture중의 하나
- user application으로 부터 물리적인 database를 분리시키는 목적
- 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다.
- external schemas(or user views) at external(or view) level
- external views, user views 라고도 불림
- 특정 유저들이 필요로 하는 데이터만 표현
- 그 외 알려줄 필요가 없는 데이터는 숨김
- logical data model을 통해 표현
- 실제 사용자가 바라보는 스키마
- conceptual schemas at conceptual level
- 전체 database에 대한 구조를 기술
- 물리적인 저장 구조에 관한 내용은 숨김
- entities, data types, relationships, user operations, constraints에 집중
- lodical data model을 통해 기술
- 초장기에는 없었지만 사용자가 필요로 하는 데이터가 각각 달라지며 internal schema가 늘어나면서 중복이 발생되어 비효율성을 보완하기 위해 사용하게 되었다. (internal schema를 추상화 시킴)
- internal schemas at internal level
- 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
- data storage, data structure, access path등 실체가 있는 내용 기술
- 물리적 장치에 가장 가깝게 있
- three-schema architecture 의 정리
- 각 레벨을 독립 시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
- 대부분의 DBMS가 three level을 완벽하게 또는 명시적으로 나누지는 않음
- 데이터가 존재하는 곳은 internal level
- 한 레벨에 변화가 있더라도 레벨 간의 맵핑만 변경
data definition language(DDL)
- conceptual schema를 정의하기 위해 사용되는 언어
- internal schema까지 정의할 수 있는 경우도 있음
storage definition language(SDL)
- internal schema를 정의하는 용도로 사용되는 언어
- 요즘 relational DBMS에서는 DSL이 거의 없고 파라미터 등의 설정으로 대체 된다.
view definition language(VDL)
- external schemas를 정의하기 위해 사용되는 언어
- 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행
data manipulation language(DML)
- database에있는 data를 활용하기 위한 언어
- data추가, 삭제, 수정, 검색 등의 기능을 제공하는 언어
통합된 언어로 존재
- 오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기 보다는 통합된 언어로 존재한다.
- 대표적인 예가 relational database language: SQL