상세 컨텐츠

본문 제목

1. 데이터베이스 개론

CS전공 지식/4. 데이터베이스 개론 & SQL

by 본투비곰손 2023. 8. 3. 22:19

본문

728x90

 

  • 데이터 베이스(DB DataBase)란?

전자적(electronically)으로 저장되고 사용 되는 관련있는(related) 데이터 들의 조직화된 집합(organized collection)

  • DBMS(DataBase Management Systems)

사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템

PostgreSQL, MySQL, ORACLE, SQL server 이 대표적이다.

DB를 정의하다 보면 부가적인 데이터가 발생하는데 이를 메타 데이터라고 한다.

  • 메타 데이터(metadata)

Database를 정의하거나 기술하는 Data

catalog라고도 부름

데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹등

메타 데이터 또한 DBMS를 통해 저장/관리 된다.

  • Database System

database + DBMS + 연관된 applications

줄여서 database 라고도 부른다.

data models

  • DB의 구조를 기술하는데 사용될 수 있는 개념들이 모인 집합
  • DB 구조를 추상화해서 표현할 수 있는 수단을 제공한다.
  • data model은 여러 종류가 있고 추상화 수준과 DB 구조화 장식이 조금씩 다르다.
  • DB에서 읽고 쓰기 위한 기본적인 동작들도 포함 한다.
  • DB구조란 데이터 유형, 데이터 관계, 제약 사항 등을 포함한다.

data models 분류

  • conceptual (or high-level) data models
    • 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이루어진 모델
    • 추상화 수준이 가장 높음
    • 비즈니스 요구 사항을 추상화 하여 기술할 때 사용
    • 대표적으로 entity-relationship model 이 있다.

logical (or representational) data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
  • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
  • 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화 할 수 있는 모델
  • relational data model, object data model, object-relational data model 이 있고 가장 많이 사용 하는 모델은 relational data model 이고 아래 와 같다.

  • physical (or low-level) data models
    • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지 기술할 수 있는 수단을 제공
    • Data format, Data orderings, Access path 등등
    • access path: 데이터 검색을 빠르게 하기 위한 구조체(index 같은 것이 있다.)

schema & state

database schema

  • data model을 바탕으로 database의 구조를 기술한 것
  • schema는 database를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않는다.

database state

  • database에 있는 실제 데이터는 자주 바뀔 수 있다.
  • 특정 시점에 database에 있는 데이터를 database state 또는 snapshot이라고 한다.
  • 혹은 database에 있는 현재 instances의 집합이라고도 한다.

three-schema architecture

  • database system을 구축하는 architecture중의 하나
  • user application으로 부터 물리적인 database를 분리시키는 목적
  • 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다.
  • external schemas(or user views) at external(or view) level
    • external views, user views 라고도 불림
    • 특정 유저들이 필요로 하는 데이터만 표현
    • 그 외 알려줄 필요가 없는 데이터는 숨김
    • logical data model을 통해 표현
    • 실제 사용자가 바라보는 스키마
  • conceptual schemas at conceptual level
    • 전체 database에 대한 구조를 기술
    • 물리적인 저장 구조에 관한 내용은 숨김
    • entities, data types, relationships, user operations, constraints에 집중
    • lodical data model을 통해 기술
    • 초장기에는 없었지만 사용자가 필요로 하는 데이터가 각각 달라지며 internal schema가 늘어나면서 중복이 발생되어 비효율성을 보완하기 위해 사용하게 되었다. (internal schema를 추상화 시킴)
  • internal schemas at internal level
    • 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
    • data storage, data structure, access path등 실체가 있는 내용 기술
    • 물리적 장치에 가장 가깝게 있
  • three-schema architecture 의 정리
    • 각 레벨을 독립 시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
    • 대부분의 DBMS가 three level을 완벽하게 또는 명시적으로 나누지는 않음
    • 데이터가 존재하는 곳은 internal level
    • 한 레벨에 변화가 있더라도 레벨 간의 맵핑만 변경

data definition language(DDL)

  • conceptual schema를 정의하기 위해 사용되는 언어
  • internal schema까지 정의할 수 있는 경우도 있음

storage definition language(SDL)

  • internal schema를 정의하는 용도로 사용되는 언어
  • 요즘 relational DBMS에서는 DSL이 거의 없고 파라미터 등의 설정으로 대체 된다.

view definition language(VDL)

  • external schemas를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행

data manipulation language(DML)

  • database에있는 data를 활용하기 위한 언어
  • data추가, 삭제, 수정, 검색 등의 기능을 제공하는 언어

통합된 언어로 존재

  • 오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기 보다는 통합된 언어로 존재한다.
  • 대표적인 예가 relational database language: SQL

 

728x90

관련글 더보기