* 본 내용은 Tmax AI & Big Data Academy 나연묵 교수님의 수업과, Kroenke and Auer - Database Processing (데이터베이스 처리론), 11th Edition 을 바탕으로 작성하였습니다.
Chapter 1. Introduction
주요 용어 정리
* Data, Database
Data : 현실세계의 정보, 그것들의 집합이 데이터베이스.
운영체제 : 쓰레드 < 프로세스
데이터베이스 : 가장 작은 단위는 트랜잭션
tps : transacton per second
DB 구조 명시화한것이 스키마
설계를 잘못했을떄뜯어고치는 것이 스키마 튜닝
인덱스는 검색을 빨리할 수 있게 도와주는것
그것을 설정하는 것은 인덱스 튜닝
SQL 질의 쿼리 랭귀지를 잘못 짜도 성능이 저하되는데, 이것을 바꾸는 것은 쿼리 튜닝
스키마 튜닝
인덱스 튜닝
쿼리 튜닝
* Data model, modelling
* DBMS : Database Management Systems
* 글로벌 벤더 : IBM DB2, Oracle, Microsoft SQL Server, MySQL (오라클에 팔렸다), MariaDB, PostgreSQL, SAP HANA
* 국내 벤더 : CUBRID, Goldilocks, Altibase, Tibero
* Data language : SQL
* Database Design
툴 : E-R Win, Visio, DA#
* DBA : Database Administrator
* Database Tuning & Monitoring
오렌지
DB 튜닝 XM?
* 데이터베이스의 특징
- 데이터는 테이블에 저장된다. 테이블은 행과 열로 구성되어있다.
- 각 row에는 occurence 혹은 instance에 대한 데이터를 저장한다.
- 하나의 데이터베이스는 데이터와 관계(relationshiips)를 저장한다.
대문자로만 이루어져있으면 테이블 이름, 대소문자가 섞여서 이름이 구성되어있으면 컬럼 이름
Data 데이터 : 기록된 fact 와 figure
Information 정보 : 데이터로부터 파생된 지식
* 데이터베이스 예시
- OLTP (OnLine Transaction Processing) - 항공사, 은행
최초로 사용한 것은 항공사에서 탑승객 표를 관리하기 위해서 만들어졌다.
- MES
- ERP
- CRM
- DW (Data Warehouse) : 현재 + 과거 데이터
OLAP (OnLine Analytical Processing)
Data Mining (연관 분석, 분류, 클러스터링...)
* 데이터베이스 시스템의 구성요소
Users ↔️ Database Applications ↔️ DBMS (create, process, administer) ↔️ Database
** 애플리케이션은 사실 데이터베이스 시스템의 구성요소는 아니다
- DB 데이터베이스 : 운영데이터의 집합
- DBMS : 데이터베이스를 관리하는 SW
High-end : IBM DB2(UDB) -> SQL, Oracle
Mid-range ; Sybase, SQL Server, Informix / INGRES (UC Berkley) : Stonebraker, QUEL - POSTGRES, PostgreSQL
Low-end : MySQL, Access
- Database System :
- 데이터 언어 : Query Language
SQL(SEQUEL), QUEL, QBE, XQuery, HiveQL
DB성능 단위 : transaction 트랜잭션
tps : transaction per second
TPC-C
TPC-E
TPCx-HS
* 데이터베이스 시스템의 구성요소 with SQL
Users ↔️ Database Applications ↔️ SQL ↔️ DBMS (create, process, administer) ↔️ Database
사용자가 직접 작성하는 SQL은 인터랙티브 SQL이라고 부른다.
* Database Applications
- Create and process forms
- Porcess user queries
- Ceate and Process reports
- Execute application logic
- Control application
폼 - 사용자로부터 성적과 같은 정보를 입력을 받는다
쿼리 (퀴어리?) - 입력한 정보 차트모양의 테이블에 정리한다
리포트 - 하드커피가 가능한 모양으로 표로 정리한다
DBMS
- Create database
- Create tables
- Create supporting structures (e.g.. indexes)
- Read database data
- Modify (insert, update, or delete) database data
Maintain database structures
- Enforce rules
- Control concurrency
Integrity Rule : 무결성, 얼마나 정확한지를 의미한다.
* 기능?
정의 : DB 구조 (스키마) 정의, 테이블 구조 정의
조작 : DB조작, 검색, 삽입, 삭제, 갱신. Retrieval, Insertion, Deletion, Update.
제어 : Recovery 회복, Concurrency control 무결성 제어, Security 보안, Integrity 무결성, Correctness 정확성.
** 무결성이 결여된 데이터는 Dirty Data 라고 부른다.
내일의 주제 : DB설계
1) From Existing Data (Chap.3, Chap 4)
2) New Systems Development (Chap.5 and Chap.6)
3) Database Redesign (Chap. 8)
데이터 Import, 테이블을 한개를 사용할 것인가 두개를 사용할 것인가
정규화를 하는 것에 따라서 다라질 수 있다.
짐 그레이, 데니스 샤샤 Dennis Shasha, 켄 톰슨
'TABA > Database' 카테고리의 다른 글
TABA Sep 8th (1) (1) | 2022.09.13 |
---|---|
TABA Sep 7th (2) (0) | 2022.09.07 |
TABA Sep 7th (1) (0) | 2022.09.07 |
TABA Sep 6th (0) | 2022.09.06 |
TABA Sep 5th (2) (0) | 2022.09.06 |