데이터베이스

데이터베이스(회복과 병행 제어)

윤돌_99 2021. 5. 29. 17:34

트랜잭션

- 하나의 작업을 수행하는데 필요한 데이터베이스 연산들을 모아놓은 것

- 작업 수행에 필요한 SQL 문들의 모임

- 논리적인 작업의 단위

- 장애 발생 시 복구작업이나 병행 제어 작업을 위한 중요한 단위로 사용됨

 

트랜잭션의 특성

● 원자성

트랜잭션의 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 하는 all-or-nothing 방식을 의미

만약 트랜잭션 수행 중 장애가 발생한다면 지금까지 실행한 연산 처리를 모두 취소하고, 데이터베이스를 트랜잭셩 작업 전 상태로 되돌려야 한다.

 

● 일관성

트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함을 의미

 

● 격리성

수행 중인 트랜잭션이 완료될 때까지 다른 트랜잭션들이 중간 연산 결과에 접근할 수 없음을 의미

여러 트랜잭션이 동시에 수행되더라도 마치 순서대로 하나씩 수행되는 것처럼 정확하고 일관된 결과를 얻을 수 있도록 제어하는 기능이 필요하다.

 

● 지속성

트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영된 수행 결과는 영구적이어야함을 의미

지속성 보장을 위해서는 장애 발생 시 회복 기능이 필요하다

 

트랜잭션의 연산

● commit 연산

트랜잭션이 성공적으로 수행되었음을 선언(작업  완료)

트랜잭션의 수행 결과가 데이터베이스에  반영되고 일관된 상태를 지속적으로 유지하게 됨

 

● rollback 연산

트랜잭션을 수행하는데 실패했음을 선언(작업 취소)

트랜잭션이 지금가지 실행한 연산의 결과가 취소되고 데이터베이스가 트랜잭션 수행 전의 일관된 상태로 되돌아간다.

 

트랜잭션의 상태

● 활동(active) 상태

트랜잭션이 수행되기 시작하여 현재 수행 중인 상태

 

● 부분 완료(partically commited) 상태

트랜잭션의 마지막 연산 실행을 끝낸 직후의 상태

 

● 완료(commited) 상태

트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태

트랜잭션이 수행한 최종 결과를 데이터베이스에 반영하고, 데이터베이스가 새로운 일관된 상태가 되면서 트랜잭션이 종료됨

 

● 실패(failed) 상태

장애가 발생하여 트랜잭션의 수행이 중단된 상태

 

● 철회(aborted) 상태

트랜잭션의 수행 실패로 rollback 연산을 실행한 상태

지금까지 실행한 트랜잭션의 연산을 모두 취소하고 트랜잭션이 수행되지 전의 데이터베이스 상태로 되돌리면서 트랜잭션이 종료됨

 

 

MySQL 트랜잭션 제어 명령어(TCL)

표준 명령어 MySQL 데이터베이스 문법 설명
START 
TRANSACTION
SET TRANSACTION NAME<이름> 트랜잭션의 시작
COMMIT COMMIT 트랜잭션의 종료
ROLLBACK ROLLBACK {TO <savepoint>} 트랜잭션을 전체 혹은
<savepoint>까지 무효화시킴
SAVEPOINT SAVEPOINT <savepoint> <savepoint>를 만듬

 

장애(failure)

시스템이 제대로 동작하지 않은 상태

유형 설명
트랜잭션 장애 의미 트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태
원인 트랜잭션의 논리적 오류, 잘못된 데이터 입력, 시스템의 과다 사용 요구, 
처리 대상 데이터의 부재 등
시스템 장애 의미 하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태
원인 하드웨어 이상으로  메인 메모리에 저장된 정보가 손실되거나
교착상태가 발생한 경우
미디어 장애 의미 디스크 장치의 결함으로 디스크에 저장된 데이터베이스의 
일부 혹은 전체가 손상된 상태
원인 디스크 헤드의 손상이나 고장

 

데이터베이스를 저장하는 저장 장치의 종류

저장장치 설명
휘발성 저장장치(소멸성) 의미 장애가 발생하면 저장된 데이터가 손실됨
메인 메모리 등
비휘발성 저장장치
(비소멸성)
의미 장애가 발생해도 저장된 데이터가 손실되지 않음. 단, 디스크 헤더 손상같은
저장 장치 자체에 이상이 발생하면 데이터가 손실될 수 있음
디스크, 자기 테이프, CD/DVD 등
안정 저장장치 의미 비휘발성 저장 장치를 이용해 데이터 복사본을 여러 개를 만드는 방법으로,
어떤 장애가 발생해도 데이터가 손실되지 않고
데이터를 영구적으로 저장할 수 있음
 

 

트랜잭션의 수행을 위해 필요한 데이터 이동 연산

 

● 디스크와 메인 메모리 간의 데이터 이동 연산

트랜잭션이 데이터베이스의 데이터를 처리하기 위해서는 데이터를 디스크에서 메인 메모리로 가져와 처리한 다음 그 결과를 디스크로 보내는 작업이 필요하다.

 

- 블록 단위로 수행된다.

디스크 블록: 디스크에 있는 블록

버퍼 블록: 메인 메모리에 있는 블록

 

input(X):  디스크 블록에 저장되어 있는 데이터 X를 메인 메모리 버퍼 블록으로 이동시키는 연산

output(X): 메인 메모리 버퍼 블록에 있는 데이터 X를 디스크 블록으로 이동시키는 연산

 

● 메인 메모리와 변수 간의 데이터 이동 연산

응용 프로그램에서 트래잭션 수행을 지시하면 메인 메모리 버퍼 블록에 있는 데잍텉를 프로그램의 변수로 가져오고, 데이터 처리 결과를 저장한 변수 값을 메인 메모리 버퍼 블록으로 옮기는 작업이 필요

 

read(X): 메인 메모리 버퍼 블록에 저장되어 있는 데이터 X를 프로그램의 변수로 읽어오는 연산

write(X): 프로그램의 변수값을 메인 메모리 버퍼 블록에 있는 데이터 X에 기록하는 연산

 

회복(recovery)

장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구시키는 것

트랜잭션의 특성을 보장하고, 데이터베이스를 일관된 상태로 유지하기 위해 필수적인 기능

 

회복을 위해 데이터베이스 복사본을 만드는 방법

- 덤프(dump): 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법

- 로그(log): 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법

 

회복을 위한 기본 연산

- redo(재실행): 가장 최근에 저장된 데이터베이스 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 데이터베이스 상태로 복구

- undo(취소): 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데잍터베이스를 원래의 상태로 복구(변경 중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우에 주로 사용)

 

로그 파일

데이터를 변경하기 이전의 값과 변경한 이후의 값을 기록한 파일

레코드 단위로 트랜잭션 수행과 함께 기록됨

 

로그 레코드 설명
<T, start> 의미 트랜잭션 T가 수행을 시작했음을 기록
<t, start>
<T, X, old_value,
new_value>
의미 트랜잭션 T가 데이터 X를 이전값(old value)에서 새로운 값(new_value)으로 변경하는 연산을 실행했음을 기록
<T, X, 10000, 5000>
<T, commit> 의미 트랜잭션 T가 성공적으로  완료되었음을 기록
<T, commit>
<T, abort> 의미 트랜잭션 T가 철회되었음을 기록
<T, abort>

 

회복 기법

 

로그 회복 기법 - 즉시 갱신(immediate update) 회복 기법

트랜잭션 수행 중에 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영

장애 발생을 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에 기록: 로그 파일에 로그 레코드를 먼저 기록한 다음 데이터베이스에 변경 연산을 반영

장애 발생 시점에 따라 redo나 undo 연산을 실행해 데이터베이스를 복구

 

● undo 연산 -> 트랜잭션이 완료되기 전 장애가 발생한 경우

로그 파일에 <T, start> 로그 레코드는 존재하지만 <T, commit> 로그 레코드는 존재하지 않는 상태

 

● redo 연산 -> 트랜잭션이 완료된 후 장애가 발생한 경우

로그 파일에 <T, start> 로그 레코드와 <T, commit> 로그 레코드가 모두 존재하는 상태

 

로그 회복 기법 - 지연 갱신(deferred update) 회복 기법

트랜잭션 수행 중에 데이터 변경 연산의 결과를 로그에만 기록해두고, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터베이스에 한번에 반영

 

장애가 발생한 경우 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지하게 됨

- undo 연산은 필요없고 redo 연산만 사용

- 로그 레코드에는 변경 이후 값만 기록하면 됨: <T, X, new_value> 형식

 

● 트랜잭션이 완료되기 전에 장애가 발생한 경우 -> 로그 내용을 무시하고 버림

로그 파일에 <T, start> 로그 레코드만 존재하고, <T, commit> 로그 레코드는 존재하지 않는 상태

 

● 트랜잭션이 완료된 후에 장애가 발생한 경우 -> reso 연산 실행

로그 파일에 <t, start> 로그 레코드와 <t, commit> 로그 레코드가 모두 존재하는 상태

 

로그를 이용한 회복은 시스템에 장애가 일어났을 때 어느 시점까지 되돌아가야 하는지 알 수 없다.

트랜잭션이 많은 응용의 경우 하루 이상 되돌아가서 복구하는 것은 사실상 불가능하다. 

 

검사 시점 회복 기법

회복 시 많은 양의 로그를 검색하고 갱신하는 시간을 줄이기 위하여 몇 십 분 단위로

데이터베이스와 트랜잭션 로그 파일을 동기화한 후 동기화한 시점을 로그 파일에 기록해두는 방법 혹은 그 시점을 체크포인트(혹은 검사점)라고 한다.

 

만약 체크포인트가 있다면 로그를 이용한 회복기법은 좀 더 간단해진다.

● 체크포인트 이전에 [commit] 기록이 있는 경우

로그에 체크포인트가 나타나는 시점은 이미 변경 내용이 데이터베이스에 기록된 후이기 때문에 아무 작업이 필요없다. 

 

● 체크포인트 이후에 [commit] 기록이 있는 경우

redo(T)를 진행. 체크포인트 이후에 변경 내용이 데이터베이스에 반영되지 않았으므로 redo를 진행

 

● 체크포인트 이후에 [commit] 기록이 없는 경우

즉시 갱신 방법을 사용했다면 undo(T)를 진행. 버퍼의 내용이 반영됐을 수도 있기 때문에 원상복구 시켜야 함.

반면 지연 갱신 방법을 사용했다면 아무것도 할 필요 없다. 

 

미디어 회복 기법

디스크에 발생할 수 있는 장애에 대비한 회복 기법

● 덤프(복사본) 이용: 전체 데이터베이스의 내용을 일정 주기마다 다른 안전한 저장 장치에 복사

 

디스크 장애가 발생한다면,

가장 최근에 복사해둔 덤프를 이용해 장애 발생 이전의 데이터베이스 상태로 복구하고 필요에 따라 

redo 연산을 수행

'데이터베이스' 카테고리의 다른 글

데이터베이스(회복과 병행제어2)  (0) 2021.05.29
데이터베이스 정규화 총정리  (0) 2021.05.21
데이터베이스 언어 SQL-2  (0) 2021.04.19
데이터베이스 언어 SQL  (0) 2021.04.19
관계 데이터 연산  (0) 2021.04.19