1장 오라클이란

1. 오라클이란 ?
그리스/로마 신화에 나오는 신탁을 의미. 즉 인간의 물음에 대해 신이 해주는 답변처럼 정확한 결과를 얻을 수 있다는 뜻을 가지고 있다. 데이터베이스 관리 프로그램의 하나
2. 데이터베이스 시스템이란?
데이터베이스 시스템은 데이터를 효과적으로 관리하기위해 사용하는 프로그램이다.
※데이터베이스 시스템의 구성
①데이터 정의 : 데이터를 저장하는 객체를 정의하는 기능
②데이터 조작 : 저장된 데이터를 사용자의 요구에 따라 조작하는 기능
③데이터 제어 : 저장된 데이터를 누구나 일괄적으로 사용할 수 있도록 하는 기능. 보안과 권한 검사 기능도 요구
3. 질의처리
질의 처리란 데이터베이스 내의 데이터를 검색, 삽입, 갱신, 삭제하는 조작과 데이터 관리를 위해 테이블이나 인덱스 등을 생성하는 것을 말함.
1999년 표준 질의 언어로 SQL문이 제정되었다.
4. 트랜잭션
논리적인 일의 단위. 물리적으로 보이는 처리단위가 아니라 시스템상의 처리단위를 말한다.
5. 데이터 모델
데이터 모델이란 데이터베이스 관리 시스템을 지원하는 형태를 의미. 시대에따라 변화
※DBMS의 종류
①계층형 DBMS : 말 그대로 데이터를 층층이 쌓은 데이터베이스 형으로 단순작업에서는 효율적이나 시대가지나면서 복잡해지는 데이터조작에 따라가지 못함.
②관계형 DBMS : 관계형 DBMS는 2차원적 테이블에 데이터를 저장하는 형태를 말함. 응용프로그램 개발의 생산성에 획기적인 개선을 가져왔음. ( 엑셀과 비슷한 형태임 )
③객체형 DBMS : 객체형이란 말 그대로 2차원적인 테이블이 아닌 그림이나 아이콘의 형태로 생성되는 형태를 가졌다. 그러나 아이콘 등의 형태 이다보니 다른 사람이 쓰는 데이터베이스의 형태와 다르면 호환성에 문제가 생기기는 단점이 있다.
④객체관계형 DBMS : 이것은 객체형과 관계형의 장점을 뽑아서 만든 것으로 화면에 보기에는 객체형으로 만들어 구분하기 쉽게 해놓고 데이터의 저장형태는 관계형처럼 2차원 테이블에 저장하는 형태의 데이터베이스 관리 시스템을 말한다. 현재 가장 많이 쓰이는 형태이다.
6. 클러스터
클러스터란 회사에서 웹 사이트 등을 돌릴 때  대용량의 서버급 컴퓨터를 사용하는 것이 아니라 저용량의 컴퓨터를 여려대 연결시켜 하나의 프로그램을 수행하도록 하여 대용량의 서버급 컴퓨터의 처리속도와 비슷하게 행하는 것을 말함.
클러스터의 장점은 처리를 담당하는 컴퓨터가 여러 대이기 때문에 컴퓨터 중 한두대가 문제를 일으킨다 해도 서비스에는 지장을 주지 않는다는 점과 서비스가 증가하면 컴퓨터와 병렬서버를 증가시키면 되므로 확장성에 큰 이점을 가지고 있다.
7. 데이터 가드시스템
장애발생시 원거리에서 데이터베이스를 별도로 관리할 수 있는 시스템을 말한다. 이 경우 서비스중인 데이터베이스를 주 데이터베이스라 하고  원격지에서 사용하는 데이터베이스를 대기, 즉 예비 데이터베이스라 한다. 이 경우 원격지의 데이터베이스는 주 데이터베이스의 로그파일을 이용하여 최대한 장애발생전의 상태로 복구한다.
8. 데이터가드 브로커
데이터가드 브로커란 데이터가드에서 말한 주 데이터베이스의 로그파일을 예비 데이터베이스에 전송하는 시간을 설정하여 사람이 직접 하지 않아도 로그파일을 전송하여 장애발생시 최대한 장애발생전의 상태로 돌릴 때 유용하게 쓰인다.
※오라클 9i 데이터베이스의 특징
클러스터구조의 데이터베이스를 가지기 때문에 네트워크나 하드웨어 또는 디스크의 장애에 대비하여 지속적인 서비스를 가능한 클러스터를 제공하며 데이터가드와 데이터가드 브로커를 사용하여 예비 데이터베이스와 로그파일 전송을 자동화하여 장애발생시 빠른 복구를 가능하게 하였다. 이것은 인터넷 비즈니스가 활성화되는 요즘시기에 인터넷 비즈니스의 중단 없이 서비스가 지속되어야하는 요구사항을 충분히 반영한 시스템이다.


2장 오라클9i 서버구조

9. SGA
시스템 글로벌 영역, 즉 시스템을 구성하는 전반적인 영역을 이야기한다.
이곳에는 공유풀, 자바풀, 대용량풀, 인스턴스, 리두로그버퍼, 데이터버퍼캐시 등이 포함되어있다.
10. PGA
프로그램 글로벌 영역으로 SGA가 공통적으로 사용된다면 PGA는 독립적으로 사용되는 비 공유영역이다.
이곳에는 스텍과 세션정보를 저장하게된다.
11. Sort Area
사용자가 요구하는 데이터를 정렬할 때 필요한 메모리영역. 이 영역의 메모리 크기를 벗어나는 작업이 있을 때에는 오라클은 임시테이블 스페이스를 사용하기 때문에 I/O를 일으키며 디스크의 사용양이 증가하여 시스템의 전반적인 성능이 저하되는 결과를 가져온다. 이 영역의 메모리는 Sort_Area_Size 파라미터의 크기로 결정.
12. 인스턴스
SGA와 오라클 프로세서를 조합시키는 것을 의미함. 사용자가 SGA에 접속하여 프로그램들을 처리할 때 인스턴스가 오라클 내의 프로그램들을 알맞게 연결해주는 것을 뜻함.
13. 공유풀
SGA구성 요소중에 데이터베이스 버퍼캐시와 함께 데이터베이스의 성능을 결정하는 중요한 메모리 영역. 크게 라이브러리 캐시, 딕셔너리 캐시, 컨트롤 구조로 구성.
※공유풀의 역할
①라이브러리 캐시 내에 동일한 SQL이 존재하는지 검색 후 존재한다면 분석없이 실행계획에 따라 데이터를 검출하나 존재하지 않을 경우 새로운 SQL문으로 인식하여 구문분석을 시작한다.
②새로운 SQL문이 표준SQL문에 합당한 문장인지 체크, 그 후 데이터 딕셔너리의 정보를 검색하여 지금의 사용자가 누구인지와 사용자가 접근하려는 데이터베이스의 객체가 무엇인지를 체크(데이터딕셔너리에서 테이블, 인덱스, 뷰, 사용자 권한, 롤, 관계등을 검색한다.) 후 사용자의 요구에 가장 빠른 검색 경로를 통해 추출하는 실행계획을 새움.
③컨트롤 구조
- 커서열기 : SQL문 하나마다 하나의 커서로 지정되며 SQL문의 실행이 끝나면 커서는 닫힌다. 즉 사용자가 SQL을 통해 데이터를 추출하고자 할 때 커서가 열린다.
- 구문분석 : 공유 풀 내의 동일한 SQL문장이 있는지 검색하여 존재하면 그대로 실행, 존재하지 않는다면 구문분석 후 데이터 딕셔너리에서 해당 객체와 권한등을 추출하여 가장 효율적인 검색 경로를 뽑아내어 실행하고 저장한다.
- 실행 : 패스트리(PASSTREE)를 데이터버퍼에 저장하여 동일SQL이 여러 사용자에게 사용되었다면 이를 공유.( 패스트리는 논리적 물리적 I/O를 실행 )
- 데이터 검출 : SQL문중 Select문에 한하는 것으로 Select문의 결과로 얻어진 데이터 집합을 검출.
- 커서닫기 : 공유 풀에 저장되어있는 커서는 재사용이 가능하며 사용하지 않는 커서는 알고리즘에 따라 제거된다.
14. 리두 로그 버퍼
리두로그 버퍼란 데이터베이스의 장애발생시 복구를 위해 모든 변경된 정보와 원래의 원본정보를 저장하는 버퍼이며 이를 저장하는 리두로그 엔트리를 지칭하는 말이기도 하다.
리두 로그 버퍼는 지정된 크기만큼 데이터를 메모리에 저장하고 있다가 온라인 리두로그파일에 저장한다.
리두로그 버퍼의 크기는 LOG_BUFFER이며 단위는 byte이다. 이 버퍼의 크기가 클수록 메모리에 데이터를 보유할 수 있는 가능성이 크므로 온라인 리두 로그파일의 I/O를 줄일수 있다.
15. 대용량 풀
오라클 8부터 추가된 개념으로 백업과 복구에 연속적으로 파일I/O의 버퍼링을 위해 사용.
16. 자바 풀
오라클의 자바코드가 사용하는 메모리 영역이다. 오라클 내의 자바 내장 프로시저를 컴파일하여 자바머신에만 로딩하는 작업을 할 경우 20MB정도의 메모리면 충분하나 오라클 공유서버와 함께 EBJ, CORBA를 함께 운용한다면 1G정도의 메모리가 할당되어야 원활한 기동이 가능.
17. 사용자 프로세스
애플리케이션 프로그램의 실행으로 발생하며 클라이언트 프로세스라고도 한다. 오라클은 클라이언트 프로세스가 발생 후 특정 요구를 하면 서버프로세스를 생성하게 되며 생성된 서버 프로세스는 클라이언트 프로세스와 통신하여 클라이언트의 요구사항에 부응함
18. 서버  프로세스
서버 프로세스는 SQL문을 구문분석 후 실행하고 데이터베이스의 버퍼캐시 내에 해당 데이터가 없음 데이터 파일을 읽어 데이터베이스 버퍼캐시에 로딩하여 작업 후 그 결과인 커서를 반환하여 클라이언트 프로세스에 제공.
※서버 프로세스의 종류
- 전용서버(Dedicated Server) : 클라이언트와 서버의 1:1 대칭 서버로 배치작업이나 백업/복구 등의 대용량 데이터를 처리할 때 주로 사용된다.
- 공유서버(Shared Server) : 클라이언트 프로세스가 서버프로세스가 아닌 디스패처 프로세스와 접속하여 작업하는 모드로 디스패처 프로세스는 동시에 여러개의 클라이언트 프로세스와 작업할수 있으며 클라이언트의 요구가 있을때 디스패처는 SGA내의 요청 대기열에 클라이언트의 요구를 저장하게 되고 서버프로세스는 요청 대기열의 내용들을 순차적으로 처리하여 응답 대기열에 담아두면 디스패처 프로세스가 응답 대기열에 담긴 내용들을 순차적으로 클라이언트 프로세스에게 돌려준다.
이 모드는 다수의 클라이언트 프로세스들이 서버프로세스를 공유하므로 시스템자원을 효율적으로 사용 가능하다.
19. 백그라운드 프로세스
백그라운드 프로세스는 실제로 작업을 주관하는 프로세스로 이것은 유닉스와 NT계열의 머신에서 활동하는 방법이 다르다.

20. DBWn( DataBase Writer )
디스크의 모든 데이터블록을 처리하는 DBWN프로세스는 사용자가 해당 트랜잭션을 완료하는 Commit명령어를 사용했을 때 바로 디스크에 저장하는 것이 아니라 오라클 데이터베이스 사용자들이 공유할 수 있도록 대기상태로 만들어 놓을 때 사용된다.
그 후 데이터베이스 내의 모든 변경 정보를 가지고 있는 Dirty Buffer List에 의해 해당 데이터 블록들을 일괄적으로 저장함.
※DBWN의 실행
- 서버프로세스가 알고리즘에 의해 Free Buffer를 찾지 못할 경우 Write List속의 버퍼들을 데이터파일에 저장.
- 체크 포인트 발생시 바로 전 체크 포인트가 적용된 후에 발생한 데이터베이스 버퍼 캐시 상의 모든 Dirty Buffer을 데이터 파일에 저장.
※체크 포인트란?
SGA의 변경된 내용과 데이터베이스 파일의 내용을 동기화하는 데이터베이스 이벤트이다.
21. LGWR( Log Writer )
LGWR은 리두 로그 엔트리의 버퍼들을 디스크에 있는 온라인 리두 로그 파일에 쓰는 일을 처리. 또한 온라인 리두 로그의 로그 시퀀스 번호를 데이터 파일 헤더와 컨트롤 파일에 쓰고 마지막으로 Dirty Buffer List를 지우는 작업을 실행함.
데이터베이스의 환경 설정에 따라 LGWR은 DBWN에게 변경 사항을 쓰도록 명령함.
22. SMON( System Monitor )
인스턴스가 실패할 경우 실패한 인스턴스를 복구할 때 사용된다.
SMON은 작은 공간 조각을 모아 합치거나 이음으로써 데이터베이스의 디스크공간 관리 문제를 처리하며 더 이상 쓰지 않는 임시 세그먼트들과 죽은 트랜잭션을 정리한다.
오라클9i의 Rear Application Cluster 환경에서의 SMON은 하나의 인스턴스에 한하여 그 기능을 다함.
23. PMON( Process Monitor )
데이터베이스에 대한 사용자들의 프로세스들이 올바르게 작동하는 지를 감시한다.
사용자가 서버에 접속 시 실패하면 사용자의 나머지 모든 작업을 삭제하며 시스템에 가한 모든 변경 작업을 롤백, 중단하여 원래 상태로 복구한 후 종료된 프로세스가 가지고 있는 잠금을 풀고 실패한 프로세스가 사용한 SGA영역의 리소스를 되돌려 준다. 그러나 MTS환경일 경우 실패한 서버프로세스와 디스패처 프로세서가 재가동된다.
24. ARCn( Archiver )
로그 스위치 발생 후 기설정 된 디렉토리로 온라인 리두로그 파일으 l사본을 이동시키는 작업을 처리하며 최대 10개까지 프로세스를 보유할 수 있다.
※로그 스위치란
오라클 이벤트의 하나로 하나의 리두로그 그룹이 다 채워지면 다른 그룹으로 리두로그 버퍼의 내용을 내려쓸 때 발생.
25. RECO( Recoverer )
분산 데이터베이스 환경에서 네트워크나 시스템의 오류로 인한 분산 트랜잭션의 문제를 해결.
26. Job Queue 프로세스
특정 시간에 특정 작업을 실행하는 배치 프로세스이며 오라클9i부터 사용자의 배치 작업의 양에 따라 자동으로 관리한다.
27. Dnnn( Dispatcher )
사용자의 SQL문 요청을 처리하게 될 공유 서버 프로세스 등을 사용자 프로세스들과 접속 시키는 오라클 MTS아키텍처의 부분으로서 작동.
프로세스를 디스패처와 접속 시키는 SQL*Net Listener를 통해 데이터베이스 안으로 들어오게 되며 이 때 디스패처는 사용자 프로세스를 찾게 된다.
단. 공유서버는 사용자 프로세스를 대신하여 데이터베이스와 상호작용하여 데이터를 얻음.
28. LMS( Lock Manager Server )
오라클의 리얼 애플리케이션 클러스터 환경에서 시스템의 내부적인 잠금을 관리하며 원격 인스턴스로부터 발생한 인터럽트를 획득하거나 막는 것을 관리하여 각 인스턴스의 메시지를 통제한다.
LMS는 RAC환경을 구성하는 여러 개의 인스턴스 내의 데이터 무결성을 보장하는 동기화 작업을 담당하는 중요한 요소이다.
29. QMNn( Queue Monitor )
큐 모니터 프로세스는 Oracle Advanced Queuing를 사용할 때 작동하는 프로세스로 10개까지 조정 가능함.
◎데이터베이스
○논리적 구조
30. 테이블스페이스
오라클 데이터베이스의 데이터를 저장하는 가장 큰 개념이며 반드시 하나의 객체는 하나의 테이블스페이스에 저장되는 것을 원칙으로 한다. 일반적으로 생성 초기에는 하나의 데이터파일을 가지고 소유하나 DBA가 데이터의 양이나 그 성격에 따라 데이터파일을 추가하는 것이 가능하다.
31. 세그먼트
테이블 스페이스를 구성하는 논리적인 저장단위로 오라클에서는 4가지 형태의 세그먼트를 지원한다.
- 데이터 세그먼트 : 테이블, 클러스터 테이블, 구체화 뮤와 구체화 뷰 로그의 데이터를 저장하는 세그먼트로 사용자가 테이블에 데이터를 입력하면 그 데이터는 오라클 데이터베이스에서 데이터 세그먼트로 인식/관리 된다.
세그먼트 중 가장 빈번한 I/O를 일으킨다.
- 인덱스 세그먼트 : 테이블 데이터의 인덱스를 저장하는 세그먼트로 사용자가 인덱스를 생성하면 오라클 데이터베이스는 해당 인덱스의 정보를 인덱스 세그먼트에 저장시킨다.
- 롤백 세그먼트 : 오라클 데이터베이스는 반드시 한 개 이상씩 가지고 있는 세그먼트로 롤백 세그먼트는 트랜젝션에 의해 변경된 데이터의 변경 이전 값을 저장하여 동일한 데이터에 접근하는 사용자들에게 데이터의 일치성을 제공하며 데이터베이스의 복구에 주로 사용된다.
이 작업은 기본적으로 설정해 놓은 시간이 되면 자동으로 수행되게 해놓으며 이것을 자동 언두 관리라 하며 사용자의 세션의 변경되기 이전 값의 이미지를 저장하는 언두 데이터를 오라클 데이터베이스 시스템이 자동으로 언두 테이블스페이스에서 관리하므로, 사용자가 커밋하여 이미 데이터베이스에 반영한 데이터도 원래의 값으로 되돌릴 수 있는 플래시 백 질의 기능을 제공가능하다.
- 임시 세그먼트 : 임시 세그먼트는 Sort_Area_Size에 할당된 메모리의 크기를 넘는 대용량의 데이터를 정렬할 때 사용하는 작업공간이다. 주로 데이터베이스에 접속하여 데이터를 추출하는 세션 중에 정렬을 필요로 하는 요청이 있을 때 서버의 메모리의 정렬 임계치를 넘는 용량의 데이터들은 임시 세그먼트에서 정렬을 마친 후 사용자 세션이 그 결과를 되돌려준다.
임시 세그먼트가 필요한 작업은 다음과 같다.
▷Create index...
▷Select.....oder by
▷Select distinct...
▷Select....group by
▷Select....union
▷Select.....intersect
▷Select....minus
▷인덱스 되지 않은 테이블 내 데이터를 조인할 때
▷분산환경에서 데이터 변경작업 시
※세그먼트의 유의점은 이와 같은 세그먼트 들은 한 개 이상의 테이블스페이스에 저장되어야 한다.
32. 익스텐트
데이터를 저장하기위한 연속적인 데이터블록의 집합이며 세그먼트를 구성하는 논리적인 저장 단위로 테이블 생성 시 설정된 크기만큼의 데이터블록 할당 시 최초의 할당 블록을 초기 익스텐트라고 하며 사용자의 Insert 작업으로 해당 블록의 저장 공간이 부족하게 되면 새로운 데이터 블록이 필요하게 되어 사용자가 설정한 크기 또는 최소한 기존의 익스텐트의 크기만큼의 연속적인 블록을 오라클에서는 할당하게 된다.
즉. 익스텐트란 오라클에서 최초의 영역이며 향후 데이터의 증가로 인한 데이터 영역의 증가단위를 나타내는 논리적인 저장단위이다.
33. 데이터블록
데이터를 저장하는 가장 작은 논리적인 단위며 데이터에 접근을 위한 I/O의 단위로 운영체제의 블록 크기의 배수로 오라클 데이터 블록의 크기를 결정 하는 것이 일반적이다.
데이터 블록의 크기는 운영체제마다 다르지만 2048~16384Byte로 지정하며 OLTP의 데이터 프로세싱 환경일수록 작게, 그리고 데이터웨어하우스 등의 DSS(Decision Support System)데이터 프로세싱 환경일수록 더 큰 크기의 데이터블록을 사용한다.
오라클에서의 데이터 블록은 사용자가 원하는 데이터를 읽고 쓰는 작업의 기본단위이며 블록의 크기는 데이터베이스를 생성할 때 그 크기를 설정한다. 즉 데이터블록의 크기는 데이터프로세싱의 기초를 다지는 작업이므로 가장 중요하다고 할 수 있다.

위의 표와 같은 사항을 고려하여 비즈니스 환경에 알맞은 데이터베이스를 생성해야한다.
※로우 체인이란
데이터 저장 시 충분히 큰 데이터 블록이 없는 경우 원래의 데이터블록의 내용을 나누어 다른 데이터블록에 분산하여 저장하는 것을 체이닝이라 한다.
이와 같은 경우 오라클의 성능저하에 영향을 끼치므로 방지하는 것이 좋다.
※다중 블록 사이즈
오라클 9i부터 사용된 개념으로 데이터블록의 설정은 데이터베이스의 생성 시에만 설정 가능하나 9i에서는 다중 블록 사이즈라는 시스템을 도입하여 데이터베이스에서 관리하던 데이터블록을 테이블스페이스에서 관리하게 되어 5개 이상의 비표준 데이터블록을 허용하게 된다. 즉. 데이터베이스를 생성하지 않고도 테이블스페이스에서 데이터블록의 크기를 변경할 수 있게 됐다는 말이다.
○물리적 구조
34. 데이터파일
데이터파일이란 논리적인 구조 데이터베이스 데이터들을 물리적으로 저장하는 파일을 말함.
오라클에서는 논리적으로는 테이블스페이스에 저장하나 물리적으로는 테이블 스페이스를 구성하는 데이터파일에 데이터를 저장한다.

'Database > Oracle' 카테고리의 다른 글

DBA_OBJECTS  (0) 2010.04.22
Hash Partition  (0) 2010.04.12
오라클 옵션  (1) 2010.04.02
Sort Merge Join  (0) 2010.04.01
Nested Loop Join - 중첩 루프 조인  (0) 2010.04.01

- PCTFREE
블록 내에 행을 수정하거나 업데이트 할 때 발생 할 수 있는 행의 크기 증가에 대비하여 예약된 공간. 초기 입력시에는 이 공간을 제외하고 입력된다. PCTFREE가 부족하면 데이터 수정이나 업데이트 시 행이전(ROW MIGRATION)이 발생하게 된다.

- PCTUSED
새로운 행이 블록에 추가되기 전에 행데이터와 오버헤드에 대해 사용될수 있는 블록의 최소 퍼센트이다. 즉, 기존의 데이터가 수정이나 삭제등으로 PCTUSED보다 값이 작아지면 이 블록에 한하여 입력이 가능하다.

- INITRANS
블록에 동시에 엑세스 가능한 트렉젝션의 초기수를 나타낸다. (기본값 : 1)
INITRANS를 낮게 설정하는 경우는 테이블이 크고 테이블에 엑세스하는 사용자의 수가 적을 경우이고, 높게 설정하는 경우는 엑세스하는 사용자가 많을 경우이다.

- MAXTRANS
동시에 엑세스 가능한 트렉젝션의 최대값으로 INITRANS의 상대적 개념이다. (기본값 : 255)
MAXTRNAS가 너무 낮은 경우 이 트렉젝션을 초과한 사용자가 엑세스한 경우 앞의 사용자가 커밋이나 롤백하기 까지 기다려야하는 경우가 발생한다.

- FREELIST
테이블로 데이터를 INSERT 하기 위하여 미리 할당하는 프리 블록의 리스트 수를 지정.

- NOCACHE
NOCACHE 옵션은 'DB의 캐시를 사용하지 않겠다'는 파라미터로서 이것을 CACHE로 지정하면 한번에 20개의 값을 캐시한다. 기본값은 NOCACHE이다.

ex)
USING INDEX
TABLESPACE TSI_BIO01 PCTFREE 20
STORAGE ( INITIAL 16384 NEXT 471556096 PCTINCREASE 80 ))
TABLESPACE TSD_BIO01
PCTFREE 20
PCTUSED 80
INITRANS 1
MAXTRANS 255
STORAGE (
INITIAL 1064960
NEXT 1048576
PCTINCREASE 0
MINEXTENTS 1
MAXEXTENTS 2147483645
FREELISTS 1 FREELIST GROUPS 1 )
NOCACHE;

왜 PCTFREE, PCTUSED 가 필요한가?
ROW CHANNING 현상과 ROW MIGRATION 현상에 대하여 알아야 한다.
ROW CHANNING은 DB_BLOCK_SIZE보다 너무 큰 데이터가 들어왔을 경우 인접한 다른 블록까지 데이터가 넘어가는 것을 말한다.
이런 경우, 만약에 큰 데이터의 특징을 가진다면 LOB TYPE으로 다른 TABLESPACE에 저장하는 것이 옳다.
하 지만 ROW CHANNING은 일반적인 현상이다. 물론 9I 일 경우엔 파라미터에 DB_?K_CACHE_SIZE 를 주고 ?K로 CREATE TABLESPACE ~~ BLOCKSIZE ?K; 로 정하면 더 DB_BLOCK_SIZE 보다 더 큰 BLOCK_SIZE를 가지는 TABLESPACE를 만들고 그 안에 데이터를 넣는다면 ROW CHANNING을 방지할 수 있다.
이 경우 ROW CHANNING은 어쩔 수 없는 현상이다.
하지만, ROW MIGRATION은 꼭 막아야 하는 사항이다.
이것을 예를 들어 보자.

a. A라는 테이블에 10번째 값을 INSERT
b. 이어서 11번째 값을 INSERT
c. 그런데 10번째 값을 유저가 UPDATE시켰는데, UPDATE한 데이터가 예전의 데이터보다 크기가 크다!
d. 이때 DB BLOCK의 11번째 값 때문에 여유공간이 없어서 다른 BLOCK으로 해당 데이터를 이동을 하게 된다.

이런 경우가 자주 일어나는 것은 좋지 않다. 그래서 PCTFREE, PCTUSED이라는 개념이 생긴 것이다.

PCTFREE 10, PCTUSED 40 이라고 한다면?
초기 빈 블록에 데이터가 들어가다가 PCTUSED 40%를 넘겼다. 그래도 계속해서 INSERT를 한다.
그러다가 PCTFREE 10% 즉 데이터가 90%넘게 채워질 경우에는 더 이상 데이터가 들어가지 않고 블록에 여유공간을 남겨둔다.
FILE HEADER에서 FREELIST라는 것을 관리하는데 이것은 이 SEGMENT가 들어갈 빈공간이 있는지를 확인하는 것이다.
이 상의 경우에서 데이터 기록량이 90%를 넘기면 (즉, PCTFREE공간이 10% 이하가 된다면) 그 블록을 FREELIST에서 제거를 하고 그 블록은 INSERT를 중단하고 다른 FREELIST에 등록된 빈 블록에 데이터를 넣을 것이다.
나중에 데이터가 UPDATE가 될 경우를 블록의 10%만큼 미리 준비하는 것이다.

만약, 그 블록의 데이터마저 줄어든다면?
90%보다 줄어들 경우 계속해서 0까지 줄어든다면, 그 블록을 FREELIST에서 삭제된 상황이니 더 이상 INSERT가 되지 않는다.
이 경우를 대비하여 어떤 기준을 마련해두어야 한다.
PCTUSED는 이렇게 BLOCK에 데이터가 없어질 경우의 최소값을 말한다.
즉, 최소한 PCTUSED 만큼은 데이터가 들어가서 DB BLOCK의 낭비를 최소화 하자는 것이다.
이것이 PCTUSED가 필요한 이유이다.

90%이상으로 데이터를 채운 블록에서 데이터가 삭제되어 90% 미만로 떨어지게 되었다.
즉 PCTFREE값이 10% 보다 여유공간이 더 생기는 것이다. 하지만 오라클은 PCTFREE 10%보다 더 큰 여유공간이 생겨도 FREELIST에 그 블록을 추가하지 않는다. 즉, 데이터가 점점 줄다가 60%정도의 데이터가 되더라도 FREELIST에 등록하지 않는다.

PCTUSED 보다 적어지는 상황이 생길 경우는?
PCTUSED 40% 보다 적어지는 상황이 생길 경우가 되어서야 비로소 데이터를 넣을 수 있도록 FREELIST에 등록한다.
하지만 9I에서는 PCTFREE, PCTUSED 방법은 권하지 않는다.
SEGMENT SPACE MANAGEMENT AUTO 절을 넣어서 AUTO로 관리하도록 한다.

※ AUTO방식
AUTO방식의 경우는 PCTFREE만 관리한다.
블록을 25%씩 4개로 나눠 관리하는 방식이다. AUTO를 쓰면 데이터 블록의 낭비를 막고 ROW MIGRATION도 해결해준다. 수동은 권하지 않음!!!

STORAGE ( INITIAL 16384 NEXT 471556096 PCTINCREASE 80 ))
이상에서 STORAGE 절은 EXTENT할당 방식을 말한다.
두가지 방식이 있는데, 8I에서는 DEFAULT가 EXTENT를 할당할 때에 DICTIONARY EXTENT MANAGED TABLESPACE를 사용했다.
물론 이때도 LOCALLY EXTENT MANAGED TABLESPACE를 만들 수는 있다.
9I에서는 LOCALLY EXTENT MANAGED TABLESPACE가 DEFAULT값이다.

이상의 차이는 EXTENT 할당하는 방식에 따른다.
DICTIONARY EXTENT TABLESPACE를 생성할 경우엔 이 테이블스페이스의 EXTENT 할당시에 그 정보를 SYSTEM TABLESPAE의 BASE TABLE에서 가져온다.
하 지만, EXTENT할당을 여기저기서 하다보니 SYSTEM TABLESPACE를 조회해서 EXTENT를 어디를 할당하면 될 것인지 확인하고 EXTENT를 할당 후 할당정보를 SYSTEM TABLESPACE에 저장한다. (병목현상 심함!)

그러나, LOCALLY EXTENT MANAGE TABLESPACE의 경우엔 그렇지 않다.
SYSTEM TABLESPACE의 BASE TABLE에서 EXTENT 여유공간 정보를 가져오는 것이 아니라 해당 데이터파일 헤더에 직접 BITMAP BLOCK으로 저장된다.
그래서 EXTENT할당시에 SYSTEM TABLESPACE에서 찾아서 할당하는 것이 아니라 자신이 속한 테이터파일의 헤더의 BITMAP BLOCK에서 찾겠죠. (경합현상이 거의 발생하지 않는다!)
오라클사에서는 DICTIONARY 방식을 사용하지 말고 LOCALLY TABLESPACE를 사용하도록 권한다.

9I에서 SYSTEM TABLESPACE가 LOCALLY TABLESPACE일 경우, 일반 TABLESPACE생성시 DEFAULT STORAGE절(DICTIONARY 방식)은 사용되지 않는다. (에러발생!)
하지만 SYSTEM TABLESPACE가 DICTIONARY TABLESPACE일 경우엔 DEFAULT STORAGE절(DICTIONARY 방식)을 통해서 CREATE TABLESPACE를 사용할 수 있다.

만약, CREATE TABLE 절에 STORAGE를 준다면 어떻게 될까?
이런 경우 EXTENET MANAGEMENT LOCAL 방식의 경우엔 질문사항인 STORAGE 절을 주게 되면 모두 무시된다. 즉, TABLESPACE에서 정한 UNIFORM SIZE대로(DEFAULT라면 1M 만큼)의 EXTENT를 할당한다.

SYSTEM TABLESPACE가 DICTIONARY TABLESAPCE라면?
이 경우에는 일반 TABLESPACE를 만들 경우에 DEFAULT STORAGE절을 지정할 수 있다. 하지만, CREATE TABLE 명령에서 질문과 같이 STORAGE절을 주게 되면 TABLESPACE의 설정은 모두 무시되고 CREATE TABLE 설정을 따른다.

STORAGE ( INITIAL 16384 NEXT 471556096 PCTINCREASE 80 ))는 무엇을 뜻하는가?
SYSTEM TABLESPACE가 LOCALLY EXTENT MANAGED TABLESPACE에서는 이상의 절을 이용하는 것이 불가능하므로, DICTIONARY EXTENT MANAGED TABLESAPCE라고 할 수 있다. 또한 TABLESPACE도 DICTIONARY EXTENT MANAGED TABLESAPCE이다.

CREATE TABLE TEST ( ID NUMBER ) STORAGE STORAGE ( INITIAL 16384 NEXT 471556096 PCTINCREASE 80 ));
초 기에 이 테이블에 EXTENT는 16384 바이트만큼을 미리 할당한다. 그 후 EXTENT안에 DB BLOCK들에 데이터가 들어갔는데 데이터가 많이 들어가서 모두 데이터가 찼을 경우 새로운 EXTENT를 할당 한다. 이때에 NEXT 만큼을 할당하는 것이다.
PCTINCREASE 80은 그 다음의 경우, 80% 만큼 더 크게 늘어난다는 것이다.

EXTENT1 에서는 16384
EXTENT2 에서는 16384 + 471556096
EXTENT3 에서는 (16384 + 471556096 + 471556096 ) * ( 1 + 0.8 )

이렇게 PCTINCREASE를 쓰게 되면 쓸데없이 한꺼번에 EXTENT를 할당받으므로 다른 TABLE에서 그 만큼 이 공간을 쓰지 못하게 된다. 따라서, PCTINCREASE는 쓰면 안된다!
그리고, DICTIONARY방식은 쓰지 말고 LOCALLY 방식으로 UNIFORM SIZE를 지정하라!
UNIFORM SIZE는 대부분의 경우 10M 정도로 UNIQUE하게 주면 적당하다. (너무 크면 안됨!)

여러 테이블의 데이터가 들어가는데 너무 많은 EXTENT가 생겨서 다른 테이블의 데이터와 섞이지 않나?
SMON이라는 오라클 프로세스가 알아서 하므로, 고려할 바 없다.


★최종 정리★

PCTFREE 20
: UPDATE를 위해서 DB BLOCK에 최소한 20% 정도의 공간을 남겨두겠다.

PCTUSED 80
: PCTFREE로 인한 공간낭비를 막기 위해서 최소한 80% 만큼의 데이터는 꼭 넣겠다.

INITRANS 1
: SEGMENT에 트랜젝션이 최소 한개 이상 걸릴 수 있도록 한다.

MAXTRANS 255
: SEGMENT에 트랜잭션이 최대 255개까지 걸릴 수 있도록 한다.

INITIAL 1064960
: 초기의 EXTENT 크기

NEXT 1048576
: 초기 EXTENT할당후 EXTENT가 부족할 경우 다음 EXTENT 할당 크기

PCTINCREASE 0
: 0%씩 늘이겠다. (무시됨!)

MINEXTENTS 1
: 최소한의 EXTENT를 할당하겠다.(INITIAL 10K 인데 MINEXTENTS가 2 라면? TABLE을 생성하면서 20K를 미리 할당. 20부터 시작.)

MAXEXTENTS 2147483645
: 최대한의 EXTENT. (현재값은 데이터가 커지면 문제있다)

FREELISTS 1 FREELIST GROUPS 1
: 데이터블록의 SEGMENT관리에서 한개 FREELIST에서 FREE BLOCK을 찾고 데이터를 넣는 것에 많은 트랜잭션이 처리를 할 경우 성능이 나빠지게 된다. 그래서 FREELIST의 경우에 여러개가 있으면 분산이 가능하다. FREELIST GROUP은 FREELIST를 몇개를 FREELIST GROUP으로 사용한다는 의미이다.

※EXTENT : 보조 기억 장치에서, 한 파일이 연속적으로 기록되어 있는 일련의 블록

'Database > Oracle' 카테고리의 다른 글

Hash Partition  (0) 2010.04.12
오라클 기본 용어들  (0) 2010.04.08
Sort Merge Join  (0) 2010.04.01
Nested Loop Join - 중첩 루프 조인  (0) 2010.04.01
드라이빙 테이블이란?  (0) 2010.03.30

Sort Merge Join이란 양쪽 테이블의 처리범위를 각자 액세스하여 정렬한 결과를 차례로 스캔하면서 연결고리의 조건으로 머지해 가는 방식을 말한다. 이 방식은 경우에 따라 Nested Loop Join보다 훨씬 빨라지는 경우도 많이 있으며 랜덤 액세스가 줄어들어 시스템의 부하를 감소시키지만 일반적으로 Nested Loop Join 보다는 사용되는 빈도가 적은 편이다.

이 방식의 가장 큰 특징은 상대방에게 아무런 값도 받지 않고 자신이 가지고 있는 조건만으로 처리범위가 정해지며, 랜덤 액세스를 줄일 수는 있으나 항상 전체범위처리를 한다는 것이다.

1. 특징
1) 동시적으로 처리된다. 테이블 각자가 자신의 처리범위를 액세스하여 정렬해 둔다.
2) 각 테이블은 다른 테이블에서 어떠한 상수값도 제공받지 않는다. 즉, 자신에게 주어진 상수값에 의해서만 범위를 줄인다.
3) 결코 부분범위처리를 할 수가 없으며, 항상 전체범위처리를 한다.
4) 주로 스캔방식으로 처리된다. 자신의 처리범위를 줄이기 위해 인덱스를 사용하는 경우만 랜덤 액세스이고 머지작업은 스캔방식이다.
5) 주어진 조건에 있는 모든 컬럼들이 인덱스를 가지고 있더라도 모두가 사용되는 것은 아니다. 연결고리가 되는 컬럼은 인덱스를 전혀 사용하지 않는다.
6) 조인의 방향과는 전혀 무관하다.
7) 스스로 자신의 처리범위를 줄이기 위해 사용되는 인덱스는 대개 가장 유리한 한가지만 사용되어진다. 그러나 그 외의 조건들은 비록 인덱스를 사용하지 못하더라도 작업대상을 줄여 주기 때문에 중요한 의미를 가진다.

2. 사용기준
1) 전체 범위처리를 하는 경우에 주로 유리해진다.
2) 상대방 테이블에서 어떤 상수값을 받지 않고도 처리범위를 줄일 수 있는 상태인 경우 주로 유리해 질 수 있다. 상수값을 받아 처리(Nested Loop Join)한 범위의 크기와 처리범위를 줄여 처리(Sort Merge Join)한 범위의 크기를 대비해보아 상수값을 받아 줄여진 범위가 약 30% 이상이라면 Sort Merge Join이 일반적으로 유리해진다. 그러나 부분범위처리가 되는 경우라면 전혀 달라질 수 있다. 이런 경우는 처리할 전체범위를 비교하지 말고 첫번째 운반단위에 도달하기 위해 액세스하는 범위애 대해서 판단해야 한다.
3) 주로 처리량이 많은 경우 (항상 전체 범위처리를 해야 하는 경우)에 유리해진다. 그것은 처리방식이 주로 스캔방식이므로 많은 양의 랜덤 액세스를 줄일 수가 있기 때문이다.
4) 연결고리 이상 상태에 영향을 받지 않으므로 연결고리를 위한 인덱스를 생성할 필요가 없을 때 유용하게 사용할 수 있다.
5) 스스로 자신의 처리범위를 어떻게 줄일 수 있느냐가 수행 속도에 많은 영향을 미치므로 보다 효율적으로 액세스할 수 있는 인덱스 구성이 중요한다.
6) 전체범위처리를 하므로 운반단위의 크기가 수행 속도에 영향을 미치지 않는다. 가능한 운반단위를 크게 하는 것이 페치(Fetch) 횟수를 줄여준다. 물론 지나치게 큰 운반단위는 시스템에 나쁜 영향을 미친다.
7) 처리할 데이터량이 적은 온라인 애플리케이션에서는 Nested Loop Join이 유리한 경우가 많으므로 함부로 Sort Merge Join을 사용하지 말아야 한다.
8) 옵티마이저 목표(Goal)가  "ALL_ROWS"인 경우는 자주 Sort Merge Join으로 실행계획이 수립되므로 부분범위처리를 하고자 한다면 이 옵티마이져 목표가 어떻게 지정되어 있는지에 주의하여야 한다.

'Database > Oracle' 카테고리의 다른 글

오라클 기본 용어들  (0) 2010.04.08
오라클 옵션  (1) 2010.04.02
Nested Loop Join - 중첩 루프 조인  (0) 2010.04.01
드라이빙 테이블이란?  (0) 2010.03.30
hint 종류  (0) 2010.03.30

Nested Loop Join이란 먼저 어떤 테이블의 처리범위를 하나씩 액세스하면서 그 추출된 값으로 연결할 테이블을 조인하는 방식이다.

1. 특징
1) 순차적으로 처리된다. 선행테이블(Driving table)의 처리범위에 있는 각각의 로우들이 순차적으로 수행될 뿐만 아니라 테이블간의 연결도 순차적이다.
2) 먼저 액세스되는 테이블(Driving Table)의 처리범위에 의해 처리량이 결정된다.
3) 나중에 처리되는 테이블은 앞서 처리된 값을 받아 액세스된다. 즉, 자신에게 주어진 상수값에 의해 스스로 범위를 줄이는 것이 아니라 값을 받아서 처리범위가 정해진다.
4) 주로 랜덤 액세스 방식으로 처리된다. 선행 테이블의 인덱스 액세스는 첫번째 로우만 랜덤 액세스이고 나머지는 스캔이며 연결작업은 모두 랜덤 액세스이다.
5) 주어진 조건에 있는 모든 컬럼들이 인덱스를 가지고 있더라도 모두가 사용되는 것은 아니다. 연결되는 방향에 따라 사용되는 인덱스들이 전혀 달라질 수 있다.
6) 연결고리가 되는 인덱스에 의해 연결작업이 수행되므로 연결고리 상태가 매우 중요하다. 연결고리의 인덱스 유무에 따라 액세스 방향 및 수행속도에 많은 차이가 발생된다.
7) 연결작업 수행 후 마지막으로 check되는 조건은 부분범위처리를 하는 경우에는 조건의 범위가 넓을수록, 아예 없다면 오히려 빨라진다.

2. 사용기준
1) 부분범위처리를 하는 경우에 주로 유리해진다.
2) 조인되는 어느 한쪽이 상대방 테이블에서 추출된 결과를 받아야 처리범위를 줄일 수 있는 상태라면 항상 유리해진다.
3) 주로 처리량이 적은 경우(많더라도 부분범위처리가 가능한 경우)에 유리해진다. 그것은 처리방식이 주로 랜덤 액세스방식이므로 많은 양의 랜덤 액세스가 발생한다면 수행속도가 당연히 나빠지기 때문이다.
4) 가능한 한 연결고리 이상 상태를 만들지 않도록 주의해야 한다.
5) 순차적으로 처리되기 때문에 어떤 테이블이 먼저 액세스되느냐에 따라 수행속도에 많은 영향을 미치므로 최적의 액세스 순서가 되도록 적절한 조치가 요구된다.
6) 부분범위처리를 하는 경우에는 운반단위 크기가 수행속도에 많은 영향을 미칠 수 있다. 운반단위가 적을 수록 빨리 운반단위를 채울 수 있으나, 폐치(Fetch) 횟수에서는 불리해지는 이중성을 가지고 있다.
7) 선행 테이블의 처리 범위가 많거나 연결 테이블의 랜덤 액세스의 양이 아주 많다면 Sort Merge 조인보다 불리해지는 경우가 많다.

'Database > Oracle' 카테고리의 다른 글

오라클 옵션  (1) 2010.04.02
Sort Merge Join  (0) 2010.04.01
드라이빙 테이블이란?  (0) 2010.03.30
hint 종류  (0) 2010.03.30
대량의 데이터 INSERT(HINT)  (0) 2010.02.01

+ Recent posts