1장 오라클이란
1. 오라클이란 ?
그리스/로마 신화에 나오는 신탁을 의미. 즉 인간의 물음에 대해 신이 해주는 답변처럼 정확한 결과를 얻을 수 있다는 뜻을 가지고 있다. 데이터베이스 관리 프로그램의 하나
2. 데이터베이스 시스템이란?
데이터베이스 시스템은 데이터를 효과적으로 관리하기위해 사용하는 프로그램이다.
※데이터베이스 시스템의 구성
①데이터 정의 : 데이터를 저장하는 객체를 정의하는 기능
②데이터 조작 : 저장된 데이터를 사용자의 요구에 따라 조작하는 기능
③데이터 제어 : 저장된 데이터를 누구나 일괄적으로 사용할 수 있도록 하는 기능. 보안과 권한 검사 기능도 요구
3. 질의처리
질의 처리란 데이터베이스 내의 데이터를 검색, 삽입, 갱신, 삭제하는 조작과 데이터 관리를 위해 테이블이나 인덱스 등을 생성하는 것을 말함.
1999년 표준 질의 언어로 SQL문이 제정되었다.
4. 트랜잭션
논리적인 일의 단위. 물리적으로 보이는 처리단위가 아니라 시스템상의 처리단위를 말한다.
5. 데이터 모델
데이터 모델이란 데이터베이스 관리 시스템을 지원하는 형태를 의미. 시대에따라 변화
※DBMS의 종류
①계층형 DBMS : 말 그대로 데이터를 층층이 쌓은 데이터베이스 형으로 단순작업에서는 효율적이나 시대가지나면서 복잡해지는 데이터조작에 따라가지 못함.
②관계형 DBMS : 관계형 DBMS는 2차원적 테이블에 데이터를 저장하는 형태를 말함. 응용프로그램 개발의 생산성에 획기적인 개선을 가져왔음. ( 엑셀과 비슷한 형태임 )
③객체형 DBMS : 객체형이란 말 그대로 2차원적인 테이블이 아닌 그림이나 아이콘의 형태로 생성되는 형태를 가졌다. 그러나 아이콘 등의 형태 이다보니 다른 사람이 쓰는 데이터베이스의 형태와 다르면 호환성에 문제가 생기기는 단점이 있다.
④객체관계형 DBMS : 이것은 객체형과 관계형의 장점을 뽑아서 만든 것으로 화면에 보기에는 객체형으로 만들어 구분하기 쉽게 해놓고 데이터의 저장형태는 관계형처럼 2차원 테이블에 저장하는 형태의 데이터베이스 관리 시스템을 말한다. 현재 가장 많이 쓰이는 형태이다.
6. 클러스터
클러스터란 회사에서 웹 사이트 등을 돌릴 때 대용량의 서버급 컴퓨터를 사용하는 것이 아니라 저용량의 컴퓨터를 여려대 연결시켜 하나의 프로그램을 수행하도록 하여 대용량의 서버급 컴퓨터의 처리속도와 비슷하게 행하는 것을 말함.
클러스터의 장점은 처리를 담당하는 컴퓨터가 여러 대이기 때문에 컴퓨터 중 한두대가 문제를 일으킨다 해도 서비스에는 지장을 주지 않는다는 점과 서비스가 증가하면 컴퓨터와 병렬서버를 증가시키면 되므로 확장성에 큰 이점을 가지고 있다.
7. 데이터 가드시스템
장애발생시 원거리에서 데이터베이스를 별도로 관리할 수 있는 시스템을 말한다. 이 경우 서비스중인 데이터베이스를 주 데이터베이스라 하고 원격지에서 사용하는 데이터베이스를 대기, 즉 예비 데이터베이스라 한다. 이 경우 원격지의 데이터베이스는 주 데이터베이스의 로그파일을 이용하여 최대한 장애발생전의 상태로 복구한다.
8. 데이터가드 브로커
데이터가드 브로커란 데이터가드에서 말한 주 데이터베이스의 로그파일을 예비 데이터베이스에 전송하는 시간을 설정하여 사람이 직접 하지 않아도 로그파일을 전송하여 장애발생시 최대한 장애발생전의 상태로 돌릴 때 유용하게 쓰인다.
※오라클 9i 데이터베이스의 특징
클러스터구조의 데이터베이스를 가지기 때문에 네트워크나 하드웨어 또는 디스크의 장애에 대비하여 지속적인 서비스를 가능한 클러스터를 제공하며 데이터가드와 데이터가드 브로커를 사용하여 예비 데이터베이스와 로그파일 전송을 자동화하여 장애발생시 빠른 복구를 가능하게 하였다. 이것은 인터넷 비즈니스가 활성화되는 요즘시기에 인터넷 비즈니스의 중단 없이 서비스가 지속되어야하는 요구사항을 충분히 반영한 시스템이다.
2장 오라클9i 서버구조
9. SGA
시스템 글로벌 영역, 즉 시스템을 구성하는 전반적인 영역을 이야기한다.
이곳에는 공유풀, 자바풀, 대용량풀, 인스턴스, 리두로그버퍼, 데이터버퍼캐시 등이 포함되어있다.
10. PGA
프로그램 글로벌 영역으로 SGA가 공통적으로 사용된다면 PGA는 독립적으로 사용되는 비 공유영역이다.
이곳에는 스텍과 세션정보를 저장하게된다.
11. Sort Area
사용자가 요구하는 데이터를 정렬할 때 필요한 메모리영역. 이 영역의 메모리 크기를 벗어나는 작업이 있을 때에는 오라클은 임시테이블 스페이스를 사용하기 때문에 I/O를 일으키며 디스크의 사용양이 증가하여 시스템의 전반적인 성능이 저하되는 결과를 가져온다. 이 영역의 메모리는 Sort_Area_Size 파라미터의 크기로 결정.
12. 인스턴스
SGA와 오라클 프로세서를 조합시키는 것을 의미함. 사용자가 SGA에 접속하여 프로그램들을 처리할 때 인스턴스가 오라클 내의 프로그램들을 알맞게 연결해주는 것을 뜻함.
13. 공유풀
SGA구성 요소중에 데이터베이스 버퍼캐시와 함께 데이터베이스의 성능을 결정하는 중요한 메모리 영역. 크게 라이브러리 캐시, 딕셔너리 캐시, 컨트롤 구조로 구성.
※공유풀의 역할
①라이브러리 캐시 내에 동일한 SQL이 존재하는지 검색 후 존재한다면 분석없이 실행계획에 따라 데이터를 검출하나 존재하지 않을 경우 새로운 SQL문으로 인식하여 구문분석을 시작한다.
②새로운 SQL문이 표준SQL문에 합당한 문장인지 체크, 그 후 데이터 딕셔너리의 정보를 검색하여 지금의 사용자가 누구인지와 사용자가 접근하려는 데이터베이스의 객체가 무엇인지를 체크(데이터딕셔너리에서 테이블, 인덱스, 뷰, 사용자 권한, 롤, 관계등을 검색한다.) 후 사용자의 요구에 가장 빠른 검색 경로를 통해 추출하는 실행계획을 새움.
③컨트롤 구조
- 커서열기 : SQL문 하나마다 하나의 커서로 지정되며 SQL문의 실행이 끝나면 커서는 닫힌다. 즉 사용자가 SQL을 통해 데이터를 추출하고자 할 때 커서가 열린다.
- 구문분석 : 공유 풀 내의 동일한 SQL문장이 있는지 검색하여 존재하면 그대로 실행, 존재하지 않는다면 구문분석 후 데이터 딕셔너리에서 해당 객체와 권한등을 추출하여 가장 효율적인 검색 경로를 뽑아내어 실행하고 저장한다.
- 실행 : 패스트리(PASSTREE)를 데이터버퍼에 저장하여 동일SQL이 여러 사용자에게 사용되었다면 이를 공유.( 패스트리는 논리적 물리적 I/O를 실행 )
- 데이터 검출 : SQL문중 Select문에 한하는 것으로 Select문의 결과로 얻어진 데이터 집합을 검출.
- 커서닫기 : 공유 풀에 저장되어있는 커서는 재사용이 가능하며 사용하지 않는 커서는 알고리즘에 따라 제거된다.
14. 리두 로그 버퍼
리두로그 버퍼란 데이터베이스의 장애발생시 복구를 위해 모든 변경된 정보와 원래의 원본정보를 저장하는 버퍼이며 이를 저장하는 리두로그 엔트리를 지칭하는 말이기도 하다.
리두 로그 버퍼는 지정된 크기만큼 데이터를 메모리에 저장하고 있다가 온라인 리두로그파일에 저장한다.
리두로그 버퍼의 크기는 LOG_BUFFER이며 단위는 byte이다. 이 버퍼의 크기가 클수록 메모리에 데이터를 보유할 수 있는 가능성이 크므로 온라인 리두 로그파일의 I/O를 줄일수 있다.
15. 대용량 풀
오라클 8부터 추가된 개념으로 백업과 복구에 연속적으로 파일I/O의 버퍼링을 위해 사용.
16. 자바 풀
오라클의 자바코드가 사용하는 메모리 영역이다. 오라클 내의 자바 내장 프로시저를 컴파일하여 자바머신에만 로딩하는 작업을 할 경우 20MB정도의 메모리면 충분하나 오라클 공유서버와 함께 EBJ, CORBA를 함께 운용한다면 1G정도의 메모리가 할당되어야 원활한 기동이 가능.
17. 사용자 프로세스
애플리케이션 프로그램의 실행으로 발생하며 클라이언트 프로세스라고도 한다. 오라클은 클라이언트 프로세스가 발생 후 특정 요구를 하면 서버프로세스를 생성하게 되며 생성된 서버 프로세스는 클라이언트 프로세스와 통신하여 클라이언트의 요구사항에 부응함
18. 서버 프로세스
서버 프로세스는 SQL문을 구문분석 후 실행하고 데이터베이스의 버퍼캐시 내에 해당 데이터가 없음 데이터 파일을 읽어 데이터베이스 버퍼캐시에 로딩하여 작업 후 그 결과인 커서를 반환하여 클라이언트 프로세스에 제공.
※서버 프로세스의 종류
- 전용서버(Dedicated Server) : 클라이언트와 서버의 1:1 대칭 서버로 배치작업이나 백업/복구 등의 대용량 데이터를 처리할 때 주로 사용된다.
- 공유서버(Shared Server) : 클라이언트 프로세스가 서버프로세스가 아닌 디스패처 프로세스와 접속하여 작업하는 모드로 디스패처 프로세스는 동시에 여러개의 클라이언트 프로세스와 작업할수 있으며 클라이언트의 요구가 있을때 디스패처는 SGA내의 요청 대기열에 클라이언트의 요구를 저장하게 되고 서버프로세스는 요청 대기열의 내용들을 순차적으로 처리하여 응답 대기열에 담아두면 디스패처 프로세스가 응답 대기열에 담긴 내용들을 순차적으로 클라이언트 프로세스에게 돌려준다.
이 모드는 다수의 클라이언트 프로세스들이 서버프로세스를 공유하므로 시스템자원을 효율적으로 사용 가능하다.
19. 백그라운드 프로세스
백그라운드 프로세스는 실제로 작업을 주관하는 프로세스로 이것은 유닉스와 NT계열의 머신에서 활동하는 방법이 다르다.
20. DBWn( DataBase Writer )
디스크의 모든 데이터블록을 처리하는 DBWN프로세스는 사용자가 해당 트랜잭션을 완료하는 Commit명령어를 사용했을 때 바로 디스크에 저장하는 것이 아니라 오라클 데이터베이스 사용자들이 공유할 수 있도록 대기상태로 만들어 놓을 때 사용된다.
그 후 데이터베이스 내의 모든 변경 정보를 가지고 있는 Dirty Buffer List에 의해 해당 데이터 블록들을 일괄적으로 저장함.
※DBWN의 실행
- 서버프로세스가 알고리즘에 의해 Free Buffer를 찾지 못할 경우 Write List속의 버퍼들을 데이터파일에 저장.
- 체크 포인트 발생시 바로 전 체크 포인트가 적용된 후에 발생한 데이터베이스 버퍼 캐시 상의 모든 Dirty Buffer을 데이터 파일에 저장.
※체크 포인트란?
SGA의 변경된 내용과 데이터베이스 파일의 내용을 동기화하는 데이터베이스 이벤트이다.
21. LGWR( Log Writer )
LGWR은 리두 로그 엔트리의 버퍼들을 디스크에 있는 온라인 리두 로그 파일에 쓰는 일을 처리. 또한 온라인 리두 로그의 로그 시퀀스 번호를 데이터 파일 헤더와 컨트롤 파일에 쓰고 마지막으로 Dirty Buffer List를 지우는 작업을 실행함.
데이터베이스의 환경 설정에 따라 LGWR은 DBWN에게 변경 사항을 쓰도록 명령함.
22. SMON( System Monitor )
인스턴스가 실패할 경우 실패한 인스턴스를 복구할 때 사용된다.
SMON은 작은 공간 조각을 모아 합치거나 이음으로써 데이터베이스의 디스크공간 관리 문제를 처리하며 더 이상 쓰지 않는 임시 세그먼트들과 죽은 트랜잭션을 정리한다.
오라클9i의 Rear Application Cluster 환경에서의 SMON은 하나의 인스턴스에 한하여 그 기능을 다함.
23. PMON( Process Monitor )
데이터베이스에 대한 사용자들의 프로세스들이 올바르게 작동하는 지를 감시한다.
사용자가 서버에 접속 시 실패하면 사용자의 나머지 모든 작업을 삭제하며 시스템에 가한 모든 변경 작업을 롤백, 중단하여 원래 상태로 복구한 후 종료된 프로세스가 가지고 있는 잠금을 풀고 실패한 프로세스가 사용한 SGA영역의 리소스를 되돌려 준다. 그러나 MTS환경일 경우 실패한 서버프로세스와 디스패처 프로세서가 재가동된다.
24. ARCn( Archiver )
로그 스위치 발생 후 기설정 된 디렉토리로 온라인 리두로그 파일으 l사본을 이동시키는 작업을 처리하며 최대 10개까지 프로세스를 보유할 수 있다.
※로그 스위치란
오라클 이벤트의 하나로 하나의 리두로그 그룹이 다 채워지면 다른 그룹으로 리두로그 버퍼의 내용을 내려쓸 때 발생.
25. RECO( Recoverer )
분산 데이터베이스 환경에서 네트워크나 시스템의 오류로 인한 분산 트랜잭션의 문제를 해결.
26. Job Queue 프로세스
특정 시간에 특정 작업을 실행하는 배치 프로세스이며 오라클9i부터 사용자의 배치 작업의 양에 따라 자동으로 관리한다.
27. Dnnn( Dispatcher )
사용자의 SQL문 요청을 처리하게 될 공유 서버 프로세스 등을 사용자 프로세스들과 접속 시키는 오라클 MTS아키텍처의 부분으로서 작동.
프로세스를 디스패처와 접속 시키는 SQL*Net Listener를 통해 데이터베이스 안으로 들어오게 되며 이 때 디스패처는 사용자 프로세스를 찾게 된다.
단. 공유서버는 사용자 프로세스를 대신하여 데이터베이스와 상호작용하여 데이터를 얻음.
28. LMS( Lock Manager Server )
오라클의 리얼 애플리케이션 클러스터 환경에서 시스템의 내부적인 잠금을 관리하며 원격 인스턴스로부터 발생한 인터럽트를 획득하거나 막는 것을 관리하여 각 인스턴스의 메시지를 통제한다.
LMS는 RAC환경을 구성하는 여러 개의 인스턴스 내의 데이터 무결성을 보장하는 동기화 작업을 담당하는 중요한 요소이다.
29. QMNn( Queue Monitor )
큐 모니터 프로세스는 Oracle Advanced Queuing를 사용할 때 작동하는 프로세스로 10개까지 조정 가능함.
◎데이터베이스
○논리적 구조
30. 테이블스페이스
오라클 데이터베이스의 데이터를 저장하는 가장 큰 개념이며 반드시 하나의 객체는 하나의 테이블스페이스에 저장되는 것을 원칙으로 한다. 일반적으로 생성 초기에는 하나의 데이터파일을 가지고 소유하나 DBA가 데이터의 양이나 그 성격에 따라 데이터파일을 추가하는 것이 가능하다.
31. 세그먼트
테이블 스페이스를 구성하는 논리적인 저장단위로 오라클에서는 4가지 형태의 세그먼트를 지원한다.
- 데이터 세그먼트 : 테이블, 클러스터 테이블, 구체화 뮤와 구체화 뷰 로그의 데이터를 저장하는 세그먼트로 사용자가 테이블에 데이터를 입력하면 그 데이터는 오라클 데이터베이스에서 데이터 세그먼트로 인식/관리 된다.
세그먼트 중 가장 빈번한 I/O를 일으킨다.
- 인덱스 세그먼트 : 테이블 데이터의 인덱스를 저장하는 세그먼트로 사용자가 인덱스를 생성하면 오라클 데이터베이스는 해당 인덱스의 정보를 인덱스 세그먼트에 저장시킨다.
- 롤백 세그먼트 : 오라클 데이터베이스는 반드시 한 개 이상씩 가지고 있는 세그먼트로 롤백 세그먼트는 트랜젝션에 의해 변경된 데이터의 변경 이전 값을 저장하여 동일한 데이터에 접근하는 사용자들에게 데이터의 일치성을 제공하며 데이터베이스의 복구에 주로 사용된다.
이 작업은 기본적으로 설정해 놓은 시간이 되면 자동으로 수행되게 해놓으며 이것을 자동 언두 관리라 하며 사용자의 세션의 변경되기 이전 값의 이미지를 저장하는 언두 데이터를 오라클 데이터베이스 시스템이 자동으로 언두 테이블스페이스에서 관리하므로, 사용자가 커밋하여 이미 데이터베이스에 반영한 데이터도 원래의 값으로 되돌릴 수 있는 플래시 백 질의 기능을 제공가능하다.
- 임시 세그먼트 : 임시 세그먼트는 Sort_Area_Size에 할당된 메모리의 크기를 넘는 대용량의 데이터를 정렬할 때 사용하는 작업공간이다. 주로 데이터베이스에 접속하여 데이터를 추출하는 세션 중에 정렬을 필요로 하는 요청이 있을 때 서버의 메모리의 정렬 임계치를 넘는 용량의 데이터들은 임시 세그먼트에서 정렬을 마친 후 사용자 세션이 그 결과를 되돌려준다.
임시 세그먼트가 필요한 작업은 다음과 같다.
▷Create index...
▷Select.....oder by
▷Select distinct...
▷Select....group by
▷Select....union
▷Select.....intersect
▷Select....minus
▷인덱스 되지 않은 테이블 내 데이터를 조인할 때
▷분산환경에서 데이터 변경작업 시
※세그먼트의 유의점은 이와 같은 세그먼트 들은 한 개 이상의 테이블스페이스에 저장되어야 한다.
32. 익스텐트
데이터를 저장하기위한 연속적인 데이터블록의 집합이며 세그먼트를 구성하는 논리적인 저장 단위로 테이블 생성 시 설정된 크기만큼의 데이터블록 할당 시 최초의 할당 블록을 초기 익스텐트라고 하며 사용자의 Insert 작업으로 해당 블록의 저장 공간이 부족하게 되면 새로운 데이터 블록이 필요하게 되어 사용자가 설정한 크기 또는 최소한 기존의 익스텐트의 크기만큼의 연속적인 블록을 오라클에서는 할당하게 된다.
즉. 익스텐트란 오라클에서 최초의 영역이며 향후 데이터의 증가로 인한 데이터 영역의 증가단위를 나타내는 논리적인 저장단위이다.
33. 데이터블록
데이터를 저장하는 가장 작은 논리적인 단위며 데이터에 접근을 위한 I/O의 단위로 운영체제의 블록 크기의 배수로 오라클 데이터 블록의 크기를 결정 하는 것이 일반적이다.
데이터 블록의 크기는 운영체제마다 다르지만 2048~16384Byte로 지정하며 OLTP의 데이터 프로세싱 환경일수록 작게, 그리고 데이터웨어하우스 등의 DSS(Decision Support System)데이터 프로세싱 환경일수록 더 큰 크기의 데이터블록을 사용한다.
오라클에서의 데이터 블록은 사용자가 원하는 데이터를 읽고 쓰는 작업의 기본단위이며 블록의 크기는 데이터베이스를 생성할 때 그 크기를 설정한다. 즉 데이터블록의 크기는 데이터프로세싱의 기초를 다지는 작업이므로 가장 중요하다고 할 수 있다.
위의 표와 같은 사항을 고려하여 비즈니스 환경에 알맞은 데이터베이스를 생성해야한다.
※로우 체인이란
데이터 저장 시 충분히 큰 데이터 블록이 없는 경우 원래의 데이터블록의 내용을 나누어 다른 데이터블록에 분산하여 저장하는 것을 체이닝이라 한다.
이와 같은 경우 오라클의 성능저하에 영향을 끼치므로 방지하는 것이 좋다.
※다중 블록 사이즈
오라클 9i부터 사용된 개념으로 데이터블록의 설정은 데이터베이스의 생성 시에만 설정 가능하나 9i에서는 다중 블록 사이즈라는 시스템을 도입하여 데이터베이스에서 관리하던 데이터블록을 테이블스페이스에서 관리하게 되어 5개 이상의 비표준 데이터블록을 허용하게 된다. 즉. 데이터베이스를 생성하지 않고도 테이블스페이스에서 데이터블록의 크기를 변경할 수 있게 됐다는 말이다.
○물리적 구조
34. 데이터파일
데이터파일이란 논리적인 구조 데이터베이스 데이터들을 물리적으로 저장하는 파일을 말함.
오라클에서는 논리적으로는 테이블스페이스에 저장하나 물리적으로는 테이블 스페이스를 구성하는 데이터파일에 데이터를 저장한다.
'Database > Oracle' 카테고리의 다른 글
DBA_OBJECTS (0) | 2010.04.22 |
---|---|
Hash Partition (0) | 2010.04.12 |
오라클 옵션 (1) | 2010.04.02 |
Sort Merge Join (0) | 2010.04.01 |
Nested Loop Join - 중첩 루프 조인 (0) | 2010.04.01 |