1.개요
 
B*Tree 인덱스에 대한 연구가 발표되면서 대부분의 RDBMS에서는 B*Tree 인덱스를 주 인덱싱 기법으로 도입하기 시작하였다. B*Tree는 과거 어느 Tree 구조보다 대용량RDBMS에 적합한 구조를 가지고 있어 많은 사용자를 확보하게 된다. 이러한 B*Tree 인덱스는 많은 장점에도 불구하고 일부 단점으로 인하여 사용자들은 새로운 인덱스의 출현을 지속적으로 요구하게 되었다.
 
BITMAP index, Reverse Index 그리고 Function based Index는 B*Tree Index의 단점을 보완하기 위해 만들어진 Index들이다. 그러나 이러한 인덱스들은 특수한 목적을 가지고 만들어진 인덱스이므로 B*Tree 인덱스의 단점을 어느 정도 보완할 수 있을지 몰라도 사용자에 대한 새로운 인덱스의 요구를 종식시킬 수는 없었다.
 
가능한 모든 종류의 인덱스를 만들 수는 없지만 사용자가 원하는 형태의 인덱스를 스스로 만들 수 있다면 모든 종류의 인덱스를 만들지 않고도 우리가 원하는 목적을 달성할 수 있을 것이다. 이러한 목적을 가지고 탄생한 것이 DOMAIN index 다.
 
DOMAIN Index는 오라클8i에서부터 새롭게 도입된 개념으로 개발자가 자신이 원하는 인덱스 타입을 생성할 수 있게 함으로써 오라클의 인덱스 시스템에 많은 확장을 가져다 주었다.
 
즉, 데이터베이스에는 아직 존재하지도 않는 새로운 인덱스 타입을 자신이 스스로 정의하여 오라클에서 지원하는 인덱스 처럼 사용할 수가 있다는 것이다. 현재 오라클에서 사용하고 있는 Domain index의 좋은 사례로는 interMedia text index 나 오라클 9i부터 지원되는 Context 타입 인덱스와 Catalog 타입 인덱스등으로 모두 비정형 Text를 빠르게 검색하게 위해 도입되었다.
 
2. Extensible indexing framework
 
Domain index는 다음과 같은 네가지 구성요소로 이루어져 있다.
 
1) Indextype
 
Schema object indextype는 인덱스의 정의, 관리, 스캔등 새로운 인덱스 타입이 가질수 있는 모든 경향을 관리할 수 있는 루틴을 캡술화 하여 사용자가 보다 쉽게 사용자 정의 인덱스를 생성할 수 있게 한다.
 
2) Domain index
 
도메인 인덱스는 인덱스 타입에서 제공되는 루틴에 의하여 생성, 관리, 액세스 되는 인덱스의 한 종류로 application-specific domains에 대한 데이터를 indexing하는데 사용하기 때문에 domain index라고 한다.
 
3) Operators
 
이전의 관계형 데이터베이스에서는 내부 정의 Operator를 효과적으로 적용하기 위해 B*TREE 인덱스를 사용하였다.
 
그러나 기존의 B*Tree 인덱스는 일부 데이터 타입(숫자, 문자열)에 대하여만 인덱스를 생성할 수 있어 다른 데이터 타입(Text, spatial, image, video and audio)에 대하여 새로운 특화된 인덱스 기법을 필요하게 되었다. 이렇게 하여 탄생한 것이 사용자 정의 도메인 인덱스다.
 
사용자 정의 도메인 인덱스도 기존 인덱스처럼 인덱스를 검색하기 위한 사용자 정의 Operator를 가지게 되는데, 이 사용자 정의 Operator는 사용자 정의 도메인 인덱스를 검색하기 위한 함수로 indextype 정의시에 정의된다.
 
4) Index-organized table
 
사용자 정의 도메인 인덱스의 자기 자신의 물리적 구조에 정보는 데이터베이스 내부에 IOT로 저장되거나 외부 파일로 저장이 된다
 
<example>
Oracle text 에서 지원하는 도메인 인덱스에 대한 예제
 

'Database > Oracle' 카테고리의 다른 글

◈ DB Link (오라클 원격DB 연결)  (0) 2010.05.13
Architecture  (0) 2010.05.04
비트맵 인덱스(Bitmap Index)  (0) 2010.04.28
함수기반 (Function Based) 인덱스의 활용  (0) 2010.04.28
비-트리 인덱스(B-Tree Index)  (0) 2010.04.27


작가 : 김진명

예전 '무궁화 꽃이 피었습니다'를 너무 좋게 재미있게 봐서 김진명작가의 소설을 보게 됐는데..
최근에는 거의 못봤었는데.. 어제 마침 책을 빌릴 수 있어서.. 봤다.
양장본으로 되어 있고 그렇게 두껍지도 않다.
단숨에 다 읽었으니.. 한. 4시간 정도 걸린거 같다.

사실 김진명소설이 비슷비슷하다고 말들도 많지만 난 작가 위주로 책을 보게 되서..
한번 문체가 마음에 들어서 보기 시작하면 쭉보게 되는 나의 개인적인 성향..
뭐 오랜만에 보는거니깐...

내용은 김진명 작가답게 역사에 관한 중국.. 일본.. 뭐.. 비슷하긴하군.. ㅋㅋ
이번에는 중국에 관한 역사 왜곡..
한국의 한(韓)의 유래와 역사에 관한 내용이다.
좀 짧은 감이 없지 않아 있지만 그래도 맘에 드는 내용..

'Story > BookClub[1,000]' 카테고리의 다른 글

[책] 내가 공부하는 이유  (1) 2015.08.13
책 찾아볼꺼~  (0) 2012.02.01
[Book] 도가니  (0) 2010.04.28
난 금성인....  (0) 2010.03.21
헌책방에서 찾아볼 책  (0) 2010.01.26
비트맵(Bitmap)인덱스
    비트를 이용하여 컬럼값을 저장하고 이를 이용하여 rowid를 자동으로 생성하는 인덱스

비트맵 인덱스의 탄생 배경

기 존 인덱스들의 문제점에 대한 대안
  • B-tree 인덱스는 실제 컬럼 값을 인덱스에도 보관함으로써 중복이 생김
  • B-tree 인덱스는 컬럼의 분포도가 좁아야 최적의 성능을 발휘 하므로 분포도가 넓을 경우 불리
  • 결 합인덱스는 그 조건에 맞지 않는 컬럼이나 '='조건이 아닌경우가 있으면 성능의 저하가 있음
  • b-tree 인덱스는 DW 하우스 처럼 카디널러티가 낮은 다수의 디맨전들이 다양한 요구를 할경우 엄청난 개수의 인덱스를 동원해야함
  • b-tree 인덱스는 'null','not'을 사용한 부정형 조건 복잡한 'or'등에서 제 성능을 발휘하지 못함
  • 일부의 컬럼으로 인덱스를 구성하여 'driving(처리조건 주관)'하고 나머지는 체크역할로 사용
      (적은량의 결과에 내부적으로 많은 범위를 액세스한후 조건에 맞는것을 버리는 형태로 동작할수도 있음)


비트맵 인덱스의 구조와 특성


BITMAP.png


인용:
color라는  컬럼에 'yellow,green,red,null'이 들어있는경우 비트 맵 인덱스를 생성
" create bitmap index prod_color_btidx on prod(color); "
하 면 b-tree와 같은구조로 tree를 구성하여 최종 리프 노드에 각 값들의 bit값으로 변환하여 저장


  • 비 트 저장시 rowid를 선분형태(start rowid ~ end rowid)로 저장하여 압축의 효과를 가질수 있으묘 키 압축이 적용되어 저장공간이 절약된다. 컬럼값의 저장역시 비트형태로 '1'이라는 비트가 저장되며 rowid로 전환할때에도 해당비트를 액세서 하여 역연산을 수행하면 되어 btree처럼 각 컬럼마다 rowid를 가지지 않아도 된다
  • 비트맵 인덱스는 'AND' 와 'OR' 검색 시에 비트 연산을 적용하면 원하는 결과로 나타남
    (비트연산: 0 AND 1 = 0, 0 OR 1 = 1)
  • null 값역시 bit값을 가지기 때문에 b-tree인덱스의 null의 문제해결

단점
  • '=' 이 아닌 LIKE,BETWEEN,>,<,>=,<= 등의 사용시 분리
  • 저장시 선분형태로 저장되기 때문에 빈번한 수정이 발생되는 컬럼에서는 블록레벨 잠금등으로 많은 부하가 유발될수 있음

비트연산의 실행계획
BITMAP CONVERSION
  • TO ROWIDS : 테이블 액세스를 위해 비트맵을 ROWID로 변환
  • FROM ROWIDS : ROWID를 비트맵으로 변환
  • COUNT : 실제값이 필요하지 않은 경우 해당 ROWID의 개수만 산출

BITMAP INDEX
  • SINGLE VALUE : 인덱스 블록 내에서 하나의 키 값에 해당하는 비트맵을 검색
  • RANGE SCAN : 하나의 키 값에 해당하는 여러 개의 비트맵을 검색
  • FULL SCAN : 시작/종료값이 제공되지 않은 경우 비트맵 전체를 스캔

BITMAP MERGE
  • 범 위 스캔으로 얻은 몇 개의 비트맵을 하나로 머지

BITMAP MINUS
  • 부 정형 연사이나 차집합을 구하는 작업

BITMAP OR
  • 두 개의 비트맵을 대상으로 비트 열에 대한 OR 연산을 수행

BITMAP AND
  • 두 개의 비트맵을 대상으로 비트 열에 대한 AND 연산을 수행

BITMAP KEY ITERATION
  • 한 테이블에서 얻은 각각의 로우들을 특정 비트맵 인덱스에 대해 연속해서 확인하여 비트맵을 찾는것
    뒤에 비트맵 머지가 수행되어 하나의 비트맵으로 합쳐지며 스타 변형 조인에서 나타남

인용:
비트맵 인덱스는 분포도가 좁은 컬럼에서 최적의 성능을 발휘하며 인덱스 생성시 ROWID값을
선 분형태( 시작 - 끝 ) 로 저장하고 각 컬럼의 값을 0,1의 비트 값으로 저장한다.
그에 따라 AND, OR 등의 복합 조건 검색시 '논리 연산' 의 결과가 찾고자 하는 자료의 결과를 의미하게
되어 효율 적인 활용이 가능하다.

그리 고 각 DBMS의 버젼에 따라 지원 기능 및 범위가 조금씩 다르며 ORACLE 9i 이상부터는 비트맵조인인덱스도 지원한다.

'Database > Oracle' 카테고리의 다른 글

Architecture  (0) 2010.05.04
도메인 인덱스(Domain Index)  (0) 2010.04.28
함수기반 (Function Based) 인덱스의 활용  (0) 2010.04.28
비-트리 인덱스(B-Tree Index)  (0) 2010.04.27
Db file sequential read  (0) 2010.04.26
1. 컬럼의 중간 부분의 검색

    create index from_loc_idx on orders (substr(ship_id,5,3));
    create index repair_loc_idx on orders (substr(ship_id,3,2), ord_date);


2. 조인 연결고리 컬럼이 대응하지 않는 경우의 해결


  ......

    from  item_group x, items y
    where x.class1||x.class2||x.class3 = y.group_cd ......
   
    ......
    from  item_gropu x, items y
    where x.class1 = substr(y.group_cd,1,2)
    and   x.class2 = substr(y.group_cd,3,2)
    and   x.class3 = substr(y.group_cd,5,3)
    ......
 
    create index group_cd_idx_ on item_group (class1||class2||class3);


3. 일자 컬럼이 분할된 경우의 해결

    where sal_yyyy >= '2005' and sal_mm >= '12' and sal_dd >= '10'    (x)
    where sal_yyyy||sal_mm||sal_dd >= '20051210'                           (o)  문제점 : Index 사용불가

    create index sal_date_idx on sales (sal_yyyy||sal_mm||sal_dd);
 

4. 데이타 타입이 상이한 조인 컬럼

    create index deptno_idx on emp(to_number(deptno));


5. 조인 컬럼이 경우에 따라 달라지는 경우

    .......
    from  sales s, department d
    where d.deptno = (case when sal_type = 1 then sal_dept else agent_no end)
    and   d.location = 'BUSAN'
    .......
 
    create index deptno_idx on sales
           (case when sal_type = 1 then sal_dept else agent_no end);
          
     
6. 대/소문자나 공백이 혼재된 컬럼의 검색

    create index ename_upper_ix on employees (upper(ename));
 
    create index ename_upper_ix on employees (upper(replace(ename,' '));


7. NULL 값을 치환하여 검색

    .....
    where  :input_date between start_date and nvl(end_date, '99991231');
    .....
   
    create index end_date_idx on account_history (nvl(end_date, '99991231'), start_date);


8. 복잡한 계산 결과의 검색

    create index order_amount_idx on order_items
        (item_cd, (order_price - nvl(order_discount,0)) * order_count));
       
    select /*+ index_desc(x order_amount_idx) */ *
    from   order_items x
    where  item_cd = :b1
    and    rownum <= 100;


9. 기간, 컬럼 길이 검색

    create index item_idx on activities (expire_date - start_date);
   
    create index source_length_idx on print_media (text_length(source_text));


10. 배타적 관계의 유일성 보장

    create unique index official_id_idx on customers
          (case when cust_type = 1 then resident_id else business_id end);
      
    select * from customers
    where (case when cust_type = 1 then resident_id else business_id end) = :b1;


함수기반 인덱스는 버전에 따라 제약사항에 차이가 있으므로 관련 메뉴얼을 참조하세요.


<참조> 새로쓴 대용량 데이타베이스 솔루션

'Database > Oracle' 카테고리의 다른 글

도메인 인덱스(Domain Index)  (0) 2010.04.28
비트맵 인덱스(Bitmap Index)  (0) 2010.04.28
비-트리 인덱스(B-Tree Index)  (0) 2010.04.27
Db file sequential read  (0) 2010.04.26
USER_CONS_COLUMNS  (0) 2010.04.22

+ Recent posts