본문 바로가기

프로그래밍/oracle

oracle - 실행계획 SQL 연산(HASH JOIN)

반응형

실행계획 SQL 연산(HASH JOIN)


Hash Join은 테이블의 조인 시 특정 테이블 하나(크기가 작은 테이블)를 메모리로 로드 후 Hash 기법을 이용하여 조건에 맞는 데이터를 추출하는 로우(ROW) 연산 또는 집합(SET) 연산 입니다. 


일반적으로 Hash Join이 Merge Join 보다 성능이 우수하므로 힌트(USE_HASH)를 이용하여 인위적으로 해시 조인이 일어나도록 하는 것이 유리 합니다.


SQL문 사용시 인위적으로 Hash Join이 일어나게 하기 위해서는 USE_HASH 라는 힌트를 사용하면 되는데 힌트를 사용하지 않더라도 Join시 두 테이블 중 한 테이블이 상당히 작아 메모리에 로드 될만한 공간이 있다면 Hsah Join이 일어나는 실행 계획을 만들어 낼 수 있습니다.


SQL> SELECT /*+ ORDERED USE_HASH(DEPT, EMP) */

               EMP.ENAME,

               EMP.SAL,

               DEPT.DNAME

      FROM   DEPT, EMP

      WHERE DEPT.DEPTNO = EMP.DEPTNO;


Execution Plan

-----------------------------------------------------------

0         SELECT STATEMENT Optimizer=CHOOSE(Cost=5 Card=80 Bytes=8888)

1        0  HASH JOIN(Cost=5 Card=80 Bytes=8888)

2        1     TABLE ACCESS (FULL) OF ‘DEPT’ (Cost=1 Card=67 Bytes=3456)

3        1     TABLE ACCESS (FULL) OF ‘EMP’  (Cost=1 Card=90 Bytes=8756)



위 실행계획에서 DEPT 테이블이 위쪽에 위치하는데 보통 작은 테이블이 위에 위치할 때 좋은 성능을 낼 수 있습니다. 즉 DEPT 테이블이 메모리에 로드 되면 Oracle은 해싱 함수를 이용하여 EMP 테이블의 ROW들을 메모리에 로드 되어 있는 값과 비교하여 원하는 데이터를 추출 하며 이때 FROM절 뒤의 테이블 순서와 USE_HASH 힌트에 나오는 테이블의 순서는 같아야 합니다.


일반적으로 USE_HASH 힌트는 ORDERED 힌트와 같이 사용되는데 이때는 USE_HASH 인수로 두번째 테이블명(Alias 명)만을 적어도 됩니다. 즉 아래처럼 말입니다.


/*+ ORDERED USE_HASH(DEPT) */


Hash Join의 성능에 영향을 주는 파라미터는 HASH_AREA_SIZE와 HAHS_MULTIBLOCK_IO_COUNT가 있으며 첫번째 파라미터는 해시 조인 시 해시 테이블을 생성하기 위해 사용 가능한 메모리의 사이즈 이며 두번째 파라미터는 한번의 I/O로 해시 조인 시 쓰거나 읽을 수 있는 블록의 수입니다.(9i 이상에서는 HASH_MULTIBLOCK_IO_COUNT 파라미터는 더 이상 사용되지 않습니다.)

 

 

 

 


반응형