3.1.4. 인덱스와 해싱 활용: 인덱스 원리, 해시 함수 및 해싱 활용

-b-lo 2026. 1. 27. 22:12

2026. 1. 27. 22:12

인덱스의 종류와 해싱의 충돌(Collision) 해결 기법이 단골 주제로 출제됩니다.

1. 인덱스 (Index)의 원리

인덱스는 데이터 레코드를 빠르게 찾기 위해 <키 값, 포인터> 쌍으로 구성된 데이터 구조입니다. 책의 맨 뒤에 있는 '찾아보기(색인)'와 정확히 같은 역할을 합니다.

기본 원리: 레코드가 저장된 물리적 주소를 별도의 파일로 관리하여 검색 시 전체 데이터를 다 뒤지지(Full Scan) 않게 합니다.
장점: 검색 속도가 향상되고 시스템의 전체적인 성능이 좋아집니다.
단점: 인덱스를 저장하기 위한 추가 공간이 필요하며, 데이터 삽입/삭제/수정이 빈번할 경우 인덱스를 계속 갱신해야 하므로 오히려 성능이 떨어질 수 있습니다.

클러스터드 인덱스 (Clustered Index):
- 실제 데이터 저장 순서와 인덱스 설정 순서가 같습니다.
- 영어 사전처럼 내용 자체가 정렬되어 있습니다.
- 테이블당 하나만 만들 수 있으며, 검색 속도가 매우 빠릅니다.
넌클러스터드 인덱스 (Non-Clustered Index):
- 인덱스 파일과 실제 데이터 파일이 분리되어 있습니다.
- 일반 책의 '색인' 페이지와 같습니다.
- 여러 개를 만들 수 있지만, 클러스터드보다 검색 속도는 느립니다.

해싱은 키 값을 **해시 함수(Hash Function)**라는 산술식에 대입하여 나온 결과값(해시 주소)을 통해 데이터의 위치를 바로 찾아가는 방식입니다.

인덱스의 단점: "데이터의 삽입/삭제가 빈번할 때는 성능이 저하될 수 있다"는 지문을 주의 깊게 보세요.
해싱 주소 계산: 제산법($MOD$ 연산) 문제가 계산식으로 나올 수 있습니다.
해싱 현상: 충돌(Collision)이 발생한다고 해서 항상 오버플로가 일어나는 것은 아닙니다. (버킷에 슬롯이 여러 개 있을 수 있기 때문)
속도 순서: 해싱($O(1)$) > 이진 탐색($O(\log n)$) > 순차 탐색($O(n)$) 순으로 빠릅니다.

3.2.2. 객체지향 프로그래밍 언어: 객체지향 개념 및 애플리케이션 작성 (0)	2026.01.27
3.2.1. 구조적 프로그래밍 언어: C언어 기본 문법, 배열과 포인터, 구조체와 공용체, 메모리 동적 할당 (0)	2026.01.27
3.1.3. 그래프 활용: 그래프의 이해, 구현 및 탐색 (0)	2026.01.27
3.1.2. 정렬 및 탐색: 각종 정렬 및 탐색 알고리즘 구현 (0)	2026.01.27
3.1.1. 기본 자료구조 활용: 연결 리스트, 스택, 큐, 트리 (0)	2026.01.27