Deflate 편집하기 (부분)

=== 허프만 코딩 단계 ===
LZ77로 압축된 데이터는 '''"A"''', '''"B"''', '''"(2,2)"'''와 같은 3개 요소로 구성되어 있고, 허프만 코딩 단계에서는 이러한 각 데이터 요소의 빈도를 기반으로 최적의 코드를 할당한다.

예를 들어, 가장 간단한 형태로 설명하면:

* '''"A"'''와 '''"B"'''는 동일한 빈도(각각 1번)로 나타난다.
* '''"(2,2)"'''는 6번 반복되므로 가장 빈번한 요소이다.
이 정보를 바탕으로, '''"A"'''와 '''"B"'''에는 비교적 긴 코드를, '''"(2,2)"'''에는 가장 짧은 코드를 할당할 수 있다. 가장 빈번한 패턴에 가장 짧은 코드를 할당하는 것은 허프만 코딩의 기본 원리이다.

실제 허프만 트리를 구성하고 코드를 할당하는 과정은 다음과 같이 진행됩니다:

# 데이터 요소와 그 빈도를 바탕으로 허프만 트리를 구성한다.
# 트리의 각 노드에 이진 코드를 할당하여, 빈도가 높은 요소에 짧은 경로(즉, 짧은 코드)를, 빈도가 낮은 요소에는 긴 경로(즉, 긴 코드)를 할당한다.

결과적으로, '''"(2,2)"'''에는 가장 짧은 이진 코드가 할당되고, '''"A"'''와 '''"B"'''에는 조금 더 긴 이진 코드가 할당될 것이다. 이 과정을 통해 데이터의 표현을 최적화하고, 전체적인 데이터 크기를 줄일 수 있다.

실제 허프만 코딩의 결과는 입력 데이터의 빈도 분포와 할당된 코드에 따라 달라지며, 이를 통해 최종적으로 압축된 데이터가 생성된다.