Гамма-код Элиаса
Гамма-код Элиаса — это универсальный код для кодирования положительных целых чисел, разработанный Питером Элиасом. Он обычно используется при кодировании целых чисел, максимальное значение которых не может быть определено заранее.
Описание алгоритма
[править | править код]Чтобы закодировать число:
- Записать его в двоичной форме.
- Перед двоичным представлением числа дописать нули. Количество нулей на единицу меньше количества битов двоичного представления числа.
Аналогичный способ описания этого процесса:
- Выделить из целого числа старший значащий бит (самую большую степень 2, которую число включает — 2N) и младшие N бит.
- Записать N в унарном коде; то есть N нолей, за которыми следует единица.
- Дописать N младших двоичных цифр числа следом за этим унарным кодом.
Начало кодирования:
Число | Значение | Кодирование | Предполагаемая вероятность |
---|---|---|---|
1 | 20 + 0 | 1 | 1/2 |
2 | 21 + 0 | 0 1 0 | 1/8 |
3 | 21 + 1 | 0 1 1 | 1/8 |
4 | 2² + 0 | 00 1 00 | 1/32 |
5 | 2² + 1 | 00 1 01 | 1/32 |
6 | 2² + 2 | 00 1 10 | 1/32 |
7 | 2² + 3 | 00 1 11 | 1/32 |
8 | 2³ + 0 | 000 1 000 | 1/128 |
9 | 2³ + 1 | 000 1 001 | 1/128 |
10 | 2³ + 2 | 000 1 010 | 1/128 |
11 | 2³ + 3 | 000 1 011 | 1/128 |
12 | 2³ + 4 | 000 1 100 | 1/128 |
13 | 2³ + 5 | 000 1 101 | 1/128 |
14 | 2³ + 6 | 000 1 110 | 1/128 |
15 | 2³ + 7 | 000 1 111 | 1/128 |
16 | 24 + 0 | 0000 1 0000 | 1/512 |
17 | 24 + 1 | 0000 1 0001 | 1/512 |
… |
Распределение предполагаемых вероятностей для кодов добавлено для ясности.
Чтобы декодировать закодированное гамма-кодом Элиаса число следует:
- Считать все нули, встречающиеся до первой 1. Пусть N — количество этих нулей.
- Принимая во внимание единицу, которая станет первым (самая значащим) битом целого числа, со значением 2N, считать оставшиеся N цифр целого числа.
Гамма-кодирование используется в приложениях, где самое большое значение не может быть известно заранее, или чтобы сжать данные, в которых маленькие значения встречаются более часто чем большие.
Обобщение
[править | править код]Гамма-кодирование не подходит для кодирования нулевых значений или отрицательных чисел. Один из способов закодировать ноль — прибавить ко всем числам 1 до кодирования и отнять после декодирования. Другой способ — приписать в начале любого ненулевого кода 1 , а затем кодировать ноль как простой 0. Единственный способ закодировать все целые числа — перед началом кодирования установить биекцию (соответствие), отображая целые числа из (0, 1, −1, 2, −2, 3, −3, …) в (1, 2, 3, 4, 5, 6, 7, …).
Пример программного кода
[править | править код]// Кодирование void eliasGammaEncode(char* source, char* dest) { IntReader intreader(source); BitWriter bitwriter(dest); while(intreader.hasLeft()) { int num = intreader.getInt(); int l = log2(num); for (int a=0; a < l; a++) { bitwriter.putBit(false); //поместить нули, чтобы показать, сколько бит будут следовать } bitwriter.putBit(true); //пометить конец нолей for (int a = l-1; a >= 0; a--) //записать биты как простые двоичные числа { if (num & (1 << a)) bitwriter.putBit(true); else bitwriter.putBit(false); } } intreader.close(); bitwriter.close(); } // Декодирование void eliasGammaDecode(char* source, char* dest) { BitReader bitreader(source); BitWriter bitwriter(dest); int numberBits = 0; while(bitreader.hasLeft()) { while(!bitreader.getBit() || bitreader.hasLeft())numberBits++; //продолжить чтение пока не встретится единица... int current = 0; for (int a=0; a < numberBits; a++) //прочитать numberBits битов { if (bitreader.getBit()) current += 1 << a; } //записать его как 32-битное число current = current | ( 1 << numberBits ) ;//последний бит не декодируется! for (int a=0; a < 32; a++) //прочитать numberBits битов { if (current & (1 << a)) bitwriter.putBit(true); else bitwriter.putBit(false); } } }
См. также
[править | править код]Литература
[править | править код]- Universal codeword sets and representations of the integers (англ.) // IEEE Transactions on Information Theory[англ.] : journal. — 1975. — March (vol. 21, no. 2). — P. 194—203. — doi:10.1109/tit.1975.1055349.