ترميز زوج البايتات

ترميز زوجين من البايت (بالإنجليزية: Byte Pair Encoding)‏ هو نموذج بسيط لضغط البيانات يقوم باستبدال زوجين من البايت على التوالي وأكثرهما شيوعاً ببايت واحد بحيث لا يتكرر البايت المستبدل في مجموعة البيانات.[1][2] الزواج المستبدل يوضع في جدول لكي يتم إعادة بناء البيانات الأصلية.

مثال[عدل]

لنفترض أننا نريد لترميز البيانات التالية:

aaabaaabac 

زوجان aa يتكرران في معظم الأحيان لذلك سوف يتم استبداله بالبايت Z والذي لم يظهر في البيانات. والآن نضع البايت Z في جدول استبدال.

Z <- aa 

ويعاد ترميز البيانات نحو التالي:

ZabZabac 

بعد ترميز البيانات يظهر الزوجين Za بشكل مستمر لذلك سوف يتم استبدال بايت Y

Z <- aa  Y <- Za 
YbYbac 

مرة أخرى نستبدال الزوجين الأكثر شيوعاً.

Z <- aa Y <- Za X <- Yb W <- XX 
 Wac 

حتي نصل إلى مرحلة يستحيل ضغط البيانات بسبب عدم وجود أزواج من البايتات متكررة.

مراجع[عدل]

  1. ^ "Dr Dobbs Journal". مؤرشف من الأصل في 2019-12-14.
  2. ^ "Byte Pair Encoding". مؤرشف من الأصل في 2017-02-17.