Спочатку кодування UTF-8 допускало використання до шести байтів для кодування одного символу, проте в листопаді 2003 року стандарт RFC 3629 заборонив використання п'ятого і шостого байтів, а діапазон символів, що кодуються, був обмежений символом U+10FFFF .

Оскільки в UTF16 можна відобразити 220+216−2048 (1 112 064) символів, то це число і було обрано як нову величину кодового простору Юнікоду.

UTF8 – стандарт кодування, що перетворює номери осередків таблиці Юнікод у бінарні коди з використанням змінної кількості біт: 8, 16, 24 чи 32. UTF16 – стандарт кодування, що перетворює номери осередків таблиці Юнікод у бінарні коди з використанням змінної кількості біт:16 чи 32.

Unicode містить 1,114,112 кодових значень; на даний момент часу, для них призначено понад 96,000 символів. Кодовий простір Unicode для символів розділено на 17 рівнів, кожен із яких містить 65,536 кодових знаків.