Страница 1 из 1

Признак UTF-8

Добавлено: 08 апр 2014, 14:02
Сионист
Что это за байты, какова их семантика и как их записать? А то Notepad++ чего то отдельно предлагает кодировку UTF-8 и отдельно UTF-8 без BOM.

Re: Признак UTF-8

Добавлено: 08 апр 2014, 14:26
somewhere
Byte-order-mark (BOM) позволяет сделать текст более универсальным и кроссплатформенным, поскольку размер символа в UTF кодировке может превышать один байт и необходимо знать порядок следования байтов по старшинству... идут ли они как LE или BE. Вдобавок выполняет роль сигнатуры для распознавания кодировки текста и его начала.
BOM для разных UTF
00 00 FE FF; UTF-32BE
FF FE 00 00; UTF-32LE
FE FF; UTF-16BE
FF FE; UTF-16LE
EF BB BF; UTF-8