Признак UTF-8

Вопросы по программированию, не подходящие в другие разделы.

Модераторы: Naeel Maqsudov, C_O_D_E

Ответить
Аватара пользователя
Сионист
Сообщения: 1211
Зарегистрирован: 31 мар 2014, 06:18

Что это за байты, какова их семантика и как их записать? А то Notepad++ чего то отдельно предлагает кодировку UTF-8 и отдельно UTF-8 без BOM.
Писать можно на чём угодно, но зачем же так себя ограничивать? Пиши на c.
Аватара пользователя
somewhere
Сообщения: 1858
Зарегистрирован: 31 авг 2006, 17:14
Откуда: 71 RUS
Контактная информация:

Byte-order-mark (BOM) позволяет сделать текст более универсальным и кроссплатформенным, поскольку размер символа в UTF кодировке может превышать один байт и необходимо знать порядок следования байтов по старшинству... идут ли они как LE или BE. Вдобавок выполняет роль сигнатуры для распознавания кодировки текста и его начала.
BOM для разных UTF
00 00 FE FF; UTF-32BE
FF FE 00 00; UTF-32LE
FE FF; UTF-16BE
FF FE; UTF-16LE
EF BB BF; UTF-8
It's a long way to the top if you wanna rock'n'roll
Ответить