Признак UTF-8
Модераторы: Naeel Maqsudov, C_O_D_E
Что это за байты, какова их семантика и как их записать? А то Notepad++ чего то отдельно предлагает кодировку UTF-8 и отдельно UTF-8 без BOM.
Писать можно на чём угодно, но зачем же так себя ограничивать? Пиши на c.
Byte-order-mark (BOM) позволяет сделать текст более универсальным и кроссплатформенным, поскольку размер символа в UTF кодировке может превышать один байт и необходимо знать порядок следования байтов по старшинству... идут ли они как LE или BE. Вдобавок выполняет роль сигнатуры для распознавания кодировки текста и его начала.
BOM для разных UTF
00 00 FE FF; UTF-32BE
FF FE 00 00; UTF-32LE
FE FF; UTF-16BE
FF FE; UTF-16LE
EF BB BF; UTF-8
BOM для разных UTF
00 00 FE FF; UTF-32BE
FF FE 00 00; UTF-32LE
FE FF; UTF-16BE
FF FE; UTF-16LE
EF BB BF; UTF-8
It's a long way to the top if you wanna rock'n'roll