Таблица кодировки ms dos

«Альтернати́вная кодиро́вка» («Альтернативная кодировка ГОСТ») — основанная на CP437 кодовая страница, где все специфические европейские символы во второй половине заменены на кириллицу, а псевдографические символы оставлены нетронутыми. Это не портит вид программ, использующих эти символы для отрисовки текстовых окон, а также обеспечивает использование в них символов кириллицы. Разработана в 1986 году в ВЦ Академии Наук СССР [1] и была весьма популярна (в феврале 1989 года 85% опрошенных заявляли, что используют её) [2] .

Исторически существовало много вариантов альтернативной кодировки, но все различия касаются только области 0xF0—0xFF (240—255).

Окончательным стандартом стала кодировка IBM CP866, поддержка которой была добавлена в MS-DOS версии 4.01 [3] (только в локализованных и переведённых на русский язык выпусках) и повсеместно в MS-DOS версии 6.22. В этой кодировке записываются имена файлов в системе FAT (и короткие имена в VFAT). Поныне является популярной стандартной кодировкой Microsoft в среде DOS и OS/2, используется в консоли русифицированных систем семейства Windows NT. Вне среды MS-DOS в Microsoft Windows заменена стандартной кодировкой CP1251, а в операционных системах Windows NT и следующих за ней (Windows 2000, Windows XP, Windows Server 2003, Windows Vista, Windows Server 2008, Windows 7) — кодировками UCS-2 и UTF-16, основанными на стандарте Юникод.

В России кодировка частично установлена ГОСТ Р 34.303-92 [4] , где она названа КОИ-8 Н1 (не путать с КОИ-8); однако её последний ряд (0xF0—0xFF) не совпадает с аналогичным рядом в CP866.

CP866 [ править | править код ]

Верхняя часть таблиц кодировки (латиница) полностью соответствует кодировке ASCII. В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде. Ниже — таблица с отличиями от ASCII:

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
8.А
410
Б
411
В
412
Г
413
Д
414
Е
415
Ж
416
З
417
И
418
Й
419
К
41A
Л
41B
М
41C
Н
41D
О
41E
П
41F
9.Р
420
С
421
Т
422
У
423
Ф
424
Х
425
Ц
426
Ч
427
Ш
428
Щ
429
Ъ
42A
Ы
42B
Ь
42C
Э
42D
Ю
42E
Я
42F
A.а
430
б
431
в
432
г
433
д
434
е
435
ж
436
з
437
и
438
й
439
к
43A
л
43B
м
43C
н
43D
о
43E
п
43F
B.
2591

2592

2593

2502

2524

2561

2562

2556

2555

2563

2551

2557

255D

255C

255B

2510
C.
2514

2534

252C

251C

2500

253C

255E

255F

255A

2554

2569

2566

2560

2550

256C

2567
D.
2568

2564

2565

2559

2558

2552

2553

256B

256A

2518

250C

2588

2584

258C

2590

2580
E.р
440
с
441
т
442
у
443
ф
444
х
445
ц
446
ч
447
ш
448
щ
449
ъ
44A
ы
44B
ь
44C
э
44D
ю
44E
я
44F
F.Ё
401
ё
451
Є
404
є
454
Ї
407
ї
457
Ў
40E
ў
45E
°
B0

2219
·
B7

221A

2116
¤
A4

25A0
A0

CP866 может использоваться также для украинского и белорусского языков, поскольку включает символы Єє Її Ўў, однако в ней нет кириллической Іі, так что приходится вместо неё использовать латинскую Ii; также отсутствует Ґґ.

Другие варианты [ править | править код ]

(Показаны только последние строки таблиц, поскольку всё остальное совпадает.)

Наиболее распространённый вариант до появления CP866, называемый также «модифицированной альтернативной кодировкой» (в KOI8-R используется тот же набор символов, но в другом порядке):

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
F.Ё
401
ё
451

2265

2264

2320

2321
÷
F7

2248
°
B0

2219
·
B7

221A

207F
²
B2

25A0
A0

То же самое, но без буквы Ё (все символы 0xF0—0xFF совпадают с соответствующими символами CP437):

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
F.
2261
±
B1

2265

2264

2320

2321
÷
F7

2248
°
B0

2219
·
B7

221A

207F
²
B2

25A0
A0

RUSCII (CP866U, CP1125, GOST Ukrainian):

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
F.Ё
401
ё
451
Ґ
490
ґ
491
Є
404
є
454
І
406
і
456
Ї
407
ї
457
·
B7

221A

2116
¤
A4

25A0
A0

Альтернативная кодировка согласно ГОСТ 19768-87 [ источник не указан 758 дней ] (по набору символов совпадает с основной кодировкой; в позициях 0xF2—0xF5 должны быть прямые диагональные линии):

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
F.Ё
401
ё
451

256D

256E

256F

2570

2192

2190

2193

2191
÷
F7
±
B1

2116
¤
A4

25A0
A0

CP866.chuv — кодировка, использовавшаяся для отображения знаков чувашского алфавита:

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
F.Ё
401
ё
451
Ӑ
4D0
ӑ
4D1
Ӗ
4D6
ӗ
4D7
Ҫ
4AA
ҫ
4AB
Ӳ
4F2
ӳ
4F3
·
B7

221A

2116
¤
A4

25A0
A0

CP866LV — кодировка, используемая в Латвии (Латвийской ССР), часть стандартных символов заменена на буквы латышского алфавита:

© Вячеслав Маевский
mailto:konnor1@mail.ru

http://www.noo.com.by
Блокнот
Редактор MS-DOS
Microsoft Internet Explorer
Wpview
Shtirlitz
Вдогонку

Безусловно, Вы уже поняли, что содержащиеся в заголовке слова написаны по русски, но в кодировке DOS (таблица 866). Несмотря на повсеместное победное шествие Windows с её кодовой страницей 1251, нам до сих пор очень часто попадаются тексты в старой кодировке. Многие из них имеют расширение txt и открываются в Блокноте. Другие имеют нестандартные расширения, и при попытке открыть их двойным щелчком Windows запускает диалог для выбора программы (не нравится мне это). Если Вы читали мою заметку "Разгон блокнота", то знаете, как победить эту дурную привычку Окошек.

Существует множество бесплатных программ как для чтения в разных кодировках, так и для трансляции кодировок друг в друга. Их общий недостаток — их нужно откуда-то взять и установить. Между тем, на Вашем компьютере уже присутствуют как минимум 3 программы, с помощью которых можно прочесть все возможные кодировки русского языка (DOS, ISO, KOI-8R). Посмотрим, на что способна каждая из них.

Блокнот

Если Вы уже открыли файл в блокноте и только после этого обнаружили, что он создан в OEM (она же DOS) кодировке, можно посмотреть его прямо в Блокноте. Если Вы уже знаете, что файл содержит не Windows-текст, использовать Блокнот я не советую. Неудобно это. Сейчас Вы поймёте, почему.
Для перехода к OEM-кодировке выберите Правка/Шрифт. Откроется диалог Выбор шрифта. В прогручивающемся списке Шрифт этого диалога найдите Terminal и щёлкните ОК.
Недостаток этого метода в сложности переключения кодировок. Кроме того, теперь, чтобы посмотреть текстовый файл в кодировке Windows, придётся тем же способом возвращать на родину прежний шрифт (он называется Fixedsys). Так что применять Блокнот не стоит. Оставьте его для Windows-кодировки и английских текстовых файлов.

Как это ни странно, но в поставке Windows 98 SE до сих пор присутствует "Редактор MS-DOS", ведущий свою родословную от MS-DOS EDIT, который входил в систему программирования QBasic для DOS. Как следует из названия, это DOS-приложение. К счастью, это ещё и часть Windows, поэтому никаких проблем при его запуске в окне не возникает. Использовать его по прямому назначению (в качестве редактора) довольно глупо. Но как вьюер для текстовых файлов DOS он вполне подойдёт. Файл программы называется Edit.com и находится в папке WindowsCommand . Чтобы использовать его для просмотра текста, создайте для него ярлык на Рабочем столе.

Чтобы создать на Рабочем столе ярлык для файла, перетащите его на Рабочий стол правой кнопкой мыши и выберите соответствующий пункт в открывшемся меню.

Ярлык "Редактора MS-DOS" выглядит как клавиатура. Теперь достаточно перенести на него файл, и тот откроется в окне MS-DOS.

Не стоит открывать его в полноэкранном режиме.
Во-первых, Вы не сможете работать с Буфером обмена Windows.
Во-вторых, частота вертикальной развёртки в этом режиме составляет всего 60 Гц, и это вредно для глаз.
В-третьих, если у Вас по каким либо причинам отключена поддержка русского языка в MS-DOS (это три строчки в Autoexec.bat ), вместо ожидаемых русских букв Вы опять увидите абракадабру.

"Редактор MS-DOS" в принципе неплохо справляется с ролью вьюера, и я рекомендовал бы его на эту роль. если бы не знал лучший вариант.

Microsoft Internet Explorer

Да, да, да! Тот самый MS IE, которым Вы просматриваете странички в Интернете. В отличие от двух перечисленных программ, он позволяет смотреть текстовые файлы в любой (не извращённой) кодировке русского языка. Всё очень просто.
Запускаете IE в автономном режиме. Только не разворачивайте его на весь экран. Теперь перетаскиваете в его окно нужный файл из Проводника. У меня стоит IE5.01 со включённым автоопределением кодировки. Поэтому файл открывается сразу в нужной кодировке. Если по каким-то причинам IE ошибся, или автоопределение не установлено, всегда можно выбрать кодировку вручную из меню Вид.
Если Вы не хотите использовать программы, не входящие в Windows, IE — то, что Вам нужно. Тем не менее я обычно пользуюсь четвёртой программой.

Wpview

Думаю, никто ещё не забыл такую оболочку для DOS как Norton Commander. Она стала родоначальником огромного количества клонов, обладающих теми или иными достоинствами и недостатками. Многие из них живы до сих пор и продолжают плодиться усилиями энтузиастов. NC и по сей день установлен на огромном количестве компьютеров, и многие до сих пор по неведомой мне причине для совершения файловых операций даже из под Win9.x запускают любимые синие панельки.
NC есть и на моём винчестере, правда, я пользуюсь им только при необходимости загрузить компьютер в чистом DOS`е. Так вот, в русском NC5, которым я для этого пользуюсь, есть функция просмотра файлов. Из NC она вызывается нажатием клавиши F3. Она умеет просматривать 17 текстовых форматов, плюс просмотр файла в шестнадцатиричных кодах. В числе форматов: DOS и Windows текст с форматированием и без, а также RTF. С поддержкой русского языка!
Запускается этот вьюер практически мгновенно, чего не скажешь про MS IE, а это немаловажно для не слишком мощного компьютера, как мой. Знаю, у Вас возник закономерный вопрос: как это, мгновенно, если надо NC запустить, потом файл в нём найти да ещё и кодировку выбрать? Ответ прост.
За просмотр текстовых файлов в NC отвечает отдельная утилита Wpview.exe . Она вполне работоспособна и отдельно от пакета. Для этого я создал для неё ярлык на рабочем столе (о создании ярлыка см. выше).

Мне не нравится значок, которым Windows награждает приложения DOS по умолчанию. Но это легко исправить. Щёлкните ярлык правой кнопкой и выберите в меню Свойства. На вкладке Программа нажмите кнопку Сменить значок. Откроется диалог Изменение значка. Поскольку Вы меняете значок для DOS-приложения, в диалоге сразу будет открыта библиотека PIFMGR.DLL . Можно открыть другие библиотеки значков или отдельные файлы ico , нажав кнопку Обзор. Но лично мне показался соответствующим смыслу и виду программы шестой значок в верхнем ряду этой библиотеки (вид на голубое небо через серое окно). После первого запуска Wpview Вы поймёте, почему.

Чтобы посмотреть файл, я перетаскиваю его из Проводника на значок этой утилиты. И всё. Что касается кодировки, то программа помнит её последнюю установку, так что если Вы будете использовать её главным образом для просмотра текстовых файлов DOS, никаких задержек для переключения не будет.

Shtirlitz

Для расширения кругозора

Полноты ради следует вспомнить о так называемых извращённых кодировках русского языка. Возможно, Вам так и не придётся столкнуться с ними — и слава Богу. Их описание не является темой данной статьи. Если же Вы хотите поподробнее изучить данный вопрос, что мною всячески приветствуется, милости прошу сюда.
Если Вы впервые сталкиваетесь с этим термином, поясняю, что извращённые кодировки — это порождение некорректного взаимодействия клиентских почтовых программ и серверов почты. Так что если Вам довелось получить письмо, которое не читается ни в одной из стандартных кодировок, значит, его "извратил" почтовый сервер по пути прохождения. Это печально, но не смертельно. Некоторые почтовые программы умеют читать такие письма, но если Вы, как и я, пользуетесь Outlook Express, Вам понадобится отдельная программа для чтения такого письма. Их немало. Можно спорить о достоинствах и недостатках каждой конкретной из них, но лично я остановился на Штирлице 3.0 Всеволода Лукьянина. (В этом месте полагается похохмить насчёт названия программы, но я из вредности этого делать не буду.)
Нет смысла перечислять его возможности: скорее всего, они с лихвою перекроют все Ваши запросы. Но маленький совет дам. Удобно настроить программу так, чтобы она проверяла обновление Буфера обмена. Это позволит раскодировать письма на лету, просто копируя их в Буфер. Впрочем, перетаскивание файлов в окно программы Штирлиц тоже поддерживает.
Есть одно полезное применение Штирлица, не связанное с почтой. Если Вам попался файл в котором есть куски и в DOS, и в Windows кодировках (мне такие встречались, хотя я не знаю, какую цель преследуют авторы этих текстов), Штирлиц прекрасно разберётся, что к чему, и приведёт весь текст "к общему знаменателю".

Вдогонку

Совершенно неожиданно для меня самого у этой темы возникло продолжение. Я давно уже расстался с надеждой найти полноценную замену Блокноту. Всё, что попадалось мне на софт-серверах было либо абсолютно не функциональным, либо напрягало обилием ненужных мне функций. Про размеры я просто молчу. Собственно, из этого и родилась данная статья. И вдруг от Игоря Шишло (огромное ему спасибо) мне приходит письмо с крохотным аттачем.
Обработав содержимое ZIP`а дустом (то есть AVP) на предмет заразы и никаких микробов не обнаружив, я извлёк оттуда нечто, поразившее меня своей простотой, удобством и размерами. Оно называлось Bred2. Как удалось выяснить, автора зовут Олег Булычёв (Браво, маэстро!). Программа freevare, но я бы заплатил за неё с получки :). Английская версия лежит на Листсофте. У нас здесь русская. К сожалению, не удалось связаться с автором для получения разрешения на это. Сервер заворачивает назад письма, отправленные по указанному в хелпе адресу. Так что прости нас, Олег.

Теперь о предмете разговора. Вот 12 его отличий от Блокнота:

  • имеет настраиваемую панель инструментов;
  • умеет импортировать файлы;
  • помнит 10 недавно открытых документов;
  • делает многоуровневый откат (. );
  • выравнивает текст четырьмя способами;
  • помогает просмотреть макет перед выводом на печать;
  • умеет проводить автоматическую замену в тексте (. );
  • понимает несколько кодировок и позволяет оперативно их переключать, а также гонять текст из одной в другую (. );
  • позволяет выбрать для каждой кодировки вид и размер шрифта;
  • выводит текст, используя Ваши любимые цвета (например, зелёненькие буквочки на оранжевом фоне :));
  • окрывает файлы любого размера, по заверениям автора — до половины ОЗУ Вашего компьютера (прощай, WordPad. );
  • поддерживает кучу горячих клавиш для любителей не пользоваться мышью, в том числе мой любимый CTRL-S для сохранения (. ).

Кодировка MS DOS СР866 предложена фирмой Microsoft для MS DOS 6.22.

Седует отметить, что эта кодировка немного отличается от кодировки, используемой ранее фирмой Microsoft для MS DOC (CP855) и от альтернативной кодировки, разработанной для персональных компьютеров.

Русские буквы в кодовой таблице MS DOS

Оцените статью
Много толка
Добавить комментарий