Ms word кодировка
Выбор кодировки текста при открытии и сохранении файлов
Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо поделиться файлом с человеком, который работает с текстами на других языках, скачать текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.
Когда вы открываете текстовый файл в Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.
В этой статье
Общие сведения о кодировке текста
Текст, который отображается в виде текста на экране, на самом деле сохраняется как числовые значения в текстовом файле. Компьютер переводит числовые значения в видимые символы. Для этого используется стандарт кодировки.
Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.
Различные кодировки для разных алфавитов
Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке «Кириллица (Windows)» знаку «Й» соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка «Кириллица (Windows)», компьютер считывает число 201 и выводит на экран знак «Й».
Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка «Западноевропейская (Windows)», знак «Й» из исходного текстового файла на основе кириллицы будет отображен как «É», поскольку именно этому знаку соответствует число 201 в данной кодировке.
Юникод: единая кодировка для разных алфавитов
Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.
Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).
Выбор кодировки при открытии файла
Если в открытом файле текст искажен или выводится в виде вопросительных знаков либо квадратиков, возможно, Word неправильно определил кодировку. Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.
Откройте вкладку Файл.
Нажмите кнопку Параметры.
Нажмите кнопку Дополнительно.
Перейдите к разделу Общие и установите флажокПодтверждать преобразование формата файла при открытии.
Примечание: Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла при каждом открытии файла в формате, отличном от формата Word (то есть файла, который не имеет расширения DOC, DOT, DOCX, DOCM, DOTX или DOTM). Если вы часто работаете с такими файлами, но вам обычно не требуется выбирать кодировку, не забудьте отключить этот параметр, чтобы это диалоговое окно не выводилось.
Закройте, а затем снова откройте файл.
В диалоговом окне Преобразование файла выберите пункт Кодированный текст.
В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка.
В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Если почти весь текст выглядит одинаково (например, в виде квадратов или точек), возможно, на компьютере не установлен нужный шрифт. В таком случае можно установить дополнительные шрифты.
Чтобы установить дополнительные шрифты, сделайте следующее:
Нажмите кнопку Пуск и выберите пункт Панель управления.
Выполните одно из указанных ниже действий.
На панели управления выберите элемент Удаление программ.
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В Windows Vista
На панели управления выберите раздел Удаление программы.
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
На панели управления щелкните элемент Установка и удаление программ.
В списке Установленные программы щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В группе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты и затем нажмите кнопку Продолжить.
В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.
Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.
Совет: При открытии текстового файла в той или иной кодировке в Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем щелкните Параметры Word и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.
Выбор кодировки при сохранении файла
Если не выбрать кодировку при сохранении файла, будет использоваться Юникод. Как правило, рекомендуется применять Юникод, так как он поддерживает большинство символов большинства языков.
Если документ планируется открывать в программе, которая не поддерживает Юникод, вы можете выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на китайском (традиционное письмо) с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке «Китайская традиционная (Big5)». В результате текст будет отображаться правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).
Примечание: Так как Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, например, что документ в Юникоде содержит текст на иврите и языке с кириллицей. Если сохранить файл в кодировке «Кириллица (Windows)», текст на иврите не отобразится, а если сохранить его в кодировке «Иврит (Windows)», то не будет отображаться кириллический текст.
Если выбрать стандарт кодировки, который не поддерживает некоторые символы в файле, Word пометит их красным. Вы можете просмотреть текст в выбранной кодировке перед сохранением файла.
При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт Symbol, а также коды полей.
Выбор кодировки
Откройте вкладку Файл.
Выберите пункт Сохранить как.
Чтобы сохранить файл в другой папке, найдите и откройте ее.
В поле Имя файла введите имя нового файла.
В поле Тип файла выберите Обычный текст.
Нажмите кнопку Сохранить.
Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.
В диалоговом окне Преобразование файла выберите подходящую кодировку.
Чтобы использовать стандартную кодировку, выберите параметр Windows (по умолчанию).
Чтобы использовать кодировку MS-DOS, выберите параметр MS-DOS.
Чтобы задать другую кодировку, установите переключатель Другая и выберите нужный пункт в списке. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Примечание: Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.
Если появилось сообщение «Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке», можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.
Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.
Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).
Если документ будет открываться в программе, в которой текст не переносится с одной строки на другую, вы можете включить в нем жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите нужное обозначение разрыва (возврат каретки (CR), перевод строки (LF) или оба значения) в поле Завершать строки.
Поиск кодировок, доступных в Word
Word распознает несколько кодировок и поддерживает кодировки, которые входят в состав системного программного обеспечения.
Ниже приведен список письменностей и связанных с ними кодировок (кодовых страниц).
Как решать проблемы кодировок в Windows и MS Office
С переходом ко все новым версиям Windows острота проблемы существования множества кодировок русского языка почти сошла на нет
Радикально данную проблему призван решить переход к Unicode, который для Windows длится уже не первое поколение этой системы, но все никак не закончится. И, как это часто бывает, решая одни проблемы, Unicode порождает множество других.
Впрочем, для интернет-ресурсов и писем это почти всегда легко решается браузерами и почтовыми клиентами автоматически. Если у вас веб-страница или письмо все же отображается «кракозябрами» (что иногда случается из-за несоблюдения разработчиками стандартов), то нужно из главного меню выбрать пункт «Кодировка» и там методом проб и ошибок установить нужную. Этот пункт в большинстве браузеров находится в меню «Вид» (напомним, что отсутствующее на виду в современных версиях веб-обозревателей главное меню всегда можно вызвать клавишей).
Проблемы «обычного текста»
Одна из таких проблем связана с файлами в формате «обычный текст», хотя, казалось бы, что может быть проще? Бери последовательность текстовых символов и записывай в файл. Но именно из-за этой простоты, если уж проблема в них возникает, то по полной программе.
Если вы попробуете сохранить русский текст через Word (любой версии после Office 97, включая последнюю 2010) как «обычный текст», то получите на выбор ряд однобайтовых русских кодировок. По умолчанию (рис.1) предлагается стандартная «кириллица Windows» ( также известная как 1251, или ANSI), знакомая еще по DOS.
Попробуйте сделать то же самое через стандартный «Блокнот» из Windows 7 — вам уже предложат выбор между привычной ANSI и аж тремя вариантами Unicode (рис. 2). Тут уже кроется засада: текстовый файл в формате «юникода» должен сопровождаться специальным заголовком BOM (Byte Order Mark), определяющим порядок следования байтов (т. е. какой байт в 2-байтовом символе идет первым — старший или младший). Собственно засада заключается в том, что BOM не является обязательным атрибутом юникод-файла, и, с одной стороны, может отсутствовать в текстах, полученных из внешнего источника (скажем, из-под некоторых Linux-программ), с другой — вызывать сбои в программах, которые этого заголовка «не понимают».
Рецепт тут один: по мере возможности избегать «юникода» в «чистых текстах» и ориентироваться на привычную ANSI. Это позволит избежать большинства проблем, связанных с русскоязычными текстовыми файлами, хотя и ограничит их переносимость в англоязычные или европейские версии ОС.
Другую задачу, связанную с текстовыми файлами, которая обычно ставит в тупик неопытных пользователей, умеет решать любой Microsoft Word, начиная с версии Office XP — это столкновение с текстами в нестандартной однобайтовой кодировке (например, старинной DOS, также известной как OEM, или 866). Сначала надо убедиться в настройках, что включена опция «Подтверждать преобразование формата файла при открытии» (по умолчанию она выключена!). В старых версиях Word эта настройка находится в меню «Сервис/Параметры» на вкладке «Общие». В Word 2007 нажмите на кнопку с эмблемой Office, выберите «Параметры Word» в нижней части открывшегося окна. В Word 2010 раздел «Параметры» доступен через меню «Файл». В «Параметрах» перейдите к пункту «Дополнительно» на боковой панели, а затем найдите там раздел «Общие» (рис. 3).
При включенной этой функции открывать «нечитаемый» текстовый файл следует через меню «Открыть» (а не щелчком из Проводника, при котором запустится, скорее всего, «Блокнот»). Потом следует выбрать из выпадающего списка типов файлов пункт «Восстановление текста из любого файла». Файл может быть, естественно, любого формата (т. е. необязательно с расширением TXT), лишь бы он содержал текст, а не двоичные символы.
Кстати, просто прочесть документ именно в DOS-кодировке можно и с помощью «Блокнота» и вообще любой программы, которая умеет менять шрифты — достаточно через меню выбора шрифта (в «Блокноте» это «Формат/Шрифт») заменить текущий на Terminal. Не забудьте только вернуть потом шрифт обратно, а то не прочтете нормальные документы.
Unicode в Буфере обмена
Однако такие конфликты с текстовыми файлами — довольно редкий случай. У рядового пользователя гораздо чаще возникают проблемы с Unicode в Буфере обмена. Обычная ситуация, когда при переносе текста из старых программ, не поддерживающих указанную кодировку, или некоторых PDF-документов вместо русского при вставке возникает что-нибудь вроде Auaia iayedai . В большинстве правильно составленных приложений помогает простое переключение на русский язык (именно в той программе, откуда производится копирование, а не в пункте назначения), но нередко встречаются особо упертые приложения и PDF-документы, откуда сведения о том, что это русский язык, не удается извлечь никакими силами.
Microsoft Word в старых версиях Office XP и 2003 умеет решать эту проблему, о чем многие не знают, — в нем есть функция «Исправить поврежденный текст» (в меню «Сервис»). В новых версиях 2007/2010 такой функции нет. В справке и на сайте Microsoft ничего об этом разыскать не удалось — вполне вероятно, в Microsoft посчитали, что продуктов, имеющих подобные свойства, уже не осталось в природе, что, к сожалению, не соответствует действительности.
Возможно, вам тоже не захочется терять время на поиски официального решения. Тогда воспользуйтесь моей программой ClipWin (рис. 4), которую можно скачать по адресу: revich.lib.ru/clipwin.zip. Интерфейс этой программы сделан в расчете на максимально быстрое выполнение операции, но без потери контроля за ее выполнением: если текст в системном «кармане» уже имеется — достаточно запустить программу и трижды нажать на . После первого нажатия текст (уже исправленный) вставится из Буфера обмена в окно для контроля, после второго — исправленный текст заменит тот, что был изначально, а после третьего у вас программа закроется, но сам текст будет исправлен и его можно будет вставлять куда угодно.
Раскладка клавиатуры как правильно?
По моему глубокому убеждению, комфортно существовать и эффективно работать в среде Windows без использования дополнительных переключателей раскладки клавиатуры абсолютно невозможно — необходимость постоянного прицеливания скрюченными пальцами в две клавиши одновременно у меня вызывает боль в пальцах при одной только мысли об этом. Точнее, абсолютно невозможно это было до появления Vista, где вместе с традиционными комбинациям клавиш появилась, наконец, возможность переключать язык ввода одной клавишей . Но и такое решение, по крайней мере, для радетелей чистоты русского языка, неприемлемо — не вводить же букву Ё каждый раз через специальную вставку или таблицу символов.
Решение этой проблемы общеизвестно и заключается оно в применении популярной переключалки Punto Switcher, позволяющей настроить для выполнения операции в принципе любую клавишу (обычно это правый или ). Программа поддерживается «Яндексом», скачать ее можно из раздела «Программы» поисковика (по адресу soft.yandex.ru) или напрямую по адресу punto.yandex.ru. Об этой и других аналогичных программах недавно рассказал Александр Евдокимов в статье «Корректоры букв».
Многие программы данного типа способны выполнять и другую востребованную функцию: переключение уже набранного в неправильной раскладке текста. В зависимости от настроек, это может осуществляться даже автоматически, хотя лично я предпочитаю эту автоматику отключать.
Еще одно недоразумение, связанное с языковой раскладкой, встречается реже, но может добавить несколько неприятных моментов. После переключения на английский вас может озадачить одна особенность ввода некоторых символов. Это касается таких знаков, как кавычки, апострофы (их два — прямой и наклонный), тильда «
» и циркумфлекс («крышечка») «^». После нажатия соответствующей клавиши ничего не вводится — надо еще нажать либо пробел, чтобы ввести знак в «чистом» виде, либо еще какую-то букву или цифру, тогда знак введется перед ней. Можно нажать кавычку или апостроф дважды — появится сразу пара знаков (они и употребляются часто парами, текст тогда вводится между ними).
Такая, не всегда удобная особенность англоязычного компьютерного ввода может возникнуть, если по каким-то причинам для английского языка установлена раскладка «США-международная» (или, возможно, какая-то из европейских, которые у нас не в ходу). Недоразумение легко устраняется, если сменить раскладку для английского языка обратно на положенную по умолчанию просто «США». В Windows 7 к этой настройке можно добраться в Панели управления через «Языки и региональные стандарты / Языки и клавиатуры / Изменить клавиатуру / Общие / Добавить» (рис. 5).
Итоговый совет
Если у вас возникают другие проблемы с кодировками, не описанные в этой статье, то, вероятнее всего, они вызваны установкой «не той» версии Windows — например, американской или европейской с дополнительным языковым пакетом. Во избежание таких проблем следует по возможности всегда пользоваться русской версией. Но так уж сложилась жизнь у русскоязычных пользователей Windows, что проблема кодировок была, есть и будет. Ее острота снижается по мере обновления программного обеспечения, но, вероятно, проблема никогда не исчезнет полностью.
Выбор и изменение кодировки в Microsoft Word
MS Word заслужено является самым популярным текстовым редактором. Следовательно, чаще всего можно столкнуться с документами в формате именно этой программы. Все, что может в них отличаться, это лишь версия Ворда и формат файла (DOC или DOCX). Однако, не смотря на общность, с открытием некоторых документов могут возникнуть проблемы.
Одно дело, если вордовский файл не открывается вовсе или запускается в режиме ограниченной функциональности, и совсем другое, когда он открывается, но большинство, а то и все символы в документе являются нечитабельными. То есть, вместо привычной и понятной кириллицы или латиницы, отображаются какие-то непонятные знаки (квадраты, точки, вопросительные знаки).
Если и вы столкнулись с аналогичной проблемой, вероятнее всего, виною тому неправильная кодировка файла, точнее, его текстового содержимого. В этой статье мы расскажем о том, как изменить кодировку текста в Word, тем самым сделав его пригодным для чтения. К слову, изменение кодировки может понадобиться еще и для того, чтобы сделать документ нечитабельным или, так сказать, чтобы “конвертировать” кодировку для дальнейшего использования текстового содержимого документа Ворд в других программах.
Примечание: Общепринятые стандарты кодировки текста в разных странах могут отличаться. Вполне возможно, что документ, созданный, к примеру, пользователем, проживающим в Азии, и сохраненный в местной кодировке, не будет корректно отображаться у пользователя в России, использующего на ПК и в Word стандартную кириллицу.
Что такое кодировка
Вся информация, которая отображается на экране компьютера в текстовом виде, на самом деле хранится в файле Ворд в виде числовых значений. Эти значения преобразовываются программой в отображаемые знаки, для чего и используется кодировка.
Кодировка — схема нумерации, в которой каждому текстовому символу из набора соответствует числовое значение. Сама же кодировка может содержать буквы, цифры, а также другие знаки и символы. Отдельно стоит сказать о том, что в разных языках довольно часто используются различные наборы символов, именно поэтому многие кодировки предназначены исключительно для отображения символов конкретных языков.
Выбор кодировки при открытии файла
Если текстовое содержимое файла отображается некорректно, например, с квадратами, вопросительными знаками и другими символами, значит, MS Word не удалось определить его кодировку. Для устранения этой проблемы необходимо указать правильную (подходящую) кодировку для декодирования (отображения) текста.
1. Откройте меню “Файл” (кнопка “MS Office” ранее).
2. Откройте раздел “Параметры” и выберите в нем пункт “Дополнительно”.
3. Прокрутите содержимое окна вниз, пока не найдете раздел “Общие”. Установите галочку напротив пункта “Подтверждать преобразование формата файла при открытии”. Нажмите “ОК” для закрытия окна.
Примечание: После того, как вы установите галочку напротив этого параметра, при каждом открытии в Ворде файла в формате, отличном от DOC, DOCX, DOCM, DOT, DOTM, DOTX, будет отображаться диалоговое окно “Преобразование файла”. Если же вам часто приходится работать с документами других форматов, но при этом не требуется менять их кодировку, снимите эту галочку в параметрах программы.
4. Закройте файл, а затем снова откройте его.
5. В разделе “Преобразование файла” выберите пункт “Кодированный текст”.
6. В открывшемся диалоговом окне “Преобразование файла” установите маркер напротив параметра “Другая”. Выберите необходимую кодировку из списка.
- Совет: В окне “Образец” вы можете увидеть, как будет выглядеть текст в той или иной кодировке.
7. Выбрав подходящую кодировку, примените ее. Теперь текстовое содержимое документа будет корректно отображаться.
В случае, если весь текст, кодировку для которого вы выбираете, выглядит практически одинаков (например, в виде квадратов, точек, знаков вопроса), вероятнее всего, на вашем компьютере не установлен шрифт, используемый в документе, который вы пытаетесь открыть. О том, как установить сторонний шрифт в MS Word, вы можете прочесть в нашей статье.
Выбор кодировки при сохранении файла
Если вы не указываете (не выбираете) кодировку файла MS Word при сохранении, он автоматически сохраняется в кодировке Юникод, чего в большинстве случаев предостаточно. Данный тип кодировки поддерживает большую часть знаков и большинство языков.
В случае, если созданный в Ворде документ вы (или кто-то другой) планируете открывать в другой программе, не поддерживающей Юникод, вы всегда можете выбрать необходимую кодировку и сохранить файл именно в ней. Так, к примеру, на компьютере с русифицированной операционной системой вполне можно создать документ на традиционном китайском с применением Юникода.
Проблема лишь в том, что в случае, если данный документ будет открываться в программе, поддерживающей китайский, но не поддерживающей Юникод, куда правильнее будет сохранить файл в другой кодировке, например, “Китайская традиционная (Big5)”. В таком случае текстовое содержимое документа при открытии его в любой программе с поддержкой китайского языка, будет отображаться корректно.
Примечание: Так как Юникод является самым популярным, да и просто обширным стандартном среди кодировок, при сохранении текста в других кодировках возможно некорректное, неполное, а то и вовсе отсутствующее отображение некоторых файлов. На этапе выбора кодировки для сохранения файла знаки и символы, которые не поддерживаются, отображаются красным цветом, дополнительно высвечивается уведомление с информацией о причине.
1. Откройте файл, кодировку которого вам необходимо изменить.
2. Откройте меню “Файл” (кнопка “MS Office” ранее) и выберите пункт “Сохранить как”. Если это необходимо, задайте имя файла.
3. В разделе “Тип файла” выберите параметр “Обычный текст”.
4. Нажмите кнопку “Сохранить”. Перед вами появится окно “Преобразование файла».
5. Выполните одно из следующих действий:
Примечание: Если при выборе той или иной (“Другой”) кодировки вы видите сообщение “Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке”, выберите другую кодировку (иначе содержимое файла будет отображаться некорректно) или же установите галочку напротив параметра “разрешить подстановку знаков”.
Если подстановка знаков разрешена, все те знаки, которые отобразить в выбранной кодировке невозможно, будут автоматически заменены на эквивалентные им символы. Например, многоточие может быть заменено на три точки, а угловые кавычки — на прямые.
6. Файл будет сохранен в выбранной вами кодировке в виде обычного текста (формат “TXT”).
На этом, собственно, и все, теперь вы знаете, как в Word сменить кодировку, а также знаете о том, как ее подобрать, если содержимое документа отображается некорректно.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Как поменять кодировку текста в Ворде