Интернет-тарабарщина и сетевая абракадабра

Интернет-тарабарщина и сетевая абракадабра

Интернет — Интернет-тарабарщина и сетевая абракадабра
"...Утилита читает даже такие тексты, в которых встречаются несколько кодировок в одном файле, html-страницы с неправильно указанным charset, тексты, написанные нестандартной транслитерацией..."
Игроманияhttps://www.igromania.ru/
Интернет
Интернет-тарабарщина и сетевая абракадабра

   Часто во время путешествия по интернету или при чтении электронной почты пользователь видит на html-страничках и в ïèñüìàõ нечитаемый набор символов — вместо понятных и легко складывающихся в слова букв. Это происходит из-за неправильно подобранной браузером или почтовым клиентом кодировки текста. Чтобы избежать проблемы, нужно установить на компьютер программу-перекодировщик.
   Утилит, предназначенных для перекодировки текстов, в Сети можно найти довольно много. Мы выбрали три лучшие, на наш взгляд, программы. Поэтому сегодняшний обзор — не совсем сравнительный. Скорее, это просто описание приложений без попытки выявить лидера.


   
Shtirlitz
93 Kb

   Разработчик: Всеволод Лукьянин
   Размер: 1Мб
   Лицензия: Adware
   Интерфейс: RUS
   www.shtirlitz.ru   

   "Штирлиц" обладает очень мощным механизмом расшифровки испорченных текстов. Количество поддерживаемых кодировок и схем транслитерации (т.е. записи русских слов латиницей) огромно. Есть возможность добавить свою собственную схему расшифровки (опция для программистов). Утилита читает даже такие тексты, в которых встречаются несколько кодировок в одном файле, html-страницы с неправильно указанным charset, тексты, написанные нестандартной транслитерацией или набранные в неверной раскладке клавиатуры. "Штирлиц", в отличие от
большинства аналогов, даже восстанавливает русский текст, состоящий из выдуманных слов.   
   Тексты почтовых сообщений, закодированные с помощью систем uuencoding, xxencoding, base64 и binhex, принимают нормальный вид за доли секунды. Режим пакетного декодирования для писем не очень удобен, так как одновременно возможно перекодирование только в один стандарт.
   "Штирлиц" умеет преобразовывать html-документы в простые текстовые файлы. Но тут нужно иметь в виду, что пакетное декодирование не работает с транслитом. С простым же текстом — проблем не возникает.
   Блестяще реализована настройка программы — можно изменять практически любые параметры декодирования, что может понадобиться опытным пользователям, — а для начинающих вполне подойдут установки по умолчанию. Чтобы каждый мог настроить утилиту, что называется, под себя, к дистрибутиву прилагается подробный help-файл.
   Работать с утилитой предельно просто. При инсталляции "Штирлица" в контекстное меню текстовых файлов добавится команда “Открыть Штирлицем”.
   В целом, "Штирлиц" — одна из самых мощных программ декодирования, которая в процессе тестирования распознала и правильно отобразила подавляющее большинство предложенных ей кодировок.


   
Hieroglyph
57 Kb

   Разработчик: Михаил Морозов
   Размер: 2.9Мб
   Лицензия: Freeware
   Интерфейс: RUS
   www.adelaida.net/hieroglyph
  
   "Иероглиф" — не просто декодер. Это полноценный текстовый редактор, поддерживающий даже проверку орфографии. Во время правки при переходе от русских слов к английским смена раскладки происходит автоматически. При настройке программы можно определить, к контекстным меню каких файлов добавится команда “Открыть Иероглифом”.
   Утилита поддерживает все стандартные схемы кодировки. Транслитерация возможна в обе стороны, что среди декодеров встречается достаточно
редко. При восстановлении русского текста из латиницы можно выбрать интерактивный режим, в котором ошибки восстановления из нестандартных схем транслита практически исключены. В программу встроены и другие важные функции, делающие "Иероглиф" одним из самых мощных декодеров. Преобразование html-документа в текст, очистка текста после OCR-распознавания, сортировка строк списков по алфавиту, автоопределитель языка, переформатирование текстов и абзацев — все эти функции позволяют максимально удобно работать с текстами, исправлять в них самые различные ошибки.   
   Панель инструментов "Иероглифа" предоставляет практически все стандартные для мощных текстовых редакторов средства работы с текстом — от выбора шрифта и его цвета до поиска текста. "Иероглиф", конечно, не Word, но по количеству функций превосходит WordPad.
   Теперь о том, что касается тестирования. На сильно испорченном тестовом файле "Иероглиф" проявил себя не с лучшей стороны. Он не воспринял ни одного слова, выдав сплошные квадратики вместо букв. Не смог он прочитать и html-документ с неверным charset, который до этого был легко расшифрован "Штирлицем". Также "Иероглиф" не прочитал многие файлы-примеры из демонстрационного пакета "Штирлица". Тем не менее — большинство html-документов с неверной кодировкой и писем с транслитерацией "Иероглиф" “перевел” без ошибок. При работе с e-mail возникла проблема следующего характера: раскодирование почтовых сообщений не автоматизировано, что вызывает затруднения при работе с большим числом писем. В остальном же "Иероглиф" — отличный перекодировщик с функциями текстового редактора.


  
 Tcode
90 Kb

   Разработчик: Алексей Бойко
   Размер: 0.3Мб
   Лицензия: Freeware
   Интерфейс: RUS
    http://alexboiko.chat.ru

   Утилита предназначена для автоматического или ручного декодирования "убитых" почтовых сообщений и новостей
UseNet. При восстановлении поддерживаются кодировки Dos, Windows, KOI-8, ISO 8859-5 и их комбинации, а также преобразования текста из форматов Base64, Quoted-Printable, HTML и UTF-8. По заявлениям авторов, отличительная особенность программы — использование быстрого эвристического алгоритма распознавания русских слов.   
   С Tcode очень удобно работать, используя буфер обмена при чтении электронных писем и новостных телеконференций. Для перекодирования текста достаточно кликнуть мышкой на значок Tcode в системной области панели задач.
   В процессе тестирования с простыми случаями порчи текстов программа справилась легко, однако с текстами вида ï&icirc, полученными при сохранении html-страничек с ошибочным параметром charset, и с очень сложными вариантами трижды неверно перекодированного файла утилита не разобралась. Не работал Tcode и с транслитерацией. Возможно, в будущих версиях функции утилиты будут расширены. На данный же момент программа подходит только для начинающих пользователей благодаря простоте настройки и высокой скорости работы.

   * * *

   У каждой из рассмотренных программ есть, что называется, своя изюминка. Выбор все равно остается за вами, но мы бы посоветовали начинающим пользователям установить у себя на компьютере Tcode. Юзерам, которые много работают с текстовыми документами, — Hieroglyph, удачно совмещающий в себе функции перекодировщика и текстового редактора. Shtirlitz же идеально подойдет для продвинутых пользователей, желающих настроить параметры перекодировки на свое усмотрение. Программисты смогут написать под Shtirlitz сценарий перекодировки для нестандартных html-страниц.



   На нашем компакте

   Все описанные в статье программы можно взять с нашего компакт-диска.
Комментарии
Загрузка комментариев