Кодировка символов, UTF или ANSI?

Я использую Eclipse в Ubuntu для редактирования файлов PHP.

Но, к сожалению, некоторые из этих файлов PHP были созданы в Notepad ++ в Windows XP с определением кодировки ANSI.

Кроме того, эти файлы генерируют HTML-коды с charset = ISO-8859-1.

Когда я сконфигурировал Eclipse в ISO-8859-1, многие специальные символы были потеряны и изменены на «???», и когда я пытаюсь сохранить файл с ISO-обращением, Eclipse отображает ошибку, которая не удалось сохранить файл, потому что некоторые символы не совместимы с кодировкой.

Как сохранить эти файлы без изменения кодировки или как изменить кодировку без потери символов.

По сути, вам нужно прочитать эти файлы, используя кодировку ANSI а затем записать эти файлы с использованием кодировки ISO-8859-1 . В Notepad ++ вы можете изменить кодировку по опции « Формат» . К сожалению, нет опции ISO-8859-1 , но UTF-8 должен быть достаточным и в настоящее время также является предпочтительным выбором для мирового господства, поскольку кодировка ISO-8859-1 охватывает только латинские символы, а не, например, кириллицу, греческий, китайский, арабский, и так далее.

Под «ANSI» вы имеете в виду «код Windows 1252»?

В любом случае, как только вы выясните исходную кодировку, вы можете использовать iconv для преобразования из этой кодировки в UTF-8.

Последняя версия может конвертировать между ISO-8859-1 и UTF-8 без потери информации. версия 5.6.8 в состоянии это сделать.