Как парсить в UTF8 кодировку

Тема в разделе "Решение различных задач по парсингу", создана пользователем voronzlo123, 13 июл 2020.

  1. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    Проблема с кодировкой вместо текста знаки вопросов.

    [​IMG]

    Выставлял UTF - 8 в самом xml файле стоит кодировка UTF-8

    [​IMG]


    [​IMG]

    И тут ставил

    [​IMG]

    Но по факту это кодировка ANSI

    [​IMG]
    А мне на выходе в CSV надо UTF - 8
    Как это лечится?
     
    Последнее редактирование: 13 июл 2020
  2. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    868
    через Notepad++ конвертацией в нужную кодировку
     
  3. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    А как файл с CSV конвертировать в нотопед++
    Или xml перед разбивкой?

    В нотепед файл открывается с кодировкой UTF-8 и все норм.
    При разбивке я использую UTF-8
    [​IMG]
    Но при парсинге в Utf-8 знаки вопросов

    Нормально текст отображается только в анси при задании границ парсинга
     
  4. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    868
    [​IMG]
     
  5. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    Нотепед показывает что Xml в кодировке Utf-8 а программа CD читает содержимое только в ANSI
     
  6. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    Да если csv открыть и переделать в utf-8 потом открывает норм но почему так это проблема в CD?
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Осталось понять, какой вы файл открываете и какой функцией.
     
  8. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    Файл xml кодировка utf-8 Ссылки недоступны для гостей

    Разбиваю в проге CD

    [​IMG]

    Но СD при выборе границ парсинга загруженный файл читает в кодировке ANSI, а не utf-8

    Паршу в настройках стоит сохранение в utf-8 получаю кракозябрики при открытии в редакторе CSV в CD.

    CSV выбираю открыть с помощью нотепед ++ функция переделать в utf-8 кодировку и тогда в редакторе открывается нормально без краказябр.
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Приложите файл.
     
  10. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    Файл xml кодировка utf-8 Ссылки недоступны для гостей
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Файл CSV приложите, с которым проблемы при открытии.
     
  12. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    Вот
     

    Вложения:

  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
  14. voronzlo123

    voronzlo123 New Member Пользователи

    Регистрация:
    7 июл 2020
    Сообщения:
    21
    Город:
    Иваново
    Да это ANSI но файл идет под загрузку на сайт и нужно utf-8 вопрос как через программу сразу сохранить csv с нужной кодировкой
     
  15. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    2020-07-13_22-31-42.png
     
    voronzlo123 нравится это.

Поделиться этой страницей