Проблемы с кодировкой

Тема в разделе "Решение различных задач по парсингу", создана пользователем duksa, 2 ноя 2014.

  1. duksa

    duksa New Member Пользователи

    Регистрация:
    27 июн 2012
    Сообщения:
    15
    Добрый день!
    У меня проблема с парсингом сайта на казахском языке.
    Загрузка web-документа utf-8 сохраняю в utf-8 без bom.
    При редактировании буквы правильно показываются, но при сохранении специфические буквы сохраняются кракозябрами.
    Как можно решить проблему?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Где именно вы редактируете и где сохраняете? Теряются ли символы при парсинге?

    С уважением к вам, Сергей.
     
  3. duksa

    duksa New Member Пользователи

    Регистрация:
    27 июн 2012
    Сообщения:
    15
    В предпросмотре и в задании границ видно.
    Сохранял в txt и в csv.
    Символы при парсинге вроде не теряются.
     
  4. duksa

    duksa New Member Пользователи

    Регистрация:
    27 июн 2012
    Сообщения:
    15
    Вот сайт
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    может посмотрите
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Уважаемый, Duksa. Пожалуйста, объясните ДОХОДЧИВО, где же все-таки символы теряются, после работы каких функций или после каких действий?

    Пока для нас это остается тайной, мы не сможем вам помочь с решением этого вопроса. Все зависит от вас...

    С уважением к вам, Сергей.
     

Поделиться этой страницей