Проблемы с кодировкой

Discussion in 'Решение различных задач по парсингу' started by duksa, Nov 2, 2014.

  1. duksa

    duksa New Member Пользователи

    Joined:
    Jun 27, 2012
    Messages:
    15
    Добрый день!
    У меня проблема с парсингом сайта на казахском языке.
    Загрузка web-документа utf-8 сохраняю в utf-8 без bom.
    При редактировании буквы правильно показываются, но при сохранении специфические буквы сохраняются кракозябрами.
    Как можно решить проблему?
     
  2. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Город:
    Барнаул
    Здравствуйте.

    Где именно вы редактируете и где сохраняете? Теряются ли символы при парсинге?

    С уважением к вам, Сергей.
     
  3. duksa

    duksa New Member Пользователи

    Joined:
    Jun 27, 2012
    Messages:
    15
    В предпросмотре и в задании границ видно.
    Сохранял в txt и в csv.
    Символы при парсинге вроде не теряются.
     
  4. duksa

    duksa New Member Пользователи

    Joined:
    Jun 27, 2012
    Messages:
    15
    Вот сайт
    Hidden Content:
    **Hidden Content: To see this hidden content your post count must be 1 or greater.**
    может посмотрите
     
  5. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Город:
    Барнаул
    Уважаемый, Duksa. Пожалуйста, объясните ДОХОДЧИВО, где же все-таки символы теряются, после работы каких функций или после каких действий?

    Пока для нас это остается тайной, мы не сможем вам помочь с решением этого вопроса. Все зависит от вас...

    С уважением к вам, Сергей.
     

Share This Page