Автокодировка, фильтрация документов при неверной кодировке

Тема в разделе "Решение различных задач по парсингу", создана пользователем invisible, 18 июн 2019.

  1. invisible

    invisible New Member Пользователи

    Регистрация:
    30 июл 2012
    Сообщения:
    28
    При выборе кодировки Auto

    [​IMG]

    Мы получаем такой результат

    [​IMG]

    решение, это менять для каждой страницы кодировку Ссылки недоступны для гостей

    Но, если собираем много линков, и они с разных сайтов, разная кодировка.

    Вопрос, есть макрос, для фильтрации, чтобы не сохранялись такие документы?

    Либо может есть у кого-то список таких символов, которые можно в программе перечислить, чтобы программа пропускала такие страницы.

    Пример сайта
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Сделаю на днях.
     
    invisible нравится это.
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Замените файл Content Downloader.exe (в папке с программой) этим файлом:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 27 постов.**
    Проверьте, сообщите о результате.
     
    invisible нравится это.
  4. invisible

    invisible New Member Пользователи

    Регистрация:
    30 июл 2012
    Сообщения:
    28
    Спасибо! Работает.
     
    Root нравится это.
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.
     

Поделиться этой страницей