Навязчивая капча при установке границ парсинга

Тема в разделе "Решение различных задач по парсингу", создана пользователем Konstantin, 1 окт 2014.

  1. Konstantin

    Konstantin New Member Пользователи

    Регистрация:
    15 ноя 2013
    Сообщения:
    4
    сайт
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Соль в том, что при обновлении каждой страницы система требует капчу.
    Настроил WBapp для расшифровки капчи через антигейт. С этим все прошло нормально - капча расшифровывается, кнопка нажимается, данные подгружаются.
    Начал устанавливать границы парсинга - и здесь в нижнем окне браузера вылезает капча. При этом нет возможности ввести эту капчу вручную, чтобы подгрузилась информация на странице. Получился тупик, в котором не могу что-либо сделать.

    Вопрос: как правильно в этом случае установить границы парсинга?
    (капча требуется в любом случае - с авторизацией на сайте и без нее)
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Во вкладке "контент" нажмите кнопку с изображением ключика и там введите капчу.

    Примечание: Если вы парсите, используя библиотеку INDY или Clever Internet Suite (смотреть в ctrl+h), то должны понимать, что эти библиотеки работают вне зависимости от Internet Explorer (на котором работает WBApp). В этом случае, чтобы, после ввода капчи в WBApp, cookies пришли в настройку HTTP-запросов программы (ctrl+h), необходимо кое-что добавить в проект WBApp (Ссылки недоступны для гостей):
    С уважением к вам, Сергей.
     
  3. redfox

    redfox New Member Пользователи

    Регистрация:
    18 фев 2013
    Сообщения:
    35
    Сергей, чтобы [GETCOOKIES_EX] отдало назад программе кукесы, надо войти на сайт? Конкретно мой мир. У меня никак не срабатывает. отдается страница, без авторизации и кукесов соответственно
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Да, сначала необходимо войти на сайт (если в WBApp вы видите себя неавторизованным, то создать события авторизации). Затем выждать пару секунд (события ожидания) и вызвать [GETCOOKIES_EX].

    С уважением к вам, Сергей...
     
  5. redfox

    redfox New Member Пользователи

    Регистрация:
    18 фев 2013
    Сообщения:
    35
    При парсинге Вк я этого не делал, и все работало. почему майнмир так не делается? изменения программы?
     

Поделиться этой страницей