Парсить более чем в 10 потоков

Тема в разделе "Решение проблем с использованием программы", создана пользователем Arless, 16 окт 2015.

  1. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Долгое время у меня была версия старт поддерживающая только 5 потоков,всегда все было нормально. Сейчас перешел на ультимейт. Решил попробовать парсить в 50 потоков опробовал несколько сайтов сразу получил бан или парсится 1 документ из 10, попробовал в 20 потоков тоже самое, получается больше чем в 10 потоков работать нельзя? Задержка стоит как по умолчанию "0"
    может кто подскажет оптимальное кол-во потоков или какие еще настройки стоит произвести?
    Еще такой момент, получается при парсинге более чем в 5 потоков придется вручную всегда проверять все ли документы парсятся или нет? Имею ввиду если вдруг сайт забанил и парсится 1 документ из 10.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Это зависит от сайта (какие-то позволяют парсить в 50 потоков, а какие-то только в 1).

    С уважением к вам, Сергей.
     
  3. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Не могу понять вот что: ставлю на парсинг допустим 10 потоков сначала парсится все нормально, затем примерно после 1000 обработанных смотрю КБ. в файле не прибавляются т.е обработка идет а в файл документы перестают записываться, прохожу по ссылке на сайт смотрю выдало капчу, ранее при работе в 5 потоков такого не замечал, ладно ввел капчу смотрю все нормально парсинг снова пошел.
    Зашел в опции добавил ключ антигейт, думал сейчас все станет норм, но нет все тоже самое опять капча сработала и пересстали записываться, ввел в ручную пошло. Получается ключ в программе не сработал или в чем дело?
     
  4. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Почему ключ капчи не срабатывает? Баланс положительный.
    Выскакивает капча Ссылки недоступны для гостей документы перестают загружаться.
     
  5. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Если я правильно понял нужно использовать макрос шаблона вывода
    [CAPCHA]http://site.ru/capcha.jpg[/CAPCHA]
    Только не понял как его задать....
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Для распознавания текста капчи и его отправки на сервер нужно пользоваться методом, предложенным на этой странице Ссылки недоступны для гостей

    С уважением к вам, Сергей.
     
  7. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    т.е чтобы капча разгадывалась мне придется парсить только с помощью WBApp?
    Я WBApp никогда не пользовался и абсолютно не знаком с ним.
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Парсить с помощью WBApp вам не нужно. С помощью WBApp только разгадывается капча.
     
  9. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Добрый день, я вам в л/c писал вы мне так и не ответили, не могу разобраться как настроить WBApp для разгадывания капчи, можете помочь или нет?
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Инструкция по настройке разгадывания капчи есть тут Ссылки недоступны для гостей

    Если решить задачу по инструкции не получается, то нужно обратиться к специалистам по настройке Ссылки недоступны для гостей

    Спасибо!

    С уважением к вам, Сергей.
     

Поделиться этой страницей