Парсинг цен (нет в коде страницы)

Тема в разделе "Решение различных задач по парсингу", создана пользователем green, 11 июн 2021.

  1. green

    green Active Member Пользователи

    Регистрация:
    25 окт 2017
    Сообщения:
    75
    Здравствуйте
    Трубуется помощь знатоков )

    Нужно спарсить цены с этого сайта.
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Через WBApp не вариант, слишком долго получается.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Посмотрите проект. Может вы просто не так настроили ожидание?
     

    Вложения:

    green нравится это.
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Также вот пробуем сделать быстрый WBApp2 Ссылки недоступны для гостей

    Но пока с ним все не очень стабильно, увы.
     
    green нравится это.
  4. green

    green Active Member Пользователи

    Регистрация:
    25 окт 2017
    Сообщения:
    75
    Благодарю за ответ
    Именно так я и делаю.. 1 в 1
    Товаров около 100 тыс.. долго получается
    Думал может как-то запросами можно побыстрее..
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    33 часа на моем ПК с этого сайта 100k соберет.

    Посмотрю в течение дня способы побыстрее.
     
    green нравится это.
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Если HTTP заголовки из Firefox передать, цена в коде появляется.

    Ссылки недоступны для гостей
     
    green нравится это.
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    А еще WbappCEF с ожиданием элемента - это хороший бенчмарк для пк.))
    [​IMG]
     

Поделиться этой страницей