Парсинг dns-shop.ru

Тема в разделе "Решения по парсингу популярных сайтов", создана пользователем Subrain, 17 дек 2019.

Статус темы:
Закрыта.
  1. Subrain

    Subrain Member Пользователи

    Регистрация:
    2 фев 2017
    Сообщения:
    37
    Здравствуйте!
    Подскажите плиз, почему по этой ссылке нет цены в коде?
    Артикул, название, категория парсятся без проблем.
    Проблема появилась пару недель назад. Мозг сломал, не получается спарсить.
    Включили какую-то защиту? Динамический контент? Какие ещё есть предположения?

    При просмотре кода через браузер есть тэг <div class="product-price__current" .
    При назначении границ через CD нет этого тэга.
    Ссылки недоступны для гостей
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Парсите цены со страниц товаров (а не со страницы рубрики).
     
  3. Subrain

    Subrain Member Пользователи

    Регистрация:
    2 фев 2017
    Сообщения:
    37
    Если со страницы товаров, то слишком много ссылок получается больше 20к ((.
    Если со страницы рубирики(категории) , то 1500 примерно
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Цены там подгружаются доп запросами. Проще спарсить информацию со страниц товаров. Это не долго.

    Если, все же, хотите парсить со страниц рубрик, можете парсить с помощью WBAppCEF (скрипты на WEB-странице подгрузят все цены).

    Ссылки недоступны для гостей

    Но, думаю, это будет дольше, чем спарсить информацию со страниц товаров прямыми запросами.
     
  5. Subrain

    Subrain Member Пользователи

    Регистрация:
    2 фев 2017
    Сообщения:
    37
    Купил обновление на 1год, установил CEF, все хорошо.
    Сейчас возникает проблема включена опция"Сохранять КЭШ и авторизацию" и приходится парсить в 1 поток. Если галку отключить, то парсит другой город.
    Много ссылок, вариант через заход в каждую карточку товар не подходит.
    Как можно решить проблему? Или это предложение по улучшению программы?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Спасибо за оплату.

     
    avngroup, Subrain и kagorec нравится это.
  7. Deonis062

    Deonis062 New Member Пользователи

    Регистрация:
    29 мар 2020
    Сообщения:
    8
    Город:
    Барнаул
    Добрый день! У меня проблема следующего характера: выбираю для парсинга категорию "смартфоны" на первой странице прописал границы парсинга сгенерировал ссылки, при нажатии старта парсинг происходит только с первой страницы, открываю лог а там вот такая карусель Ссылки недоступны для гостей (потоки 1, ожидание 20000). Заранее спасибо.
    Прога хорошая отличная но пошла уже 4я бутылка коньяка
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Пока человек не начнет должным образом анализировать данные, он может выпить и 10 бутылок, и не только коньяка.

    Программа делает запрос по указанным URL и применяет к ссылкам заданные фильтры.

    Ошибка может быть в:
    URL
    Заголовках запроса
    Заданных фильтрах ссылок

    На каком этапе у вас ошибка - мне не ясно.
     
  9. Deonis062

    Deonis062 New Member Пользователи

    Регистрация:
    29 мар 2020
    Сообщения:
    8
    Город:
    Барнаул
    нет если копирую в браузер сгенерированные ссылки то все ок если открываю в браузере программы все хана
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Я проверил сбор ссылок с этого сайта. Все нормально.

    С какой конкретно ссылкой у вас проблемы?
     
  11. Deonis062

    Deonis062 New Member Пользователи

    Регистрация:
    29 мар 2020
    Сообщения:
    8
    Город:
    Барнаул
    со всеми кроме первой
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Я со скриншота переписывать ссылки не горю желанием.

    Если для вас сложно выбрать ссылку, скопировать ее и вставить в сообщение на форуме, о чем может тут тогда идти разговор.
     
  13. Deonis062

    Deonis062 New Member Пользователи

    Регистрация:
    29 мар 2020
    Сообщения:
    8
    Город:
    Барнаул
    Ссылки то не причем, после генерации и выставлении фильтров (содержания ссылки, глубина ссылки и т.п) и нажатии парсинга (категория многостраничная) выдает тот лог который был указан на скриншоте.
     
  14. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Действительно, не причем.

    Как и решение данного банального вопроса, превратившегося в бе(з)смысленное перепирание.
     
    napserious нравится это.
Статус темы:
Закрыта.

Поделиться этой страницей