Парсинг ссылок с канала Яндекс Дзен

Тема в разделе "Решения по парсингу популярных сайтов", создана пользователем dentany, 16 сен 2019.

  1. dentany

    dentany New Member Пользователи

    Регистрация:
    28 апр 2013
    Сообщения:
    16
    Город:
    г. Донецк
    Как спасить все урлы канала Яндекс Дзен (любого, нужен был вот этот Ссылки недоступны для гостей но для примера - подойдет и любой другой)? CD парсит, но без дозагрузки (когда вручную прокручиваешь вниз - статьи подгружаются и подгружаются) - в обычном режиме больше 40 не парсит...

    Смотрела в помощи и на канале Ютуб - по Дзену вообще ничего нет.

    Проект не прикрепляю, т.к. показывать-то нечего: XML-карты ни у одного канала нет, пробовала собрать обычным способом в режиме сканера.

    Понимаю, что нужно использовать WBApp, но не понимаю, как прописать порядок его действий при прокрутке и дозагрузке...(опыта использования не было).

    Заранее благодарю за помощь.
     
  2. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Можно реализовать на платной основе.
    Пишите в л.с.
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
     
    timur777, KiryaBH и dentany нравится это.
  4. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    при наличии в блоге более 1000 статей - хром вылетит от не хватки памяти
     
    Root нравится это.
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Я думаю, у автора темы с этим проблемы не возникнут.
     
  6. dentany

    dentany New Member Пользователи

    Регистрация:
    28 апр 2013
    Сообщения:
    16
    Город:
    г. Донецк
    Спасибо Вам большое! Нереально круто, очень Вам благодарна!
     
    timur777, kagorec и Root нравится это.

Поделиться этой страницей