Парсинг страниц выдачи заскриптованного сайта

Тема в разделе "Решение различных задач по парсингу", создана пользователем nana1234, 30 апр 2019.

  1. nana1234

    nana1234 New Member Пользователи

    Регистрация:
    30 апр 2019
    Сообщения:
    7
    Город:
    Москва
    Добрый день! Мне нужно скачать список номеров в границах района с кадастровой карты.
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Скрин: Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Я загружаю страницу в WBApp, чтобы имитировать клик по страницам. Но выдача в WBApp не отображается.
    Скрин: Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Скажите, пожалуйста, что я делаю не так?

    Спасибо большое за любой совет!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    11.455
    Здравствуйте.

     

    Вложения:

    kagorec и nana1234 нравится это.
  3. nana1234

    nana1234 New Member Пользователи

    Регистрация:
    30 апр 2019
    Сообщения:
    7
    Город:
    Москва
    Круто, спасибо!!
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    11.455
    Пожалуйста
     
  5. nana1234

    nana1234 New Member Пользователи

    Регистрация:
    30 апр 2019
    Сообщения:
    7
    Город:
    Москва
    Добрый день! Спасибо большое за помощь в прошлый раз.
    Сейчас этот способ перестал работать. Как вы думаете, остались ли варианты? Ссылка:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 25 постов.**
    Отсюда необходимо собрать список номеров, которые отображаются при переборе страниц.
    Ссылка из файрфокса:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 20 постов.**
    Раньше менялся только параметр skip, который менял страницы. Теперь меняется еще последняя цифра в ссылке, при переборе к ней прибавляется единица. Но данные по сформированным ссылкам не отдаются, страница не загружается.
    Возможно, у вас будут идеи, была бы очень признательна.
     
    Последнее редактирование: 13 июл 2019
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    11.455
    Здравствуйте.

     

    Вложения:

    nana1234 и kenny872012 нравится это.
  7. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    153
    Можно было бы и через Xpath, если бы он был так составлен //a[contains(text(),'>')]

    Вот мануал по xpath если кому-то нужно Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
    Последнее редактирование: 15 июл 2019
    nana1234, kagorec и Root нравится это.
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    11.455
    nana1234 нравится это.
  9. nana1234

    nana1234 New Member Пользователи

    Регистрация:
    30 апр 2019
    Сообщения:
    7
    Город:
    Москва
    Большое спасибо!!! :):D
     
  10. poler

    poler New Member Пользователи

    Регистрация:
    13 дек 2014
    Сообщения:
    2
    Можно было бы и через Xpath, если бы он был так составлен //a[contains(text(),'>')]

    //a[@title="Следующая страница"] - вот так тоже работает
     
    nana1234 и Root нравится это.

Поделиться этой страницей