Как сформировать ссылку, если данные подгружаются скриптами

Тема в разделе "Решение различных задач по парсингу", создана пользователем weresa, 23 апр 2020.

  1. weresa

    weresa Active Member Пользователи

    Регистрация:
    14 сен 2014
    Сообщения:
    237
    Здравствуйте.
    Не знаю даже, куда направиться в Справке, чтобы изучить вопрос.
    Вот есть сайт - Ссылки недоступны для гостей
    Нужно с этого Реестра собрать все сведения по объектам жилого фонда определенной области.
    НО! Дело в том, что сайт загружает данные скриптами - и фильтр данных, и переход по страницам, соответственно url этих страниц в явном виде не показываются, и откуда их выдернуть вообще не могу найти((
    Используя Монитор сети и параллельно HTTH Header Live - вижу вот такой запрос: Ссылки недоступны для гостей
    Но этот JSON ничего путного не дает :(
    Возможно, тут простое решение, но я совершенно потерялась(((
    Помогите, пожалуйста.
     
    Последнее редактирование: 23 апр 2020
  2. Denorion

    Denorion Member Пользователи

    Регистрация:
    7 апр 2020
    Сообщения:
    52
    Город:
    Москва
    Добрый день! Подгрузка регионов происходит по этому запросу Ссылки недоступны для гостей
    Они при первой загрузке страницы сразу же прогружаются. Ссылки недоступны для гостей
    Если вам не нужны уточнения по районам и городам, то нужно снять ID каждого региона и отдать каждый регион в ТЕЛЕ запроса
    1. после установки региона и нажатия на кнопку поис - отправляется запрос на адрес Ссылки недоступны для гостей
    С определенными заголовками и данными POST. В POST данных, как раз и отправляется ID категории Ниже красным выделил это ID Адыгеи первая строка.
    {"regionCode":"d8327a56-80de-4df2-815c-4f6ab1224c50","fiasHouseCodeList":null,"estStatus":null,"strStatus":null,"calcCount":true,"houseConditionRefList":null,"houseTypeRefList":null,"houseManagementTypeRefList":null,"cadastreNumber":null,"oktmo":null,"statuses":["APPROVED"]}.
    У меня не получилось, просто взять эту ссылку Ссылки недоступны для гостей и подставить в нее куки и POST данные и отпавить - ответ приходит пустой. Ну там какой то скрипт на странице - никаких данных не приходит.
    Данные приходят только если тыкнуть кнопку поиск на странице каталога. Надо вникать почему не получается отправлять запрос по этому адресу с подставленными куками и пост данными - точнее почему не приходит ответ. Возможно там, какой то динамический код идентификатор есть или сами куки меняются.
    Тут картинка. Ссылки недоступны для гостей
    Смысл такой.
    Разберетесь - поделитесь здесь, какой принцип. Тоже интересно.
     
  3. Denorion

    Denorion Member Пользователи

    Регистрация:
    7 апр 2020
    Сообщения:
    52
    Город:
    Москва
    Еще раз перечитал ваше сообщение... Я помоему вообще не по теме написал)) Вам УРЛы нужны страниц. Нет, т.е. вам нужно данные собрать по определенной области - соответственно нужно понять, что и куда отправлять - первое, что понятно - нужно отправлять обязательно ID региона, а если нужны еще и уточнения, то и ID уточненной категории. Предположительно все это надо отправить сюда, но это не точно. Я еще не очень разбираюсь. Ссылки недоступны для гостей

    У меня не получилось получить данные с этого адреса и я не знаю почему. Со страницы каталога если ткнуть в кнопку поиск - данные приходят, а если просто эту ссылку взять и подставить заголовки, то пусто. Нужно как то данные POST туда отправить. Я не умею пока. Через Firefox - там есть кнопочка "редактировать заголовки и отправить заново" если через нее подставить куки и данные пост и отправить, то тоже ничего не приходит.

    Какой то идентификатор там меняется.

    Либо тупо через WEBApp парсить - но там такое количество страниц, что до старости можно данные тянуть.
    Я спасть
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Какие параметры поиска нужно выбрать, чтобы выдача отобразилась?

     
  5. weresa

    weresa Active Member Пользователи

    Регистрация:
    14 сен 2014
    Сообщения:
    237
    Root, нужно собрать ссылки на все объекты Мурманской области, т.е. только первый фильтр - Мурманская область, вкладка "Поиск дома по адресу" (там 11833 объекта)
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Прямым POST запросом этот сайт парсить не получится, так как нужно передавать в HTTP заголовки GUID (который генерируется скриптами в браузере).
    Код:
    Session-GUID: e0ccc735-38af-***
    State-GUID: /houses
    Request-GUID: dbc29111-a87a-4f77-***
    Парсите данный сайт с помощью WBApPCEF.

    Ссылки недоступны для гостей
     
Similar Threads
  1. weresa
    Ответов:
    22
    Просмотров:
    1.294
  2. green
    Ответов:
    1
    Просмотров:
    523
  3. Dmitri
    Ответов:
    3
    Просмотров:
    542
  4. Root
    Ответов:
    1
    Просмотров:
    579
  5. Mind
    Ответов:
    3
    Просмотров:
    747
Загрузка...

Поделиться этой страницей