GETMORECONTENT перестал работать

Тема в разделе "Решение различных задач по парсингу", создана пользователем Mind, 1 ноя 2021.

  1. Mind

    Mind Well-Known Member Пользователи

    Регистрация:
    8 ноя 2016
    Сообщения:
    192
    Доброго дня всем! Сломан голову почему данный макрос перестал работать. Цель - скачать инструкции со страницы товара. В логах "не удалось загрузить контент по заданному URL (HTTP/1.1 302 Moved Temporarily)". Просьба помочь разобраться, проект прикрепляю
     

    Вложения:

  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Без передачи HTTP заголовков этот запрос сервером отвергается.

    Если нужно спарсить разово, возьмите HTTP заголовки запроса из монитора сети Firefox (Shift+Ctrl+I в Firefox) и вставьте из в параметр <HEADERS> (в макросе <GETMORECONTENT>).

    Если требуется парсить периодически с автоматическим запуском, то используйте WBAppCEF (при использовании движка браузера проблем с заголовками запросов нет).
     
  3. Mind

    Mind Well-Known Member Пользователи

    Регистрация:
    8 ноя 2016
    Сообщения:
    192
    Спасибо за наводку! Спарсить нужно разово. В итоге не получилось заставить работать GETMORECONTENT
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Я не знаю, почему у вас проблема.

    Все просто с этим.

    Заходите в Firefox, запускаете инструмент "Монитор сети" (Shift+Ctrl+I) и переходите по нужной ссылке (открываете страницу в браузере или перезагружаете ее).

    В списке запросов выбираете именно нужный адрес и копируете заголовки через контекстное меню (правый клик по нужному запросу).

    2021-11-01_11-40-11.png

    Затем полученные заголовки вставляете в параметр <HEADERS>

    2021-11-01_11-43-14.png

    Код:
    <GETMORECONTENT><URL="<CD_GRAN_10!>"><HEADERS>ЗАГОЛОВКИ ВСТАВЬТЕ СЮДА</HEADERS><START="<div class={"}instructionContainerLeft{"}>"><STARTCOUNT="0"><END="[AUTO]div"><ENDCOUNT="0"><PARAMS=""></GETMORECONTENT>
    После установки заголовков адрес спокойно грузится макросом <GETMORECONTENT>

    2021-11-01_11-46-09.png
     
  5. Mind

    Mind Well-Known Member Пользователи

    Регистрация:
    8 ноя 2016
    Сообщения:
    192
    Спасибо, огромное, получилось! Видимо кривизна рук)
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.
     

Поделиться этой страницей