Парсинг выдачи Яндекс: вместо кода страницы - информация о недоступности ресурса

Тема в разделе "Решение различных задач по парсингу", создана пользователем Rod, 1 сен 2018.

  1. Rod

    Rod Member Пользователи

    Регистрация:
    29 авг 2018
    Сообщения:
    52
    Добрый день,
    Хотел спарсить выдачу Яндекса по артикулам товара.
    Ссылки через {key} собрал.
    Переъожу на вкладку Контент, чтобы задать границы парсинга.

    Предпросмотр IE показывает страницу, а окно с кодом наверху пишет HTML разметку, ней нет самого кода страницы, а есть информация о том, что сайт "доступ к запрашиваемому ресурсу ограничен" и т.д.

    То есть, выдача Яндекс не отдает программе код.

    ДОБАВЛЕНО:
    попробовал в настройках (CTRL+H) выставить галочку около слова Контент в разделе Internet Explorer (DOM). Код загрузился.
    Но не понятно, почему так работает, а без этой галочки нет.
    Можете объяснить, что меняется?
     
    Последнее редактирование: 1 сен 2018
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Приветствую
    Работает все правильно. Галочка контент включает возможность обрабатывать js скрипты которые и выдают выдачу.
    Также можете попробовать просто поставить галочку WIN без галочки контент.
     
    Rod нравится это.

Поделиться этой страницей