Не получается спарсить контент со страниц сайта с HTTPS

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем infernalrain, 29 июн 2017.

  1. infernalrain

    infernalrain New Member Пользователи

    Регистрация:
    5 янв 2016
    Сообщения:
    21
    Имеется сайт Ссылки недоступны для гостей
    Необходимо спарсить контент с карточек товаров (например, H1, цену и т.д.)
    Все страницы карточек товаров идут через слаг /goods/
    Собрал все такие страницы, но не получается выставить границы парсинга, т.к. в коде (в самой программе) нет нужных мне элементов.

    Например, при вот таких настройках: Ссылки недоступны для гостей
    Программа открывает код страницы, но в нем нет H1
    Ссылки недоступны для гостей

    Если в настройках убрать DOM - то страница не грузится вообще
     
  2. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Что-то не так делаете. Сайт прекрасно открылся без DOM. Все данные есть в коде.

    Код из окна задания границ парсинга CD:

    Код:
    <div class="woocommerce-product-rating">
                                    <b>Артикул:</b> 210719                            </div>
                             
                                <div class="clearfix"></div>
                                <div class="price-tool" itemprop="offers" itemscope itemtype="http://schema.org/Offer">
                                    <p class="price">
    А вот h1:

    Код:
    <h1 class="product_title entry-title" itemprop="name">COPPER добавка медного цвета для STARLIKE 200 гр</h1>
     
    Последнее редактирование: 29 июн 2017
    Root нравится это.
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Никаких проблем нет.
     

    Вложения:

Поделиться этой страницей