Органичить области страницы для нескольких границ парсинга

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем rezhisser, 18 дек 2014.

  1. rezhisser

    rezhisser New Member Пользователи

    Регистрация:
    12 дек 2014
    Сообщения:
    22
    Добрый вечер!

    Столкнулся с такой проблемой

    На сайте-доноре реализовано высплывающее окно при наведении с расширенной инфой про товар.
    Каждая страница товара имеет внизу блок "Также покупают"

    Из-за этого код страницы содержит атрибуты для нескольких товаров, разумеется, обрамленными одинаковыми тегами.

    Проблема в том, что если в товаре, который я парсю, нет определенного атрибута, то он берется из других товаров, что есть беда(

    Пример:

    Для товара -
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    указываю границы парсинга для Цвета

    <th>Цвет: </th> - начало
    </span> - конец

    Но у другого товара -
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    нет в атрибутах цвета, и из-за этого в границу подставляется данные товара из блока ниже "Также покупают"

    Вопрос:

    Можно ли как-то ограничить область для парсинга атрибутов? Их больше 10 и повторяющихся границ не хватает...
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Используйте динамические границы парсинга - Ссылки недоступны для гостей (аналог обычным). При их задании (ctrl+e) можно указывать в качестве исходного контента одну из обычных (в левом блоке под галочкой "htm to txt").

    С уважением к вам, Сергей...
     

Поделиться этой страницей