Как взять несколько артикулов с одной страницы и разделить

Тема в разделе "Решение различных задач по парсингу", создана пользователем Grafin, 19 апр 2019.

  1. Grafin

    Grafin Member Пользователи

    Регистрация:
    14 ноя 2018
    Сообщения:
    130
    Город:
    Киров
    Доброго времени.
    ссылка на поставщика
    Ссылки недоступны для гостей
    На страницах товаров часто встречается один и тот же товар с разными артикулами, но это разные упаковки. Остальные данные идентичны.
    Как строить парсинг, чтобы разделить эти артикулы, как разные товары (для разных карточек), остальное будет идентично?
    За ранее спасибо.
     
  2. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Может так ?
    в конце темы есть видео - обязательно к ознакомлению)
     
    Grafin, Root и Djahat нравится это.
  3. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    либо так как предлагает Inotoxic , если так не понятно, то можно проще подход реализовать:

    1 строка таблицы с артикулом , назначается повторяющейся границей 1. (Там в коде документо, прямо блоками для всех артикулов номально выводятся данные под цикл)
    Все остальные идентичные данные назначаются обычными границами парсинга.
    В основном шаблоне вывода - выводится только циклическая граница 1 (вывод строки формировать внутри шаблона вывода циклической границы 1 надо будет)
    Шаблон циклической границы 1 сформировать по требованию: вырезать из [VALUE] макросом REPLACE то что надо, вставить обычные границы парсинга куда надо, все это разделить чем надо, и установить разделитель циклов повторяющейся границы как нужно.


    Вот такой коротки план.

    Но лучше выучить тот метод, который рекомендует Inotoxic
     
    Grafin и Root нравится это.
  4. Grafin

    Grafin Member Пользователи

    Регистрация:
    14 ноя 2018
    Сообщения:
    130
    Город:
    Киров
    Спасибо, понято. Буду образовываться.
     
    Root нравится это.
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей

    Спарсится в CSV Таблица, для добавления к каждой ее строке других данных или границ парсинга используется параметр [PREFIX] (описание в мануале по ссылке).
     
    Grafin нравится это.
  6. Grafin

    Grafin Member Пользователи

    Регистрация:
    14 ноя 2018
    Сообщения:
    130
    Город:
    Киров
    С таблицей все понятно. Спасибо за поддержку!
     
    Последнее редактирование: 23 апр 2019

Поделиться этой страницей