Парсинг товаров с отсеиванием по дублям (заголовок, артикул)+обьединение категорий

Тема в разделе "Решение различных задач по парсингу", создана пользователем rstroy, 2 мар 2021.

  1. rstroy

    rstroy New Member Пользователи

    Регистрация:
    13 янв 2021
    Сообщения:
    22
    Город:
    Запорожье
    добрый день
    парсю очередной сайт
    такая проблема
    там один товар может быть в разных категориях, но сложность в том что этот же товар с одинаковым именем или артикулом может иметь разный url... а мне нужно спарсить так что бы избежать дублей и при этом сохранить структуру сайта
    может кто подскажет в какую сторону мне смотреть? или был в такой ситуации и есть решение уже готовое или полуготовое? любая помощь будет оплачена, так как понимаю-время это деньги
     

    Вложения:

  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Макрос шаблона вывода DUPIGNORE для отсеивания дублей при парсинге Ссылки недоступны для гостей

    Функция удаления дублей в редакторе CSV (после парсинга).

    2021-03-02_20-46-33.png
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Объединение строк по ключевым столбцам (сохранение категорий) Ссылки недоступны для гостей
     
  4. rstroy

    rstroy New Member Пользователи

    Регистрация:
    13 янв 2021
    Сообщения:
    22
    Город:
    Запорожье
    спасибо, все оказалось проще чем я думал
     
    Root нравится это.
  5. rstroy

    rstroy New Member Пользователи

    Регистрация:
    13 янв 2021
    Сообщения:
    22
    Город:
    Запорожье
    в итоге все получилось не совсем так как хотел
    спарсил товары, залили, сделал сайт....
    оказалось что многие товары были в разных категориях
    к примеру товар 1 был в категории 1, категории, 2, категории 3....

    может кто подскажет как сейчас можно будет спарсить все заново но только соотнести название товара к категории?
    что бы задать список названий товаров (h1)
    и собрать категории все к этим товарам
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    С этих слов непонятно, что требуется.
     
  7. rstroy

    rstroy New Member Пользователи

    Регистрация:
    13 янв 2021
    Сообщения:
    22
    Город:
    Запорожье
    ну вот к примеру
    товар 1
    есть в категориях
    https//site.com/cat1
    https//site.com/cat1
    https//site.com/cat1
    нужно собрать товары что бы не было дублей товаров, но при этом все категории у товара записывались в одну колонку, пример
    Каталог|Категория 1|подкатегория...
    Каталог|Категория 2|подкатегория...
    Каталог|Категория 3|подкатегория...
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Как и говорил выше.

    2021-03-15_04-10-39.png
     

Поделиться этой страницей