Как спарсить товары с разным URL но повторяющимся контентом внутри ?

Тема в разделе "Решение различных задач по парсингу", создана пользователем 4upik, 19 ноя 2015.

  1. 4upik

    4upik New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    23
    Парсим аккумуляторы для ноутбуков по моделям с сайта Ссылки недоступны для гостей

    Возникла такая проблема на странице аккумулятора указано только название батарейки без указания модели на которую она подходит

    Задача была вывести модель ноутбука вместо модели аккумулятор что было реализовано с помощью <CD_DOCURL!> т.к. в URL указаны модели ноутбуков

    Теперь возникла проблема с тем что по разным URL открываются одни и те же аккумуляторы
    ( к примеру HP-Compaq ProBook 4730s (A1G10ES) и HP-Compaq ProBook 4730s (B0X55EA) подходит один и тот же аккумулятор CMP-4730-8)

    Как сделать так чтобы если программа уже спарсила аккумулятор CMP-4730-8 или любой другой по первому попавшему URL, при обработке разных URL с таким же
    аккумулятором не создавала запись как о новой батарейке а просто добавила в описание, что также эта батарейка подходит к таким то ноутбукам
    к примеру HP-Compaq ProBook 4730s (A1G10ES) и HP-Compaq ProBook 4730s и т.д.)

    В шаблоне вывода используются повторяющиеся границы и выводятся <CD_CYCLE_GRAN_ALL!>

    в повторяющихся границах

    [REPLACE(http://battery.kg/notebook.php?description=|)]<CD_DOCURL!>[/REPLACE]; [GRAN1]; [GRAN8];
    берет название ноутбука с урл ; модель акк ; описание;

    Получается примерно нужно задать такую формулу

    Если [GRAN1] уже повторяется 2-3-4-нный раз то начиная со второго не создавать его а взять с этого URL название
    [REPLACE(http://battery.kg/notebook.php?description=|)]<CD_DOCURL!>[/REPLACE]; и добавить его в [GRAN8]

    На примере :

    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей


    Для всех них указан аккумулятор CMP-4730-8

    Должно получиться так
    HP-Compaq ProBook 4730s (A1G10ES);CMP-4730-8;HP-Compaq ProBook 4730s (A6E45EA),HP-Compaq ProBook 4730s (A6E47EA);

    Возможно ли такое и кто сможет помочь ?
     
    Последнее редактирование: 19 ноя 2015
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    При беглом ознакомлении данную задачу мне осмыслить не удалось. Времени на изучение этого вопроса у меня сейчас нет. Рекомендую обратиться за помощью к специалистам по настройке Ссылки недоступны для гостей

    С уважением к вам, Сергей...
     

Поделиться этой страницей