Как исключить дубли картинок из шаблона вывода?

Тема в разделе "Решение различных задач по парсингу", создана пользователем sten30, 22 май 2017.

  1. sten30

    sten30 Active Member Пользователи

    Регистрация:
    7 авг 2014
    Сообщения:
    228
    На странице большое число повторений одних и тех же изображений. Я задал границу в границе, чтобы брался только один блок с изображениями, но даже в отдельном блоке одни и те же картинки скачиваются два раза.
    Ссылки недоступны для гостей
     
  2. Dumka

    Dumka Well-Known Member Пользователи

    Регистрация:
    8 фев 2012
    Сообщения:
    121
    Задаем границу
    [​IMG]
    а в шаблоне вывода делаем что то типа такого
    [​IMG]
    Код:
    [CSVIMAGES(img)][FIRST_REPLACE(<span onmouseover="DowImgFn('{skip}')"{skip}</span>|<img src="{skip(1)}">)]<CD_GRAN_1!>[/FIRST_REPLACE][/CSVIMAGES]
    В итоге парсит то что требуется
    [​IMG]
     
    kagorec и sten30 нравится это.
  3. sten30

    sten30 Active Member Пользователи

    Регистрация:
    7 авг 2014
    Сообщения:
    228
    В общем я все таки нашел, как исключать дубликаты картинок.
    В настройках макроса <DOWNLOADFILE> отключаем переименование и повторное скачивание.
    Потом удаляем дубликаты значений в ячейках.
    [DELDUP(,)]<CD_CYCLE_GRAN_1!>[/DELDUP]

    Но если на сайте есть одинаковые наименования изображений - картинки перепутаются.
     
    Последнее редактирование: 27 авг 2017
    Root нравится это.
  4. sten30

    sten30 Active Member Пользователи

    Регистрация:
    7 авг 2014
    Сообщения:
    228
    На этом сайте опять столкнулся с тем, что изображения при парсинге повторяющимися границами имеют дубли ссылок. Способ выше на сработал, так как изображения имеют не уникальные имена и другие изображения с другой картинкой вносят путаницу.
    Может все таки дополнить макрос DOWNLOADFILE функцией исключения дублей?
    Ссылки недоступны для гостей
     
  5. Duck83

    Duck83 Member Пользователи

    Регистрация:
    3 окт 2017
    Сообщения:
    76
    Город:
    Симферополь
    Подскажите, как исключить дубли картинок при парсинге? На каждой странице есть повторяющиеся картинки, вида 1.jpg, 2.jpg ....затем попадается снова 1.jpg и т.д. в указанном поле парсинга. Паршу с помощью макроса DOWNLOADFILE и с повторяющимися границами парсинга.
     
  6. olkagamkiv

    olkagamkiv Member Пользователи

    Регистрация:
    30 июл 2017
    Сообщения:
    10
    Город:
    Львов
    Добрый вечер.
    Ссылки недоступны для гостей
     
    kagorec и Dron25 нравится это.
  7. Duck83

    Duck83 Member Пользователи

    Регистрация:
    3 окт 2017
    Сообщения:
    76
    Город:
    Симферополь
    первым делом отметил данный чекбокс. У меня такая конструкция в повторяющихся границах парсинга: [DFN][INT_ID]\kartinka[/DFN]<DOWNLOADFILE>[VALUE]</DOWNLOADFILE>. В шаблоне прописано: <CD_CYCLE_GRAN_ALL!>
     

Поделиться этой страницей