Сбор ссылок без родительской

Тема в разделе "Общее", создана пользователем emkub, 2 июл 2019.

  1. emkub

    emkub Active Member Пользователи

    Регистрация:
    16 мар 2015
    Сообщения:
    157
    Здравствуйте, друзья.
    Подскажите пожалуйста, как настроить фильтр ссылок так, чтобы при сборе туда не попадала родительская ссылка, если она присутствует на странице?
    Заранее благодарю откликнувшихся.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Вырезать ее из кода с помощью функции поиск замены shift+ctrl+r.
     
    emkub нравится это.
  3. emkub

    emkub Active Member Пользователи

    Регистрация:
    16 мар 2015
    Сообщения:
    157
    Но тогда удалится и часть нужной ссылки.
    Пример. Родительская: Ссылки недоступны для гостей
    Ссылка, которая должна быть найдена: Ссылки недоступны для гостей

    Сейчас я имею на выходе и родительскую и собранную.
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
  5. emkub

    emkub Active Member Пользователи

    Регистрация:
    16 мар 2015
    Сообщения:
    157
    Да, Сергей, я вас понимаю. Ваши возмущения вполне оправданы и обоснованы.
    Но :)
    Вопрос задавал в надежде получить ответ типа "поставьте галочку там". Любой другой вариант - это уже регулярные выражения, в которых я не силён.
    А на счёт второй части видео - напишите мне в ЛС, т.к. от вас ответа я так и не дождался... хотя всё давно подготовлено.
     
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    На таких сайтах собираются все ссылки в том числе и родительской категории. В дополнительных настройках границ Ctrl+4 именно для заголовок\артикул\ид отмечается пункт "обязательно". Тем самым даем понять парсеру что нужно парсить только товарные страницы.
     
    emkub нравится это.

Поделиться этой страницей