Фильтр ссылок по наличию ключевой фразы на странице

Тема в разделе "Фильтры ссылок", создана пользователем bojikodab, 11 июн 2017.

  1. bojikodab

    bojikodab New Member Пользователи

    Регистрация:
    11 июн 2017
    Сообщения:
    2
    Подскажите, пожалуйста, не могу понять как решить мою задачу. Необходим фильтр ссылок по наличию ключевой фразы на странице. Проблема в следующем, есть страницы

    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей

    и так далее, но как отфильтровать и оставить только те ссылки на которых есть определенная фраза "купить мандарин"? Информация со страницы не нужна, нужно лишь получить список ссылок если есть определенный ключ!

    shift+ctrl+f не могу понять как применить именно к ссылкам а не к парсеру.

    Буду признателен за любую помощь, спасибо!
     
  2. aresa

    aresa Well-Known Member Пользователи

    Регистрация:
    17 окт 2015
    Сообщения:
    169
    Здравствуйте! Можно воспользоваться макросом CHECKENTRY. Если есть ключевое слово - выводить ссылку, иначе - другие действия или бездействие
     
    Root нравится это.
  3. bojikodab

    bojikodab New Member Пользователи

    Регистрация:
    11 июн 2017
    Сообщения:
    2
    а можно пожалуйста поподробней как правильно воспользоваться, Если можно с примером, или где почитать про это можно?
     
  4. aresa

    aresa Well-Known Member Пользователи

    Регистрация:
    17 окт 2015
    Сообщения:
    169
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 10 постов.**
     
    Последнее редактирование модератором: 11 июн 2017
    Root нравится это.
  5. sten30

    sten30 Member Пользователи

    Регистрация:
    7 авг 2014
    Сообщения:
    191
    А в каком все таки месте сканера сайта вводить CHECKENTRY , чтобы выбрать страницы с нужным вхождением слова?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    13.758
    Город:
    Барнаул
    Здравствуйте.

    2017-06-30_10-10-13.png
    Код:
    {ifhas}вхождение{then}{else}{get}|
     
    sten30 нравится это.
  7. t01849

    t01849 New Member Пользователи

    Регистрация:
    23 сен 2017
    Сообщения:
    4
    Всем привет. Не могу разобраться. Подскажите как спарсить ссылки со страницы, на страницах которых есть текст "артикул". Спасибо
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    13.758
    Город:
    Барнаул
  9. t01849

    t01849 New Member Пользователи

    Регистрация:
    23 сен 2017
    Сообщения:
    4
    Это я почитал, но не могу понять как этим воспользоваться. Т.Е. отфильтровать ссылки на страницах которых есть этот текст, а остальные не выводить. ПОМОГИТЕ РЕАЛИЗОВАТЬ
     
    Последнее редактирование: 23 сен 2017
  10. t01849

    t01849 New Member Пользователи

    Регистрация:
    23 сен 2017
    Сообщения:
    4
    Это я почитал, но не могу понять как этим воспользоваться. Т.Е. отфильтровать ссылки на страницах которых есть этот текст, а остальные не выводить. ПОМОГИТЕ РЕАЛИЗОВАТЬ
     
  11. t01849

    t01849 New Member Пользователи

    Регистрация:
    23 сен 2017
    Сообщения:
    4
    Кто-нибудь может помочь?
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    13.758
    Город:
    Барнаул
    2017-09-24_18-03-54.png
    Код:
    {ifhas}вхождение{then}{get}|
     
  13. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.636
    Прошу разъяснить такой момент.
    Если в строке есть наличие товара
    например:
    150x200%%%Есть_в_наличии
    150x200%%%Нет_в_наличии

    Мы можем как-то получить данные вот такого формата: 1 или 0 на выходе?
    {ifhas}Нет_в_наличии{then}0{else}1|
    По идее ведь должно так работать или {get} обязательно, но тогда оно тоже не работает
    {ifhas}Нет_в_наличии{then}{get}{else}|
    {ifhas}Нет_в_наличии{then}{else}{get}|

    т.е. в итоге имея 2 строки хотелось бы как-то выводить просто признак того что есть вхождение.
    И да я знаю что можно через другие макросы, меня именно этот интересует.

    хмм, немного еще поколдовав понял, что нужно было убрать {else}
    {ifhas}Нет_в_наличии{then}{get}|0
    но тогда зачем он нужен?
    просто это тогда решается точно также регуляркой
    re:^(.*?)Нет_в_наличии(.*?)$|0

    по всей видимости это специфический макрос для фильтрации ссылок, который в обычной поиск/замене просто бесполезен, хотя может меня и поправят, а вот если бы {ifhas}Нет_в_наличии{then}0{else}1| вот так работало, цены бы ему не было.
     
    Последнее редактирование: 9 мар 2019
  14. masrub

    masrub Member Пользователи

    Регистрация:
    29 июн 2018
    Сообщения:
    42
    А как можно отфильтровать ссылки с вхождением друг в друга?
    site.ru/rozetki-potolochnye/
    site.ru/rozetki-potolochnye/c15/
    site.ru/rozetki-potolochnye/cr11/
    site.ru/rozetki-potolochnye/cr5/

    Удалив site.ru/rozetki-potolochnye/
    оставив только
    site.ru/rozetki-potolochnye/c15/
    site.ru/rozetki-potolochnye/cr11/
    site.ru/rozetki-potolochnye/cr5/
     
  15. Achronis

    Achronis Active Member Пользователи

    Регистрация:
    30 июл 2020
    Сообщения:
    30
    Город:
    Барнаул
    Здравствуйте!

    В данном случае можете использовать фильтрацию по глубине ссылок Ссылки недоступны для гостей

    2021-02-24_19-41-49.png
     
  16. masrub

    masrub Member Пользователи

    Регистрация:
    29 июн 2018
    Сообщения:
    42
    А если глубина разная? Как правило так и бывает.
     
  17. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    13.758
    Город:
    Барнаул
    Тогда подберите нужный диапазон, например, от 3 до 4.
     
  18. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.120
    Город:
    Riga
    От 3 и до 9 впишите, ничего не пропустите нужного.
     

Поделиться этой страницей