Алгоритм отсеивания ссылок с помощью регулярных выражений

Тема в разделе "Сбор ссылок сканером сайтов", создана пользователем Rassol2, 2 сен 2017.

  1. Rassol2

    Rassol2 Member Пользователи

    Регистрация:
    21 ноя 2016
    Сообщения:
    13
    Здравствуйте.
    Меня интересует такой вопрос.
    Можно задать шаблон ссылок, и задать шаблон ссылок что мы отсеиваем.
    Мне нужно отсеить все ссылки которые не подходят

    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей

    На конце есть ссылки есть последовательность, я хочу отсесть все ссылки которые не имеют на конце
    /Любые цыфры/

    нужно использовать регулярные выражения, но как это делается в рамка поиска ссылок. То есть как использовать Поиск/Замену я знаю, но вот как сделать только поиск для исключения ненужных ссылок ?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    2017-09-03_01-01-41.png
     
  3. Rassol2

    Rassol2 Member Пользователи

    Регистрация:
    21 ноя 2016
    Сообщения:
    13
    Я правильно понимаю что нужно указать вот такой код что бы выбрать только те ссылки что имеют указанную особенность.
    re:/[0-9]+?/
    В регулярные это должно звучать как поиск знака / после которого идет любое число [0-9] один или более раз +? и после которого идет символ /
    Я пересматривал видео регулярки это не ваше.

    А вот вопрос по вашей программе.
    то есть это будет работать так. Если регулятора выдает true значит ссылка записывается если выдает false то ссылка не записывается.
    Если записать в окно "Задать шаблон ссылок"
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Кто мешает взять и попробовать. Спрашивать дольше.

    Ссылки недоступны для гостей
     
  5. trans5

    trans5 Member Пользователи

    Регистрация:
    26 сен 2017
    Сообщения:
    66
    Город:
    екаеринбург
    Здравствуйте, к сожалению не силен в регулярных выражениях и в справке не нашел про работу с числами.
    Подскажите пож-та:
    есть ссылки формата site.ru/articles/число (например 9123)

    Как собирать все ссылки у которых число больше 9123
     
  6. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    Не думаю, что такое возможно. Я бы сделал что-нибудь вроде:
    Код:
    re:/9\d{1,3}/
    re:/10\d{1,3}/
    re:/11\d{1,3}/
    re:/12\d{1,3}/
    и т.д.
     

Поделиться этой страницей