Алгоритм отсеивания ссылок с помощью регулярных выражений

Тема в разделе "Сбор ссылок сканером сайтов", создана пользователем Rassol2, 2 сен 2017.

  1. Rassol2

    Rassol2 New Member Пользователи

    Регистрация:
    21 ноя 2016
    Сообщения:
    8
    Здравствуйте.
    Меня интересует такой вопрос.
    Можно задать шаблон ссылок, и задать шаблон ссылок что мы отсеиваем.
    Мне нужно отсеить все ссылки которые не подходят

    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!

    На конце есть ссылки есть последовательность, я хочу отсесть все ссылки которые не имеют на конце
    /Любые цыфры/

    нужно использовать регулярные выражения, но как это делается в рамка поиска ссылок. То есть как использовать Поиск/Замену я знаю, но вот как сделать только поиск для исключения ненужных ссылок ?
     
  2. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.741
    Город:
    Сочи
    Здравствуйте.

    2017-09-03_01-01-41.png
     
  3. Rassol2

    Rassol2 New Member Пользователи

    Регистрация:
    21 ноя 2016
    Сообщения:
    8
    Я правильно понимаю что нужно указать вот такой код что бы выбрать только те ссылки что имеют указанную особенность.
    re:/[0-9]+?/
    В регулярные это должно звучать как поиск знака / после которого идет любое число [0-9] один или более раз +? и после которого идет символ /
    Я пересматривал видео регулярки это не ваше.

    А вот вопрос по вашей программе.
    то есть это будет работать так. Если регулятора выдает true значит ссылка записывается если выдает false то ссылка не записывается.
    Если записать в окно "Задать шаблон ссылок"
     
  4. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.741
    Город:
    Сочи
  5. trans5

    trans5 New Member Пользователи

    Регистрация:
    26 сен 2017
    Сообщения:
    29
    Город:
    екаеринбург
    Здравствуйте, к сожалению не силен в регулярных выражениях и в справке не нашел про работу с числами.
    Подскажите пож-та:
    есть ссылки формата site.ru/articles/число (например 9123)

    Как собирать все ссылки у которых число больше 9123
     
  6. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    340
    Не думаю, что такое возможно. Я бы сделал что-нибудь вроде:
    Код:
    re:/9\d{1,3}/
    re:/10\d{1,3}/
    re:/11\d{1,3}/
    re:/12\d{1,3}/
    и т.д.
     

Поделиться этой страницей