Окончание ссылки

Тема в разделе "Парсинг конкретных сайтов (ПЛАТНО)", создана пользователем enovkiy, 12 июн 2015.

  1. enovkiy

    enovkiy New Member Пользователи

    Регистрация:
    9 фев 2015
    Сообщения:
    24
    Подскажите как сделать так в фильтре ссылок, чтобы собирались только те ссылки которые имеют такое окончание:
    _http://kakoytosait.ru/ne-vazhno-chto-zdes/8398539/
    _http://kakoytosait.ru/ne-vazhno-chto-zdes/7458962/
    _http://kakoytosait.ru/ne-vazhno-chto-zdes/7854569/
    _http://kakoytosait.ru/ne-vazhno-chto-zdes/7852564/

    То есть на конце цифры. И мне нужно именно такие ссылки собрать с цифрами на конце.
    Подскажите кто знает.
     
  2. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    205
    Код:
    re:http://kakoytosait.ru/.*/[0-9]+/$
     
  3. enovkiy

    enovkiy New Member Пользователи

    Регистрация:
    9 фев 2015
    Сообщения:
    24
    А если между _http://kakoytosait.ru/ и /7859687/ есть несколько папок?
    Например так: _http://kakoytosait.ru/kategoriya/kategoriya/kategoriya/8965698/

    Или это не важно?
     
  4. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    205
    Нет это не важно,

    .* любой символ любое количество раз
     
  5. enovkiy

    enovkiy New Member Пользователи

    Регистрация:
    9 фев 2015
    Сообщения:
    24
    Что то он не добавляет нужные ссылки. Хотя данную настройку в фильтр занес...
     
  6. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    205
    К сожалению со слов что именно вы сделали неправильно понять сложно :)
     
  7. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    205
    - Назовите адрес сайта
    - Покажите скриншот настроек сканера сайтов (фильтров)
     
  8. enovkiy

    enovkiy New Member Пользователи

    Регистрация:
    9 фев 2015
    Сообщения:
    24
    Открыл программу /нажал "сканер сайтов" / ввел стартовый домен / нажал "фильтр ссылок" / в поле "задать шаблон для ссылок" ввожу это

    PHP:
    rehttp://sportoptovik.ru/.*/[0-9]+/$
    Вроде все.
     
  9. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    205
    почему у вас после re: пробел?
    Разве строка адреса начинается с пробела? Думаю в этом проблема.
     
  10. enovkiy

    enovkiy New Member Пользователи

    Регистрация:
    9 фев 2015
    Сообщения:
    24
    вот скрин
     

    Вложения:

  11. enovkiy

    enovkiy New Member Пользователи

    Регистрация:
    9 фев 2015
    Сообщения:
    24
    Понял свой косяк. Спасибо!
     
  12. Blolk

    Blolk New Member Пользователи

    Регистрация:
    26 авг 2018
    Сообщения:
    12
    Город:
    Могилев
    А в моем случае, почему-то не работает этот пример. Подставил как в примере выше re:Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! , а все равно не попадают ссылки вида Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! в "выдачу ссылок". Пробовал и в так варианте re:Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
  13. Blolk

    Blolk New Member Пользователи

    Регистрация:
    26 авг 2018
    Сообщения:
    12
    Город:
    Могилев
    Все, разобрался. Заработало, когда в фильтре прописал так: re:/poisk/[0-9]+.html
     
  14. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.257
    читайте как работают регулярки, экранировать надо символы . и тд
     

Поделиться этой страницей