Сравнение границы парсинга с концом ссылки. Условие

Тема в разделе "Решение различных задач по парсингу", создана пользователем Felix_b, 12 окт 2018.

  1. Felix_b

    Felix_b Active Member Пользователи

    Регистрация:
    30 мар 2017
    Сообщения:
    100
    Доброго времени, уважаемый профессионал!

    Как перед парсингом ссылки сравнить ее конец с границей.
    Если граница и конец ссылки совпадают - парсить данную ссылку если нет - не парсить.

    Есть определенная ссылка в конце которой PAGEN2=20 или PAGEN2=2018
    Переменная только числа после знака уравнения.
    Как создать условие: Проверить границу парсинга 1 и сравнить ее с концом ссылки.
    Если граница парсинга совпадает с концом ссылки (то число что стоит после уравнения) то есть то парсить данную сылку, если нет - не парсить.

    В долгу не останусь.
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.344
    Теперь вопрос, а зачем именно в такой ключе то?
    опишите более подробно ситуацию, т.к. скорее всего там есть совсем другой смысл, а вообще
    1) Вариант это просто отсеивать их через файл с загруженными ранее ссылками (ctrl+t)
    2) Возможно просто через макрос CHECKENTRY
     
  3. Felix_b

    Felix_b Active Member Пользователи

    Регистрация:
    30 мар 2017
    Сообщения:
    100
    Думал получится в 1 проход, но так как время поджимает задачу уже решил в 2 прохода.

    1. Отсеял (проверил) через CHECKENTRY
    2. Запустил Парсинга нужных ссылок.

    Ответ на Ваш вопрос: Чтоб отсеять ненужные ссылки ибо не все они являются валидными (то есть при запуске парсинга на сохзранение хтм если ссылка не валидная сбрасывает на главную страницу и многократно получается сохранит одну и ту же страницу)
    Спасибо что отписались.
     
    Последнее редактирование: 12 окт 2018
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.243
    Ctrl+h снятие галочки с редиректа, думаю помогло бы.
     

Поделиться этой страницей