Определение старых не работающих ссылок

Тема в разделе "Фильтры ссылок", создана пользователем uskirill, 14 дек 2016.

  1. uskirill

    uskirill Member Пользователи

    Регистрация:
    14 дек 2016
    Сообщения:
    34
    Ситуация такая , есть интернет магазин поставщика товара, у них постоянно обновляется товар. Добавляются новые ссылки и некоторые старые становятся не рабочими.
    У меня со временем база ссылок растет.

    Так вот как отфильтровать те ссылки в программе, которые уже не рабочие? И удалить их из базы. Есть ли какая нибудь проверка на работоспособность ссылки? И автоматическое их удаление с бекапа.
     
  2. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.641
    Город:
    Сочи
    Здравствуйте.

    Программой можно собрать все актуальные ссылки с сайта, но как вы будете потом удалять неактуальные из базы MySQL(?) - хороший вопрос. Ответ я на него не знаю, так как не работаю с базами данных MySQL.

    О каком бекапе идет речь? Что это?
     
  3. uskirill

    uskirill Member Пользователи

    Регистрация:
    14 дек 2016
    Сообщения:
    34
    Немного не поняли меня. Я собрал ссылки в сканере сайтов, сделал бекап ссылок, через неделю восстановил бекап сканера, добавил еще новых ссылок с сайта поставщика. Но некоторые ссылки которые я собирал раннее, уже не рабочие - их удалили. Как отфильтровать не рабочие ссылки и удалить именно те которые ведут на ошибку 404? Или заново надо собирать ссылки с начала каждый раз?
     
  4. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.641
    Город:
    Сочи
    1) Перейти во вкладку "Контент" и добавить ссылки для проверки (F8);
    2) В шаблоне вывода (ctrl+2) прописать <CD_DOCURL!> и только!;
    3) Выставить парсинг в 1 файл с расширением txt;

    После парсинга в txt должны попасть только рабочие ссылки.
     

Поделиться этой страницей