Парсинг сайта для поиска страниц содержащих ссылки на 404 код ответа сервера.

Тема в разделе "Функции и интерфейс программы", создана пользователем Orvin, 16 июл 2015.

  1. Orvin

    Orvin New Member Пользователи

    Регистрация:
    6 июл 2015
    Сообщения:
    28
    Добрый день! Возможно ли использовать программу для поиска битых ссылок с указанием на какой странице эти ссылки находятся?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Да. Шаблон вывода оставить пустым, а в окно ctrl+6 прописать <CD_DOCURL!> и парсить во вкладке "Контент" в 1 файл.

    С уважением к вам, Сергей.
     
  3. Orvin

    Orvin New Member Пользователи

    Регистрация:
    6 июл 2015
    Сообщения:
    28
    насколько я понимаю тут как минимум 2 колонки должны быть:

    ссылка на документ где расположена битая ссылка и сама битая ссылка

    Посмотреть вложение пример_1.cdp

    и почему при текущих настройках в список ссылок попадают внешние на соц сети?

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     

    Вложения:

    Последнее редактирование: 17 июл 2015
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте!
    Вы помоему неправильно сформулировали задачу.
    Вам нужно на странице находить битые ссылки, и как я понимаю таких страниц будет очень много???
    В таком случае задача решается так
    1) проект собирает ссылки со страницы через повторяющиеся границы и например формирует ссылку вида url_проверяемый на 404[PARAM]:url_original
    2) на вкладке контент используется рекомендация root

    либо программой
    Ссылки недоступны для гостей
    но только в том случае, если вам необходимо получать внешние ссылки. (хотя ее можно попросить доработать, платно)
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вы можете сделать сколько угодно, разделив столбцы оператором [CSVCS].
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Постараюсь доработать.

    Спасибо!
     

Поделиться этой страницей