Как собрать линки статей с сайта с сео-заголовками

Тема в разделе "Решение различных задач по парсингу", создана пользователем konfuciy, 27 янв 2014.

  1. konfuciy

    konfuciy New Member Пользователи

    Регистрация:
    10 янв 2013
    Сообщения:
    89
    На многихсайтах сейчас используются сео-заголовки типа

    blog/pravo-na-roditelskie-prava

    news/knigu-greko-katolicheskogo-mitropolita-priznali-ekstremistskoy

    подскажите, как получить список ссылок для парсинга с таких сайтов, не вбивать же каждую ссылку вручную?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Для сбора ссылок с сайта источника, используйте "сканер" (синяя стрелка в панеле программы)
    или можно собрать во вкладке "ссылки" если у сайта есть пагинация в категориях (выставив диапазон от первой до последней страницы)

    п.с. вкратце описал справку по сбору ссылок, более подробно смотрите в "Ссылки недоступны для гостей"
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Сканером можно прошерстить весь сайт на предмет ссылок, удовлетворяющих настроенным фильтрам, что в вашем случае и стоит делать...

    Рекомендую проверить: есть ли карта сайта, обычно она лежит в корне сайта _http://site.ru/sitemap.xml

    С уважением к вам, Сергей.
     
  4. konfuciy

    konfuciy New Member Пользователи

    Регистрация:
    10 янв 2013
    Сообщения:
    89
    болбшое спасибо, буду пробовать!

    опробовал, все получается, еще раз спасибо
     
    Последнее редактирование: 28 янв 2014

Поделиться этой страницей