Как парсить ссылки

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем atonx, 30 мар 2013.

  1. atonx

    atonx New Member Пользователи

    Регистрация:
    29 мар 2013
    Сообщения:
    14
    Ссылки для парсинга сатей можно парсить только из sitemap.xml?
    А если у сайта нету карты, то что вручную нужно вводить ссылки?
     
  2. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    честно говоря, вопрос ваш показывает, что вы не читали хелп к программе.

    список ссылок для парсинга можно получить, всего лишь введя адрес домашней странички сайта-донора. есть еще фильтры и разные прибамбасы - но для начала хватит и этого. для сбора ссылок можно использовать -
    - сканер сайтов
    - размещение начальной ссылки на вкладке "ссылки". в ходе своей работы программа сама соберет с нее все элементы href и перейдет к их парсингу во вкладке "контент"
    - если на странице ссылки заключены в другие теги - используйте обработчик sitemap.xml. заметьте, это всего лишь резервный вариант, ни в коем случае не основной. использование карты сайта оправдано только, если не работают или по какой-то другой причине не устраивают первые 2 варианта. почитайте хелп к программе.

    теперь о самой "карте". собственно говоря, sitemap.xml - это не какая-то фиксированная карта сайта. вы сами задаете, между какими элементами кода искать ссылки. там рядом имеются поля для задания произвольных границ для поиска ссылок.
    поэтому фраза -
    - лишена смысла. в этой программе вы сами определяете, что считать "картой сайта" и как с ней работать.
    чтобы проверить, замените в поекте поля <loc>.....</loc> на href="......" и посмотрите, что будет при нажатии на "карту сайта". она сразу появится.

    P.S. если у вас отсутствуют необходимые поля - обновите программу.
     
    Последнее редактирование: 30 мар 2013

Поделиться этой страницей