Парсинг title большого количества страниц разных сайтов

Тема в разделе "Решение различных задач по парсингу", создана пользователем Rivlex, 23 июл 2013.

  1. Rivlex

    Rivlex New Member Пользователи

    Регистрация:
    16 июл 2013
    Сообщения:
    7
    Имеем - список страниц с разных сайтов.
    Нужно вытянуть со всех title (ну это просто, задаем границы <title> и </title>).
    А теперь, как сделать так, чтобы не просто файл с title получить на выходе, а чтобы был список вида:
    title => урл страницы, с которой взят title
    title => урл страницы, с которой взят title
    title => урл страницы, с которой взят title
    и т.д...
    Еще раз обращу внимание, что сайты разные и одним указанием границ со всех я не знаю, как вытянуть урл страницы, которая парсится.
    Помогите, кто в теме :cool:
     
  2. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    <CD_DOCURL!>
    учите матчасть ;)
     
  3. Rivlex

    Rivlex New Member Пользователи

    Регистрация:
    16 июл 2013
    Сообщения:
    7
    Спасибо, матчасть я как раз пока еще не успел дочитать)) Действительно работает :)
     

Поделиться этой страницей