Как парсить название сайта (URL) с документа

Тема в разделе "Решение различных задач по парсингу", создана пользователем Vestmar, 5 апр 2014.

Статус темы:
Закрыта.
  1. Vestmar

    Vestmar New Member Пользователи

    Регистрация:
    22 мар 2014
    Сообщения:
    21
    Добрый день! Вопрос такой, (предыстория - у меня есть список доменов с которых нужно спарсить title key h1 ну инфу основную, что бы потом отсеять из xml файла строки не тематические (которые мне ненужны), список очень большой порядка 15 000 доменов) мне надо ещё спарсить в таблицу эксель и название домена (URL), а в коде сайтов оно редко встречается) бывает иногда в <base или в link= но 1 и 5 сатов не встречается вообще, подскажите пожалуйста как задать границу парсинга что бы первым пунктом в таблицы был "проверяемый домен" а потом уже в строку title key h1 и тд... Спасибо!
     
  2. Vestmar

    Vestmar New Member Пользователи

    Регистрация:
    22 мар 2014
    Сообщения:
    21
    Извините! Нашёл, удалите пожалуйста вопрос, что бы не захломлять) нужен был макрос <CD_DOCURL!>
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте, спасибо, пусть будет, чтобы люди читали...
     
Статус темы:
Закрыта.

Поделиться этой страницей