Парсинг дублирующих тэгов?

Тема в разделе "Решение различных задач по парсингу", создана пользователем sanitarn, 9 июн 2014.

  1. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Добрый день, хотел спросить можно ли как то софтом настроить границы парсинга так, чтобы можно было все дублирующие тэги вывести, которые присутствуют на странице? НУ к примеру все стронги, болды, заголовки если их на странице больше чем 1 ? Спасибо!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Парсить их повторяющимися границами Ссылки недоступны для гостей
    Как проверять, больше ли их, чем 1 - пока не пришло в голову...
     
  3. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Спасибо за вариант, может еще будут предложения.
    Мне бы просто хотелось задать тэги и после сканирования всех страниц, чтобы софтом по каждой странице вывел все имеющиеся тэги + повторяющиеся.
     
  4. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Да, жалко что никто не знает, программа вроде монстр (
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Решение вам подсказал еще в первом ответе. Почему бы им не воспользоваться...
    Чем именно вас не устраивает предложенное решение?
     
  6. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Не устроило тем, что вашим способом нельзя проверить больше ли их, чем 1
     
  7. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    может поможет
     
    Последнее редактирование модератором: 17 июн 2014
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Задать обычную границу парсинга, например, вторую (<CD_GRAN_2!>), (Ссылки недоступны для гостей) для парсинга ВТОРОГО по счету тега.

    В шаблон вывода вставить примерно следующую конструкцию:
    Программа попытается найти второй по счету тег, заданный в <CD_GRAN_2!>. Затем, макрос [CHARCOUNT] посчитает количество символов текста <CD_GRAN_2!>: если больше 0 (текст есть, граница найдена), то будет выполняться все, что после [THEN].

    Вот вам простое и эффективное решение данного вопроса.
     
  9. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Попробую, благодарю за ответ )
     

Поделиться этой страницей