Автоопределение границ парсинга

Тема в разделе "Решение различных задач по парсингу", создана пользователем maxwelhelp, 26 июл 2017.

  1. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    Возможно ли автоматически определить границы парсинга контента страницы по плотности текста ?


    Например если мы видим в div большую плотность текста, то этот див становится границей...
     
  2. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Это врятли. Не самый надёжный способ определения границ.
     
  3. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    Для моего проекта не требуется надежность определения границ, возможно есть какие то решения ? В какую сторону копать ?
     
  4. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Если не нужна надёжность, посмотрите макрос <CD_AUTO!>.
     
    Root и maxwelhelp нравится это.
  5. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    Огромное вам спасибо за подсказку, ща посмотрю
     
  6. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    можно сделать условия для макроса <CD_AUTO!> если плотность текста = "значение", то брать первый div перед текстом как границу... ну или что то типа того
     
  7. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Насколько знаю, такой опции у данного макроса нет.
     
    Root нравится это.

Поделиться этой страницей