Парсинг с изменяющимся кодом документа

Тема в разделе "Решение различных задач по парсингу", создана пользователем Quinke, 1 апр 2017.

  1. Quinke

    Quinke New Member Пользователи

    Регистрация:
    13 дек 2014
    Сообщения:
    5
    Добрый день! Возникла проблема с парсингом описания товаров сайта
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    В некоторых случаях описание идет через теги <ul>, в других через <p>, в третьих просто текст, с многократным перечислением тега <br/>. Придется для каждой группы товаров задавать разные границы? Товаров около 4000 штук, так что искать какое описание через какие теги написано - довольно проблематично.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Либо приводить описание к одному формату с помощью функций поиск-замены (если это возможно для данного сайта).

    Либо задавать разные границы для каждой группы товаров.

    Других вариантов я не вижу.
     

Поделиться этой страницей