Границ парсинга больше 20. Автоматическое определение (както-так)

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем belov_dmitri, 6 апр 2013.

  1. belov_dmitri

    belov_dmitri New Member Пользователи

    Регистрация:
    24 авг 2012
    Сообщения:
    8
    Добрый день!

    Подскажите пожалуйста как быть в данной ситуации: имеем сайт который будем парсить, например - Ссылки недоступны для гостей

    У каждого товара, больше 20 свойств. У каждой категории свойства разные (не значения, а именно свойства). Категорий больше 50. Код одинаковый! Я понимаю как сделать через повторяющиеся границы, но не понимаю как мне сделать из этого всего нужный мне CSV.

    На выходе должен получиться csv (если взять за основу сайт, ссылка на который была выше):

    Артикул производителя | Форма | Материал поддона
    --------------------------------------------------------------
    TS-150W | прямоугольная | акрил
    --------------------------------------------------------------

    Т.е. из повторяющихся границ должно автоматически определяться значения свойства и его название, которое в дальнейшем использовать как название колонки в CSV.

    Но! В другой категории другие свойства, как быть в данном случае? Ведь CD должен будет добавить новые колонки, записав (либо не записав) в колонки с несуществующими для данной категории своствами пустые значения.

    В общем у меня ступор мозга! Помогите пожалуйста.

    Либо задача не решаемая?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    От каждого товара характерстики по разным соответствующим колонкам или в одной ячейке товара через разделитель надо?
     
  3. belov_dmitri

    belov_dmitri New Member Пользователи

    Регистрация:
    24 авг 2012
    Сообщения:
    8
    По сответствующим колонкам
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Да уж, полей там много и посоветовать можно в таком случаем только макрос GETMORECONTENT (Ссылки недоступны для гостей)
    Пример использования в шаблоне вывода:
    PHP:
    <GETMORECONTENT><URL="SELF"><START="<td class="first">Гидромассаж в кабине</td>"><STARTCOUNT="0"><END="</tr>"><ENDCOUNT="0"><PARAMS="htmtotxt,tocsv"></GETMORECONTENT>
    п.с. в OpenCart или CS-Cart эти все характеристики можно было бы выбрать одной повторяющейся границей
     
    Последнее редактирование: 7 апр 2013
  5. belov_dmitri

    belov_dmitri New Member Пользователи

    Регистрация:
    24 авг 2012
    Сообщения:
    8
    Спасибо за помощь!
     

Поделиться этой страницей