Как спарсить характеристики и значения

Тема в разделе "Решение различных задач по парсингу", создана пользователем runyugin, 28 июл 2014.

  1. runyugin

    runyugin New Member Пользователи

    Регистрация:
    3 июл 2013
    Сообщения:
    9
    Как спарсить и вывести в таком виде характеристики и значения:


    код товара | характеристика1 | характеристика2 | характеристика3 | ...
    товар 1 | значения | значения | значения | ....
    товар 2 | значения | значения | значения | ....


    характеристик более 150, вбивать каждую неправильно.

     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте!

    Возможен только такой вариант Ссылки недоступны для гостей (некоторые магазины поддерживают примерно такой формат CSV для импорта).
     
  3. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Используйте комплексную поиск/замену, как вариант получения характеристик вообще, но по нормальному там нужно извращаться.

    Код:
    {br}|
    <table class="detail_table"><tr><td><strong>Код</strong></td><td>|
    </td>|{sep}
    re:<(.*?)>|
    re:\t+| 
    re:\s+| 
    
    Сначала получаем все характеристики, а потом либо формируем динамические границы (ЕСЛИ ИХ НЕ БОЛЕЕ 300 ШТ) ибо потом программа очень долго обрабатывает.
    Либо формируем все это с помощью отдельных приспособлений.
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Не нужно "извращаться" =). Просто используйте мой вариант и все дела...
     
  5. runyugin

    runyugin New Member Пользователи

    Регистрация:
    3 июл 2013
    Сообщения:
    9
    Jbzoo кушает только такой формат:

    код товара | характеристика1 | характеристика2 | характеристика3 | ...
    товар 1 | значения | значения | значения | ....
    товар 2 | значения | значения | значения | ....

    другого варианта в ксв не скормить(( пока решения нет а вопрос наверно для многих актуален
     
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    В шаблоне вывода ведь можно использовать сохранение по составленной конструкции:

    Шапка "шаблона вывода"
    код товара {sep} характеристика1 {sep} характеристика2 {sep} характеристика3 {sep} ...

    Формирование строк сохраняемого документа по макету
    <CD_GRAN_1!> {sep} <CD_GRAN_2!> {sep} <CD_GRAN_3!> {sep} <CD_GRAN_4!> {sep} ...

    [​IMG]

    п.с. хорошь вариант если товары содержат разные и однотипные характеристики в малом количестве
     
    Последнее редактирование: 29 июл 2014
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    У него 150 характеристик! =)
    Я подумаю над реализацией, но ничего пока не обещаю...
     
  8. runyugin

    runyugin New Member Пользователи

    Регистрация:
    3 июл 2013
    Сообщения:
    9
    150 характеристик это в сумме всех типов товаров...)

    то есть например:

    тип товара леска:
    длина, толщина, модель артикуль, бренд


    тип товара грузила:
    вес, тип, артикль, бренд


    В сумме выходит всех характеристик со типов товара 150 шт.

    То есть в таблице при парсе сайта:

    код товара | вес | бренд | толщина | ...
    код товара (леска) | ---- | Кокакола| 20 мм| ....
    код товара (грузило) | 20 гр| Спрайт | --- | ....
     
  9. runyugin

    runyugin New Member Пользователи

    Регистрация:
    3 июл 2013
    Сообщения:
    9
    как вариант в два приема парсим... сначало собираем все характеристики, дальше вторым парсом делаем сравнение но как реализовать...
     
  10. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Парсим первым проектом характеристики (основные, применив к ним поиск замену)
    Создаем динамические границы для характеристик, если таковых не более 300 ибо дальше программа начинает очень долго обрабатывать контент)
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Наверное, я стар уже стал. Все думаю над реализацией...
    Ждите еще...
    Пара способов уже не подошло, долго работают с парсингом более 1000 характеристик...
    Извините за задержку...
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Сделал желаемую функцию. Выполнил большое количество изменений кода, нужно хорошо тестировать. Если есть желание - пожалуйста, пишите в Skype.
    Спасибо!
     
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей

     
  14. runyugin

    runyugin New Member Пользователи

    Регистрация:
    3 июл 2013
    Сообщения:
    9
    Отлично работает, спасибо, кучу времени теперь с экономим!
     
  15. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Спасибо и вам.
     
  16. spy007

    spy007 New Member Пользователи

    Регистрация:
    8 авг 2014
    Сообщения:
    1
    Отличный макрос, спасибо! А как спарсить в тот же файл еще и картинки товара с яндекс.маркета? Проблема в том, что характеристики находятся на другой вкладке - как для [DYNAMICVALUES] указать путь к этой вкладке?
     
  17. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Макрос GETMORECONTENT
     
  18. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей
     

Поделиться этой страницей