парсинг характеристик нужна помощь

Тема в разделе "Решение различных задач по парсингу", создана пользователем rumit1990, 25 апр 2017.

  1. rumit1990

    rumit1990 New Member Пользователи

    Регистрация:
    25 мар 2017
    Сообщения:
    4
    Подскажите пожалуйста как спарсить характеристики товара когда атрибуты имеют изменяющуюся структуру: что я имею ввиду

    <table cellspacing="0" cellpadding="0" width="100%" class="_properties" id="chars"><tr><td class="cart-prop"><div><span>Страна бренда</span><span class="text_tip" id="3740">(?)</span><span class="none_v" id="t3740">Страна регистрации торговой марки.</span></div></td>
    <td class = "_value cat-">
    Австрия</td></tr><tr><td class="cart-prop"><div><span>Производитель</span><span class="text_tip" id="3475">(?)</span><span class="none_v" id="t3475">Страна конечной сборки оборудования.</span></div></td>

    имеем атрибуты Страна бренда и имеем значение австрия, между ними и последующими характеристиками есть номер атрибуты 3740, какой макрос вставить чтобы он не учитывал выделенный участок?
     
  2. Diabet

    Diabet Member Пользователи

    Регистрация:
    12 фев 2012
    Сообщения:
    114
    если я правильно понял то <span class="{skip}" id="{skip}">|
     
  3. rumit1990

    rumit1990 New Member Пользователи

    Регистрация:
    25 мар 2017
    Сообщения:
    4
    да почти правильно: только на сайте донора еще после id идет уточнение на выделенном видно это страна срегистрации торговой марки: надо чтобы тоже скиполось

    <span class="text_tip" id="3740">(?)</span><span class="none_v" id="t3740">Страна регистрации торговой марки.</span></div></td>
    <td class = "_value cat-">

    там у каждой характеристики еще в коде уточнение прописано: и требуется чтобы оно тоже не учитывалось
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Приведите ссылку
    приведите пример как в итоге должно выглядеть.
     
  5. Zuev85

    Zuev85 New Member Пользователи

    Регистрация:
    21 мар 2018
    Сообщения:
    11
    Город:
    Dnipro
    Доброго дня!
    Подскажите, пожалуйста, как сделать так:
    Донор: Ссылки недоступны для гостей
    Вопрос, чтобы связать характеристики друг с другом. Каким макросом?
    Спасибо.
     

    Вложения:

  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Ссылки недоступны для гостей - Создание комбинаций из значений циклов выбранных повторяющихся границ парсинга
     
    Zuev85 и Root нравится это.
  7. Zuev85

    Zuev85 New Member Пользователи

    Регистрация:
    21 мар 2018
    Сообщения:
    11
    Город:
    Dnipro
    Огромная Благодарность!
    А как быть если значения и имена разных характеристик находятся в одинаковых тегах и на каждой странице неизвестное количество характеристик?
    Вот до чего получилось дойти. Но как их скомбинировать?
    На всякий случай, файл cdp.
    Предпологаю, может сначала границы парсинга обозначить по разному? А потом уже парсить
    Спасибо.
     

    Вложения:

    Последнее редактирование: 4 янв 2019
  8. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Почитайте всетаки как использовать [COMBO] в повторяющихся границах, заметил в примере вашем реализовано неправильно в данном случае через вложенные повт.границы
    Вот как делается комбинированный список, в SOURCE указана простая граница которая ограничивает область работы повт.границы

    [​IMG]
     
    Zuev85 и Root нравится это.
  9. Zuev85

    Zuev85 New Member Пользователи

    Регистрация:
    21 мар 2018
    Сообщения:
    11
    Город:
    Dnipro
    Хорошо. Как быть с неограниченным количеством повторяющихся?
    Как я могу обозначить обычными границами, если их будет больше?
    Кстати возникла ошибка, если на странице нет комбинирующих характеристик, то шаблон ничего не выводит.. Как я могу это исправить?
    Спасибо большое за помощь.
     

    Вложения:

  10. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Пропарсить сначала сайт и собрать все встречающиеся названия вариантов и далее анализировать чтоб некоторые названия привести к общему названию и далее через глобальную поиск-замена сменить названия для блоков вариантов.
     
    Zuev85 нравится это.
  11. Zuev85

    Zuev85 New Member Пользователи

    Регистрация:
    21 мар 2018
    Сообщения:
    11
    Город:
    Dnipro
    А как осуществить поиск определенного тега по всем ссылкам и вывести его количество?
    В checkentry или другом макросе, есть обозначение всего html документа?
     
    Последнее редактирование: 4 янв 2019
  12. Zuev85

    Zuev85 New Member Пользователи

    Регистрация:
    21 мар 2018
    Сообщения:
    11
    Город:
    Dnipro
    Огромное благодарю. Разобрался.
     
  13. Zuev85

    Zuev85 New Member Пользователи

    Регистрация:
    21 мар 2018
    Сообщения:
    11
    Город:
    Dnipro
    Доброго дня.
    Подскажите, пожалуйста, как исключить не нужные характеристики при парсинге при комбинировании других характеристик? Каким макросом.

    Спасибо.
     

    Вложения:

    Последнее редактирование: 5 янв 2019
  14. Zuev85

    Zuev85 New Member Пользователи

    Регистрация:
    21 мар 2018
    Сообщения:
    11
    Город:
    Dnipro
    РЕАЛИЗОВАНО!
     

    Вложения:

    Kreol и kagorec нравится это.

Поделиться этой страницей