Не хватает повторяющих границ

Тема в разделе "Решение различных задач по парсингу", создана пользователем ap2205, 21 мар 2019.

  1. ap2205

    ap2205 Member Пользователи

    Регистрация:
    30 мар 2018
    Сообщения:
    88
    Город:
    Москва
    Здравствуйте. Подскажите, пожалуйста, какие еще методы есть, если не хватает повторяющих границ?
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 5 постов.**
    Рассматривал вариант с повторяющими границами внутри повторяющих.
    Необходимо создать в csv несколько строк одного товара с изменением цвета, соответственно это тянет за собой остальные поля которые будут изменяться. А именно Имя (необходимо получить в ячейке Имя+цвет), артикул+цвет (нужны разные артикулы), цвет, id-товара, наличие (какой-то цвет есть, какого-то нет), главная картинка, характеристика. Возможно еще что-то понадобится, но уже повторяющих границ не хватит, так как все данные находятся в разных блоках.
     
  2. cherkas

    cherkas Member Пользователи

    Регистрация:
    20 авг 2013
    Сообщения:
    54
    Адрес:
    Украина
    я выхожу из ситуации парся несколько раз с разными настройками, а потом объединяю спарсенное в excel
    в первом столбце вывожу <CD_DOCURL!>, после парсинга делаю сортировку по этому столбцу во всех спарсенных частях
    потом формулой проверяю что бы url построчно совпадало, или как вариант использую функцию ВПР

    а объединять приходиться часто, я в основном парсю магазины и скажем при парсинге фото, у разных товаров разное количество фото, сколько максимум не известно, так же и с характеристиками товаров, по этому парсю в несколько этапов, объеденить проблем нет.
     
    xLime нравится это.
  3. ap2205

    ap2205 Member Пользователи

    Регистрация:
    30 мар 2018
    Сообщения:
    88
    Город:
    Москва
    Cherkas, спасибо за совет... Я рассматривал такой вариант. Но перед тем, как спросить, искал на форуме, кто как выходит из ситуации, когда не хватает повторяющих границ. В ответах неоднократно видел, что, как правило достаточно 1 или 2 повторяющих границ для проекта... Как это применить в данном случае? Именно это и подкупает, хочется сделать проект из одного файла и делать потом, как можно меньше доработок в редакторах.
     
  4. aresa

    aresa Well-Known Member Пользователи

    Регистрация:
    17 окт 2015
    Сообщения:
    180
    Добрый день!
    Также подтверждаю, что по вашему описанию достаточно будет одной- двух повторяющихся границ. Все сайты, которые мне встречались, в которых от цвета, размера или ещё чего-то менялись другие параметры например цена, удавалось обойтись 1-2 границами.
    К сожалению сейчас не могу посмотреть код по вашей ссылке, но как правило в коде всегда присутствуют блоками например перечислены цвета, а рядом другие параметры зависящие от цвета и т. д.
    И, соответственно надо настроить обычные границы внутри повторявшихся и в качестве разделителя повторяющихся строк использовать перенос строк
    [CSVLB]

    Ссылки недоступны для гостей
     
    Последнее редактирование: 21 мар 2019
  5. ap2205

    ap2205 Member Пользователи

    Регистрация:
    30 мар 2018
    Сообщения:
    88
    Город:
    Москва
    Спасибо. Думаю это то, что надо...
     
    aresa нравится это.
  6. Ametist_A

    Ametist_A New Member Пользователи

    Регистрация:
    13 июн 2020
    Сообщения:
    10
    Я внимательно посмотрела видео по ссылке, но не смогла для своего проекта придумать, как решить вопрос с нехваткой повторяющихся границ.
    Проект имеет Повторяющиеся границы 1 - это общий код, включающий в себя еще три повторяющиеся границы

    То есть: у меня уже занято 4 повторяющихся границы (общий код, цены, характеристики, картинки).
    Ссылки недоступны для гостей
    Но у меня есть еще блоки повторяющихся границ - это виды цветов товара (4 варианта), в которых есть повторяющиеся title и повторяющиеся границы изображений (для каждого тайтла своя картинка)
    Ссылки недоступны для гостей

    В итоге всего проекта должно получиться
    Повторяющиеся границы 1 , в которых выводятся Повторяющая граница 2 цена, Повторяющаяся граница 3 характеристики, Повторяющаяся граница 4 изображения. (каждому значению соответствует своя ячейка в столбце).

    Для Повторяющейся границы 5 я задаю: Границы парсинга 3 и Границы парсинга 4
    Ссылки недоступны для гостей
    В шаблоне они разместились на последней 4 строке (так как у меня 4 варианта товара), но мне нужно, чтобы они начали размещаться с первой строки и соответствовать цене, характеристикам и т.д.
    А у меня они съехали в начало таблицы Ссылки недоступны для гостей
    Ссылки недоступны для гостей

    Хотя, если бы было еще несколько повторяющихся границ, то мне бы получилось все вместить.:oops:

    Как мне поднять на первую строку, чтобы значения тайтл\картинка заняли с 1 по 4 строку?

    Сам товар: Ссылки недоступны для гостей

    Я не понимаю, как мне это сделать для границ парсинга. Подскажите, пожалуйста.
     

    Вложения:

  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Сейчас могу предложить только платное решение задачи (1-2 т.р.). Так как для меня эта задача не совсем стандартная и нужно придумывать решение, возможно, функцию.

    Если устраивает, приложите URL товара и пример CSV на основе одного товара. Чтобы было однозначно понятно, какой CSV в результате нужно получить.
     
    Ametist_A нравится это.
  8. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    501
    если не хватает границ, можно сделать несколько проектов , потом в csv редакторе склеить данные в csv файл , я так делал
     
    Ametist_A нравится это.
  9. Ametist_A

    Ametist_A New Member Пользователи

    Регистрация:
    13 июн 2020
    Сообщения:
    10
    Я в менеджере заказов оформила заказ, или нужно было прямо сюда?
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Спасибо, человек с вами свяжется в ближайшее время.
     

Поделиться этой страницей