Повторяющиеся границы (параметр инверсия)

Тема в разделе "Границы парсинга", создана пользователем sergo-8ck, 14 фев 2015.

  1. sergo-8ck

    sergo-8ck New Member Пользователи

    Регистрация:
    25 янв 2015
    Сообщения:
    38
    Город:
    Чебоксары
    Здравствуйте! Есть ли возможность указать параметр инверсия для повторяющихся границ?
     
    ITz и Vsevlod нравится это.
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Пока нет. Мы учли ваше пожелание.

    Спасибо!
     
  3. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Плюсую. Есть повторка и с левого края к ней никак не подцепиться, а вот справа есть уникальный текст. Будет ли инверсия в повторяющихся границах?
     
    Vsevlod нравится это.
  4. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Есть пример, что и куда инвертировать?
    И зачем это надо?
    Может проще сменить логику обработки данных?
     
  5. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Есть обычная граница с куском ява кода. В этом коде есть повторки типа:
    Код:
    \/a6ad549ed0be3ccdfe8fe91639c63cf1.jpg","color_label":"bronz","main_color"
    Где "main_color" - это уникальное вхождение, а "\/" - не уникальное. И вот если развернуть поиск как в обычных граница, то все работает как надо.
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Дак а что взять требуется,
    bronz?
     
  7. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    a6ad549ed0be3ccdfe8fe91639c63cf1.jpg","color_label":"bronz". Соответственно "\/" и ","main_color"" - это границы. В качестве начальной границы подходит только ","main_color"".
     
  8. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Вы пишите
    теперь
    "\/" - первый раз не уникально, второй раз стало границей

    можно же взять через границы
    начало \/{skip}.jpg
    конец "main_color"
     
  9. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Спасибо за помощь! Я поиском/заменой уже все, что нужно вытащил. Что печально - вытащил не то. Какой-то совершенно извращенский сайт попался.
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Код:
    "main_color"{skip}\/|"main_color"{skip}\/[REV]
    2018-12-18_03-28-49.png
     
    Serheo нравится это.
  11. ITz

    ITz Member Пользователи

    Регистрация:
    31 янв 2020
    Сообщения:
    43
    Город:
    Third Rome
    очень очень нужны рабочие двойные и тройные skip'ы и инверсия в повторяющихся границах, а также дополнительный более гибкий синтаксис для отлова нужных вхождений, также не помешала бы возможность гибкого разбиения на столбцы полученных данных из повторяющейся границы и доп. параметр для автоматического удаления не нужных столбцов в csv файле в итоговом документе.
     
  12. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    skip'ы можно навтыкать последовательно столько, сколько нужно. А как обойти отсутствие инверсии объяснено постом выше. Функционала про столбцы более чем исчерпывающий. Если не хватает операторов поиска/замен, можно использовать регулярные выражения. Для начала настоятельно рекомендуется подробно изучить "Систему помощи".
     
    Achronis нравится это.
  13. ITz

    ITz Member Пользователи

    Регистрация:
    31 янв 2020
    Сообщения:
    43
    Город:
    Third Rome
    skip'ы можно навтыкать последовательно столько, сколько нужно. - у меня в повторяющихся границах 3 и более skip'a не работает, прога виснет, возможно это связано со специфичной склейкой web страниц полученных макросом GETHTML из webapp, версия CD предпоследняя, а обходить инверсию как указано выше это лепить огород с доп. "виртуальными" границами, у меня там своего огорода хватает
     
  14. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Приложите файл проекта и напишите, что нажимать, чтобы вызвать описанное зависание.

    Также попробуйте пояснить задачу подробно, вы просто не используете нужный функционал.
     
  15. ITz

    ITz Member Пользователи

    Регистрация:
    31 янв 2020
    Сообщения:
    43
    Город:
    Third Rome
    вопрос решен, видео помогло понять правильную работу оператора skip

     
    Achronis и Root нравится это.

Поделиться этой страницей