Вытянуть со строки только нужные значения 3 раза

Тема в разделе "Решение различных задач по парсингу", создана пользователем Дмитрий Буто, 15 сен 2015.

  1. Дмитрий Буто

    Дмитрий Буто New Member Пользователи

    Регистрация:
    3 янв 2014
    Сообщения:
    44
    Добрый день , хочу вытянуть нужные значения со строки типа:
    <dt>Размер:</dt> <dd>100x100x185</dd>
    Отдельно :80,
    отдельно : 80
    и отдельно :70,
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Как вариант пытаюсь вытянуть певрое значение так:
    Начало парсинга: Размер:</dt> <dd> конец парсинга x
    Второе значение уже может находится как между x[value]x так и x[value] , возможно нужен какой то макрос который бы убирал лишнее (что содержится до x и после x
    Третье значение даже не знаю как вытянуть. Уже все перечитал, не могу понять, то ли тоже нужен макрос который убрал бы все до символа x . Поделитесь кто-нибудь соображениями.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Задать одну границу парсинга, в которой начало будет - <dt>Размер:</dt> <dd>, конец - </dd>.

    Для этой границы парсинга применять поиск-замену:
    С уважением к вам, Сергей...
     
  3. Дмитрий Буто

    Дмитрий Буто New Member Пользователи

    Регистрация:
    3 янв 2014
    Сообщения:
    44
    Добрый день Сергей. Спасибо огромное работает, но почему то выбивает только значения которые находятся тут [REPLACE(x{get}x|{get})]<CD_GRAN_1!>[/REPLACE] , остальные нет. Приложил свой файл парсинга , колонки 21 и 22. Даже не знаю в чем тут дело может быть Посмотреть вложение душевые уголки mvl.by.cdp
     
  4. Дмитрий Буто

    Дмитрий Буто New Member Пользователи

    Регистрация:
    3 янв 2014
    Сообщения:
    44
    На основании примера попробовал много раз сделать , в итоге вроде получилось следующим образом
    Сделал 3 одинковые границы парсинга строки <dt>Размер:</dt> <dd>90x80x200</dd>
    От <dt>Размер:</dt> до /dd>
    Вроде вытянул когда есть все 3 значения. Уважаемый сергей не могли бы вы проверить правильно ли я ход мысли составил, либо тут есть ошибки.
    Когда 2 значения, то не берет к сожалению. Прикрепил файл парсинга сюда Посмотреть вложение душевые уголки mvl.by2.cdp
    P.S. чтобы окончательно закрепить материал, хочу спросить про макрос skip и get , к примеру мне надо вытянуть только одно значение (последнее) из 10*20*30 прописываю поиск замену [REPLACE({skip}*{skip}*{get}|{get})]<CD_GRAN_10!>[/REPLACE] Так?
     

Поделиться этой страницей