Поиск границ: Как заменить последовательность символов

Тема в разделе "Решение различных задач по парсингу", создана пользователем VitalyTR, 27 июн 2018.

  1. VitalyTR

    VitalyTR Member Пользователи

    Регистрация:
    18 июн 2018
    Сообщения:
    29
    Город:
    Минск
    Задача в следующем - парсинг контента, по границам html-кода. Но там сайт генерирует случайные данные, например (это реальный пример одной из границ):
    <img class="third-party-tracking-pixel hidden ember-view" id="ember946" src="Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! ">

    id="ember946" является переменным значением.
    Так бы я мог выставить поиск границы на весь тэг, а вынужден делать так, что часть тэга (id="ember946" src="Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! ">) попадает в итоговое значение.

    Коллеги, подскажите, плз. В самом начале знакомства с системой я натыкался на это описание, а вот как понадобилось - не могу найти!
     
  2. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    340
    Добрый день.

    Вы можете использовать функцию поиск-замены исходного кода (ctrl+shift+r).
    Что-то вроде:
    Код:
    ember-view" id="ember{skip}"|ember-view" id="ember"
    И затем задавать границу уже без этого номера.

    Либо использовать {skip} непосредственно при задании границы.
    Код:
    ember-view" id="ember{skip}"src="
     
    VitalyTR нравится это.
  3. VitalyTR

    VitalyTR Member Пользователи

    Регистрация:
    18 июн 2018
    Сообщения:
    29
    Город:
    Минск
    Спасибо! Именно skip и искал
     
  4. VitalyTR

    VitalyTR Member Пользователи

    Регистрация:
    18 июн 2018
    Сообщения:
    29
    Город:
    Минск
    Кстати, долго помучавшись, все же результат был достигнут с помощью поиска-замены исходного кода (ctrl+shift+r).
    Не знаю, почему, но в задании повтоярющихся границ skip вел себя не так, как ожидалось.
     

Поделиться этой страницей