Выделение нужного фрагмента текста из границы парсинга (номер)

Тема в разделе "Обработка данных при парсинге во вкладке "Контент"", создана пользователем infernalrain, 24 мар 2017.

  1. infernalrain

    infernalrain New Member Пользователи

    Регистрация:
    5 янв 2016
    Сообщения:
    21
    Здравствуйте.
    Есть граница парсинга, которая берет заголовок <H1> со страницы.
    Каждый такой заголовок содержит определенное название и порядковый номер. Номер всегда начинается с символа "№". Значение (цифры) могут быть написаны от символа как через один пробел, так и слитно. Номер может находиться в середине заголовка, в конце заголовка, вовсе отсутсвовать.

    Например:
    Вертикальная планка №125 железная
    Горизонтальная планка большая № 140
    Планка маленькая № 25 горизонтальная
    Отвес вертикальный №1010

    Мне необходимо получить из таких заголовков номер.
    Подскажите пожалуйста, как это можно реализовать?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Ссылки недоступны для гостей

    Код:
    {get}|{get} 
    № |№
    №{get} |№{get}
    2017-03-24_13-52-10.png

    С уважением к вам, Сергей...
     
  3. infernalrain

    infernalrain New Member Пользователи

    Регистрация:
    5 янв 2016
    Сообщения:
    21
    Спасибо большое.
    Но я столкнулся еще с одной проблемой. Иногда в заголовке присутствует другой символ "#". Т.е.
    Вертикальная планка №125 железная
    Горизонтальная планка большая # 140

    Можно ли задавать несколько условий поиска?
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.

    Считаю, что нужно просто подумать. Я вам очень подробные пояснения дал, чтобы было понимание...

    Код:
    {get}|{get} 
    #|№
    № |№
    №{get} |№{get}
     

Поделиться этой страницей