чувствительность к регистру в обычных границах парсинга

Тема в разделе "Решение различных задач по парсингу", создана пользователем rodyeug, 2 янв 2014.

  1. rodyeug

    rodyeug New Member Пользователи

    Регистрация:
    31 дек 2013
    Сообщения:
    19
    хай пипл,

    в границе парсинга регистр не постоянен, и ловить приходится <p> на одной странице, а на другой он может быть <P>

    самый простой способ обойти это не прибегая к динамическим границам с regexp'ами имеется ?

    спасибо
     
  2. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    1. вы сами указали инструмент, идеально подходящий для решения задачи. вариант 1 - динамические границы. думаю, лучший.

    2. задать 2 варианта обычной границы, и объединить их через IFNIL. Теоретически, этот способ может привести к ошибкам, хотя вероятность мизерная.

    3. Если речь идет о конкретном элементе кода - скажем, о тегах <p>, можно через окошко поиска-замены основного кода заменить все вхождения этого тега на вариант с нижним регистром. это либо 2 обычных замены, либо одна через регулярку.
     
  3. rodyeug

    rodyeug New Member Пользователи

    Регистрация:
    31 дек 2013
    Сообщения:
    19
    о, понял

    спасибо!
     

Поделиться этой страницей