Картинки (тэг <img>), как удалить ненужные параметры?

Тема в разделе "Обработка данных при парсинге во вкладке "Контент"", создана пользователем invisible, 12 мар 2017.

  1. invisible

    invisible New Member Пользователи

    Регистрация:
    30 июл 2012
    Сообщения:
    28
    Нужна помощь в чистке контента

    Как в тексте для всех картинок удалить лишние параметры, оставив только src и если можно alt (необязательно)

    Порядок параметров у каждой картинки разный, как и список параметров...

    Пример:
    было
    <img title="описание" alt="описание" src="im/pic.jpg" width="225" height="300" data-src="ipic.jpg" />

    стало
    <img src="im/pic.jpg" />
     
  2. drvoodoo

    drvoodoo Active Member Пользователи

    Регистрация:
    30 дек 2016
    Сообщения:
    69
    Используйте "Дополнительные настройки границ парсинга"
    Попробуйте так.
    <img{skip}src="|<img src="
    " width{skip}/>|" />
    Должно помочь.
     
    invisible нравится это.
  3. napserious

    napserious Well-Known Member Пользователи Активирован

    Регистрация:
    16 окт 2015
    Сообщения:
    324
    <img{skip}src="{get}"{skip}>|<img src="{get}"/>
    или так
    src="{get}"|<img src="{get}"/>
     
    Последнее редактирование: 12 мар 2017
  4. napserious

    napserious Well-Known Member Пользователи Активирован

    Регистрация:
    16 окт 2015
    Сообщения:
    324
    А если нужен и alt, то вот так:
    alt="{skip}"|
    src="{get}"|<img src="{get}" alt="{prevskip}"/>

    До:

    <img border="1" alt="Click to learn about Aquarium Plants" width="125" src="images/fish-and-aquaria.jpg" height="85" />
    После:
    <img src="images/fish-and-aquaria.jpg" alt="Click to learn about Aquarium Plants"/>
     
    invisible нравится это.
  5. invisible

    invisible New Member Пользователи

    Регистрация:
    30 июл 2012
    Сообщения:
    28
    Спасибо за ответы, но для <CD_AUTO!>
    [REPLACE(src="{get}"|<img src="{get}"/>)]<CD_AUTO!>[/REPLACE]
    не подходи.
    т.е. вырезает весь текст...

    Как бы сделать, сохраняя текст?
     
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Можно попробовать регулярными выражениями.
    Код:
    re:<img([^<>]*)alt="([^<>"]*)"([^<>]*)>|<img$1$3alt="$2"/>
    re:<img[^<>]+src="([^<>"]*)"[^<>]*alt="([^<>"]*)"/>|<img src="$1" alt="$2"/>
    первое рег. выражение альт отодвигает в конец тега, а второе рег. выражение на основе стандарта уже коректно делает выборку двух значений
     
    invisible нравится это.
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    kagorec и invisible нравится это.

Поделиться этой страницей