Как удалить лишние параметры HTML-тегов

Тема в разделе "Решение различных задач по парсингу", создана пользователем SEOFEDOR, 28 ноя 2018.

  1. SEOFEDOR

    SEOFEDOR Member Пользователи

    Регистрация:
    1 ноя 2018
    Сообщения:
    30
    Всем добрый вечер друзья! Назвал очень громко тему, сразу скажу если есть вопросы от новичков где-то дайте ссылку, я туда буду писать. Сразу скажу я на 95% уверен, что я что-то не так делаю, сорян!
    К делу)
    После парсинга все файлы начинаются с "<h1> и заканчиваются </p>" как правильнее это убрать. Сейчас пользуюсь заменой в notepad++ :(

    Далее все <img src="image.jpg"> выглядят так <img src=""image.jpg""> тут тоже прошу помочь.
    Так же есть жуткие атрибуты в <img> типо :

    <img src=""image.jpg"" alt=""описание"" data-pagespeed-url-hash=""1997362455"" onload=""pagespeed.CriticalImages.checkImageForCriticality(this);""/>

    Вопрос такой, как убрать всё кроме alt

    С уважением к Вам!
     
  2. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Если, открыть редактор шаблона вывода (CTRL+2) с левой стороны имеется блок с макросами
    Где выбирая определенный макрос - внизу читаем описание его работы.
    + Ссылки недоступны для гостей

    [​IMG]
     
    SEOFEDOR нравится это.
  3. SEOFEDOR

    SEOFEDOR Member Пользователи

    Регистрация:
    1 ноя 2018
    Сообщения:
    30
    Спасибо добрый человек!
     
  4. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Для спасибо, есть кнопка - "Мне нравится"
     
    SEOFEDOR и Kreol нравится это.
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей
     
    SEOFEDOR и Kreol нравится это.
  6. SEOFEDOR

    SEOFEDOR Member Пользователи

    Регистрация:
    1 ноя 2018
    Сообщения:
    30
    Спасибо, думаю тема закрыта! ;)
     

Поделиться этой страницей