Можно ли вырезать скрипты автоматом при парсинге?

Тема в разделе "Обработка данных при парсинге во вкладке "Контент"", создана пользователем mikle771, 14 фев 2019.

  1. mikle771

    mikle771 New Member Пользователи

    Регистрация:
    14 фев 2019
    Сообщения:
    25
    Город:
    Москва
    аналиткс, адсенс, метрика и т.д. Либо выборочно либо вообще все скрипты. Есть такая возможность?
     
  2. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    10.232
    Город:
    Сочи
  3. mikle771

    mikle771 New Member Пользователи

    Регистрация:
    14 фев 2019
    Сообщения:
    25
    Город:
    Москва

    Мда в итак максимально навороченном и сложном парсере сделать удаление сриптов по поиск замене, при учете того, что один и тот же скрипт на каждой странице может немного отличаться, что потребует использование макросов я так понимаю. Походу у такого чайника как я вообще нет шансов разобраться, а вопросов еще непочатый край.
    Неужели никому кроме меня не нужна функция "удалить все скрипты", ведь парсится контент а не скрипты, зачем кому то код скриптов?
     
  4. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    10.232
    Город:
    Сочи
    У вас будет больше шансов разобраться, если вы хотя бы будете пробовать предоставленные решения. Не просто так же вам тут пишут ответы.

    Если у вас какие-то проблемы с предоставленным решением, вместо высказывания недовольства, лучше предоставьте примеры скриптов, которые данная функция не удаляет.
     
    Последнее редактирование: 15 фев 2019
    kagorec нравится это.
  5. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    431
    Ну так и парсите код контента
    Причем тут скрипты
     
  6. mikle771

    mikle771 New Member Пользователи

    Регистрация:
    14 фев 2019
    Сообщения:
    25
    Город:
    Москва
    Ввожу <script{skip}</script>| в поиск-замену, жму готово, потом включаю парсинг, правильно?
    Ничего не удаляет, все как и было.
    Скрипты гугл адсенса например.

    Скрипты находятся в самом контенте.
     
  7. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    10.232
    Город:
    Сочи
    Я имел ввиду пример кода скрипта.
     
  8. mikle771

    mikle771 New Member Пользователи

    Регистрация:
    14 фев 2019
    Сообщения:
    25
    Город:
    Москва
    Хотя получается сам скрипт он все таки вырезал.
    А вот это осталось:

    <ins class="adsbygoogle"
    style="display:block; text-align:center;"
    data-ad-layout="in-article"
    data-ad-format="fluid"
    data-ad-client="ca-pub-0759996185094685"
    data-ad-slot="4964227973"></ins>

    И еще сразу вопрос - как лучше заменой (или есть другие варианты) удалять урл донора если он присутствует в нужном контенте?
    Менять site.ru на / ?
     
  9. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    10.232
    Город:
    Сочи
    <ins {skip}</ins>|
     
    mikle771 нравится это.

Поделиться этой страницей