Нетривиальная задача по парсингу и переводу

Тема в разделе "Решение различных задач по парсингу", создана пользователем filisonov, 23 окт 2018.

  1. filisonov

    filisonov New Member Пользователи

    Регистрация:
    16 сен 2018
    Сообщения:
    7
    Пример есть сайт там следующий код:
    <div>
    <p>тут текст на английском</p>
    <span>тут текст на русском<span>
    <p>тут текст на английском</p>
    </div>
    Вот мне необходимо перевести все что в тегах <p>, и не трогать тег <span> от слова совсем, даже не проганять его через транслит.
    Таких страниц около 20к , и тег <span> может быть расположен немного подругому. Можно ли реализовать задуманное.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Каким образом производите перевод текста?
     
  3. filisonov

    filisonov New Member Пользователи

    Регистрация:
    16 сен 2018
    Сообщения:
    7
    Стандартными методами:
    Код:
    <PHP_SCRIPT=https://translate.yandex.net/api/v1.5/tr.json/translate?key=<FILE=C:\6666666666666[UTF-8]>text=<CD_GRAN_2!></PHP_SCRIPT>
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Если абзацев на каждой WEB-странице не много, просто добавить поиск-заменой макрос перевода только для абзацев p:
    Код:
    <p>{skip}</p>|<p><PHP_SCRIPT...{skip}...</PHP_SCRIPT></p>
     

Поделиться этой страницей