Парсить HTML текст на немецком, где есть умляуты

Shlika · 31 май 2021

Доброго времени суток!

помогите решить проблему. Никак не могу спарсить текст на немецком...дело в том, что он разделяется по строчкам так как в HTML тексте присутствует умляуты (ä ü ö ß). И в тексте они выглядят следующим образом: "auml;" - ä. И поскольку присутствует ";", то текст разделяется на строчки...

Как быть?

kagorec · 1 июн 2021

В глобальную поиск-замена добавьте построчно замены:
Код:
auml;|ä
и т.д.

Shlika · 1 июн 2021

kagorec сказал(а): ↑
В глобальную поиск-замена добавьте построчно замены:
Код:
auml;|ä
и т.д.
Нажмите, чтобы раскрыть...
Благодарю! Этот способ я использовал (работает на "отлично"). Но если в коде есть другие значения, которые заканчиваются на ";", то в этом случае происходит разделение на ячейки. Получается, теперь каждый раз нужно прописывать в "поиск-замена" коды? Или же есть какой то другой способ?

kagorec · 1 июн 2021

Вероятно поможет:
Дополнительные функции обработки контента > Другое > заменять HTML мнемоники на их символы
или
В поиск-замена для границы добавьте {htmldecode}

Войти или зарегистрироваться

Парсить HTML текст на немецком, где есть умляуты

Shlika New Member Пользователи

kagorec Администратор Команда форума Администратор

Shlika New Member Пользователи

kagorec Администратор Команда форума Администратор

Как найти страницы на которых есть определённый текст?

Текст в виде HTML-символа

Есть ли макрос преобразования html кодов: ’   и т. д.

Как найти страницы на которых есть текст именно в заданном вхождение

Как раскодировать HTML мнемоники (символы)

Поделиться этой страницей

Войти или зарегистрироваться

Парсить HTML текст на немецком, где есть умляуты

Shlika New Member Пользователи

kagorec Администратор Команда форума Администратор

Shlika New Member Пользователи

kagorec Администратор Команда форума Администратор

Как найти страницы на которых есть определённый текст?

Текст в виде HTML-символа

Есть ли макрос преобразования html кодов: &rsquo; &nbsp; и т. д.

Как найти страницы на которых есть текст именно в заданном вхождение

Как раскодировать HTML мнемоники (символы)

Поделиться этой страницей

Быстрый поиск

Есть ли макрос преобразования html кодов: ’ и т. д.