Парсинг контента на двух языках

Тема в разделе "Решение различных задач по парсингу", создана пользователем vladimirboyko, 25 май 2020.

  1. vladimirboyko

    vladimirboyko New Member Пользователи

    Регистрация:
    22 окт 2018
    Сообщения:
    18
    Здравствуйте. Есть сайт с двумя языковыми версиями. Каждая версия языка имеет другой адресс, то есть отдельную страницу. Стоит задача парсить контент на двух языках. Я пробовал сделать клик в webapp на переключатель смены языка статьи но html код при взятии границы все равно только на одном языке.

    Сразу скажу что вариант парсить по отдельности не подходит. Ибо ключевого поля для объединения контента нету то есть это просто контент на разных языках без id и sku. По этому задача объединить не подходит ибо связи нет, по этому при парсинге генерирую id.

    Должно быть так:
    Заголовок русский и рядом новый столбец заголовок англ. и тоже самое с остальным контентом.

    Буду благодарен за подсказки и помощь и возможно ли вообще это как то реализовать
     
  2. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    868
    Как вариант, в коде парсить ссылку на страницу с другим языком и через GETMORE забирать
     
  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    В странице есть ид в большинстве случаев. Ссылку на сайт покажите или вам достаточно абстрактных советов?
     
  4. vladimirboyko

    vladimirboyko New Member Пользователи

    Регистрация:
    22 окт 2018
    Сообщения:
    18
    Я искал но не нашел, здесь сайт работает на старенькой Joomla и id судя по всему скрыли как то
     
  5. vladimirboyko

    vladimirboyko New Member Пользователи

    Регистрация:
    22 окт 2018
    Сообщения:
    18
    В любом случае переводы связаны между собой не по id а по ключевому полю которое в html не доступно а мне как раз и нужно их как то связать между собой
     
  6. vladimirboyko

    vladimirboyko New Member Пользователи

    Регистрация:
    22 окт 2018
    Сообщения:
    18
    Этот вариант мне подошел, благодарю)
    Правда гемор что для каждого поля нужно заново вставлять GETMORE
     

Поделиться этой страницей