Как задавать повторяющиеся границы парсинга в определенной области кода WEB документа

Тема в разделе "Повторяющиеся границы парсинга", создана пользователем Dupe, 15 июл 2020.

  1. Dupe

    Dupe New Member Пользователи

    Регистрация:
    13 июл 2020
    Сообщения:
    6
    Здравствуйте ! Помогите, пожалуйста, решить проблему.
    Есть часть кода в которой находятся блоки с информацией,они динамические для каждой страницы они разные. Есть ли возможность скопировать спарсить данные блоки? Желательно как отображается в браузере текстом и можно ли сохранить такой же порядок как в коде? Хотел сделать через повторяющиеся границы, но такой вариант не подходит или я не разобрался. Заранее благодарю!
     

    Вложения:

  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Ответ на ваш вопрос и на почти все другие вопросы есть в системе помощи. Исходя из постановки вашего вопроса, ответ вот:
    Ссылки недоступны для гостей

    PS: Для начала, хотя бы, прочитайте заголовки материалов системы помощи с ее главной страницы Ссылки недоступны для гостей
     
  3. Dupe

    Dupe New Member Пользователи

    Регистрация:
    13 июл 2020
    Сообщения:
    6
    Спасибо за ответ, но я уже пробовал так делать.
    Проблема в том что div class в данном коде разные, они могут начинаться как div class="note-time-label__wrapper js-notes-timeline-point", div class="feed-note-wrapper feed-note-wrapper-note " и тд, и далее продолжаются в независимом порядке, на пример на скринах 1.1 и 1.2.
    Еще сколько будет таких частей на странице не известно, может быть и 3 может и 100. Я хочу собрать все классы в том же порядке в котором они отображаются на странице, без лишнего кода, оставив только текстовую информацию.
    Пробовал сделать <div class=" [AUTO]div, но так не получается прикрепляю скрин.
     

    Вложения:

  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Предоставьте файл проекта.

    Главное меню - файл - сохранить проект.
     
  5. Dupe

    Dupe New Member Пользователи

    Регистрация:
    13 июл 2020
    Сообщения:
    6
    Пожалуйста
     

    Вложения:

  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Не могу помочь, требуется авторизация. Данные для авторизации вы не предоставили.
     
  7. Dupe

    Dupe New Member Пользователи

    Регистрация:
    13 июл 2020
    Сообщения:
    6
     

    Вложения:

    • Куки.txt
      Размер файла:
      878 байт
      Просмотров:
      3
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
  9. Dupe

    Dupe New Member Пользователи

    Регистрация:
    13 июл 2020
    Сообщения:
    6
    Спасибо за ответ! Возник такой вопрос как тогда можно вытащить из div class="notes-wrapper__notes js-notes" , вложенные дивы?
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Как и сказано изначально. Нужно ограничить область поиска циклов повторяющихся границ этим родительским Div. Тогда из него очень просто извлекаются все вложенные Div.
     
  11. Dupe

    Dupe New Member Пользователи

    Регистрация:
    13 июл 2020
    Сообщения:
    6
    Понял, спасибо! Остался такой вопрос как оставить только текст, убрав весь мусор кода?
     

    Вложения:

  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Код:
    {skip}>|
    <{skip}>|
    {htmldecode}
    Ссылки недоступны для гостей
     
Similar Threads
  1. rezhisser
    Ответов:
    3
    Просмотров:
    714
  2. Ripper
    Ответов:
    6
    Просмотров:
    1.918
  3. dmitriydenisov
    Ответов:
    1
    Просмотров:
    428
  4. Rod
    Ответов:
    2
    Просмотров:
    227
  5. Constantine
    Ответов:
    10
    Просмотров:
    656
Загрузка...

Поделиться этой страницей