парсинг Таблицы википедия

Тема в разделе "Парсинг HTML-таблиц", создана пользователем maxiz, 20 июл 2020.

  1. maxiz

    maxiz New Member Пользователи

    Регистрация:
    18 май 2017
    Сообщения:
    17
    Добрый день,

    подскажите как правильно парсить таблицу с страницы википедия

    например Ссылки недоступны для гостей

    или Ссылки недоступны для гостей


    upload_2020-7-20_11-54-18.png


    проблема заключается в том что разные города\села имеют разную информацию, некоторые больше, некоторые меньше.

    Я попробовал все засунуть в повторяющую границу с <tbody> до </tbody>

    и после использовать в шаблоне вывода повторяющихся границ задать границы каждому полю [GRAN1] [GRAN2]

    использовал инструкцию с Ссылки недоступны для гостей

    но тк таблицы немного разные (гдето больше данных, где то меньше) не получается.

    возможно есть более эфективный метод спарсить?
     
    Последнее редактирование: 20 июл 2020
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Парсить таблицу - понятие не определенное.

    Прикрепите нужный пример формата данных на примере распарсивания одной из таблиц.
     

Поделиться этой страницей