Парсинг HTML таблиц

Тема в разделе "Решение различных задач по парсингу", создана пользователем bamser, 8 ноя 2014.

  1. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте
    А чем не устраивает [DYNAMICVALUES]?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Там одна из таблиц состоит из трех рядов, нужно сделать функцию объединения рядов ячеек таблицы, думаю над этим вопросом.
     
  3. TomGood

    TomGood New Member Пользователи

    Регистрация:
    2 ноя 2015
    Сообщения:
    25
    [DYNAMICVALUES] не получается все таблицы
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Вроде все сделал, но по завершении возник один серьезный нюанс из-за специфики данного сайта. Объяснить могу только по телефону (расписывать долго). Если есть интерес, наберите по WhatsApp +7 983 381 3211 (Сергей).
     
  5. TomGood

    TomGood New Member Пользователи

    Регистрация:
    2 ноя 2015
    Сообщения:
    25
    Здравствуйте, спасибо. Наберу Вас обязательно
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Код:
    [HORIZTABLE][PREFIX][/PREFIX][MIN]2[/MIN][MERGETABLEROWS][APPLYTABLESPANS][FIX]<CD_GRAN_2!>[/APPLYTABLESPANS][/MERGETABLEROWS][/HORIZTABLE]
    1) Макрос [APPLYTABLESPANS] преобразует таблицы с объединенными ячейками в обычный вид
    2) Макрос [MERGETABLEROWS] преобразует HTML-таблицы, в которых больше двух строк в двухстрочные
    3) Макрос [HORIZTABLE] парсит горизонтальные HTML-таблицы в CSV

    В итоге получается такой результат:
    2017-01-29_14-07-10.png

    Единственный момент:
    2017-01-29_14-09-03.png

    Файл проекта и файл с результатом приложил к сообщению.

    С уважением к вам, Сергей...
     

    Вложения:

    Kreol нравится это.
  7. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Ну тут можно костыль поставить. Если таблица всегда такая, которая не берется. То можно было бы просто поиск/замену перед загрузкой страницы делать. Но это только если одинаковые таблицы
     
  8. Hostage

    Hostage Member Пользователи

    Регистрация:
    8 ноя 2016
    Сообщения:
    9
    Доброго времени суток, Уважаемые Форумчане.
    [DYNAMICVALUES], [HORIZTABLE] и [VERTTABLE] - это все очень хорошо и мне очень понравилось.
    Но вот вопрос.
    Подскажите пожалуйста, как привести выдаваемый результат парсинга HTML-таблицы к виду:
    Код:
    Характеристики|Параметр1|Значение_парам1
    Характеристики|Параметр2|Значение_парам2
    Характеристики|Параметр3|Значение_парам3
    Характеристики|Параметр4|Значение_парам4
    
    
    Изначально дана простая двухстрочная таблица:
    HTML:
    <table cellspacing="0" cellpadding="4" border="0" align="left">
        <tbody>
            <tr>
                <td class="headings" style="text-align: center;">Volt</td>
                <td class="headings" style="text-align: center;">Amp</td>
                <td class="headings" style="text-align: center;">Regulator</td>
                <td class="headings" style="text-align: center;">Engine</td>
                <td class="headings" style="text-align: center;">Plug</td>
            </tr>
            <tr>
                <td class="dimensions">12</td>
                <td class="dimensions">40</td>
                <td class="dimensions">Internal</td>
                <td class="dimensions">4D94E Diesel</td>
                <td class="dimensions">5</td>
            </tr>
        </tbody>
    </table>
    
    Вот ссылка на товар:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте!

    Ссылки недоступны для гостей

    2017-01-30_17-29-46.png
     

    Вложения:

    Hostage и Kreol нравится это.
  10. Hostage

    Hostage Member Пользователи

    Регистрация:
    8 ноя 2016
    Сообщения:
    9
    Спасибо большое за ответ. И как же я сразу не нашел это в помощи:rolleyes:
     

Поделиться этой страницей