Помогите вывести данные красивой табличкой

Тема в разделе "Границы парсинга", создана пользователем Бука, 22 янв 2014.

  1. Бука

    Бука New Member Пользователи

    Регистрация:
    22 янв 2014
    Сообщения:
    36
    Доброго времени суток!
    Я собираю данные с интернет магазина, мне нужно спарсить несколько товаров с одной страницы. Если бить точным мне нужны характеристики. Я использую макрос GETMORECYCLECONTENT и сохраняю в файл .csv Но есть одна проблема, не всегда у товаров есть все характеристики и поэтому съезжают колонки.
    Чтобы было проще наведу пример:

    <h2>Название товара1</h2>
    <table>
    .... всякие табличные теги
    <td>
    Характеристика1:<strong>значение</strong>
    Характеристика2:<strong>значение</strong>
    Характеристика3:<strong>значение</strong>
    Характеристика4:<strong>значение</strong>
    Характеристика5:<strong>значение</strong>
    </td>
    </table>

    <h2>Название товара2</h2>
    <table>
    .... всякие табличные теги
    <td>
    Характеристика1:<strong>значение</strong>
    Характеристика5:<strong>значение</strong>
    Характеристика6:<strong>значение</strong>
    Характеристика7:<strong>значение</strong>
    ....
    </td>
    </table>
    В итоге csv-шник выглядит примерно так

    |Название товара1 | характеристика1 | характеристика2 | характеристика3 | характеристика4 | характеристика5 |
    |Название товара2 | характеристика1 | характеристика5 | характеристика6 | характеристика7 |

    Вопрос: как мне сделать чтобы характеристики добавлялись в соотв. столбцы? Тоесть если нет такой характеристики чтобы столбец пропускался?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Думаю, только так Ссылки недоступны для гостей
     
  3. eleon

    eleon New Member Пользователи

    Регистрация:
    18 фев 2012
    Сообщения:
    37
    есть вопрос по парсингу границ
    название;картинка;цена;описание;коментарий1;коментарий;коментарий;

    коментарии парсятся как повторяющ граница.

    как указать чтоб парсило не более 5 комментов
    и как указать что если нет комента то ячейку писало всетаки
    пример

    название;картинка;цена;описание;коментарий1;коментарий;коментарий;
    название;картинка;цена;описание;коментарий1;;;
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    У повторяющихся границ есть лимит на количесто циклов.

    [​IMG]

    Но поскольку омментариев всего 5, то можно простыми границами назначить, а не повторяющими.
     
  5. eleon

    eleon New Member Пользователи

    Регистрация:
    18 фев 2012
    Сообщения:
    37
    комментариев не 5 а как пример я дал 5 их от 0и до 9 может быть.

    [​IMG]

    вот видите вывод как организовать правильный
    тоесть там где нет комментов там нужно чтоб пустая ячейка была. чтоб столбец с единицами был конечным во всех строках и соответсвовал 12й позиции. ну както так.
     
    Последнее редактирование: 14 май 2014
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Что мешает поместить комментарии в конец?), после колонки с единичками? Если так не устраивает, можно подумать над доработкой функционала...
     
  7. eleon

    eleon New Member Пользователи

    Регистрация:
    18 фев 2012
    Сообщения:
    37
    так как раз втом то и проблема что проверяется длинна строки и говорит что увас строка 1 отличается от строки 2 по длинне ? в одной у вас 10 обььектов а у другой у вас 12 , потому и спрашивал или это возможно силами программы , но думаю что скорее подлючу пхп и там все решу а тут просто спаршу так наверное скорее будет.
     
  8. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    динамически повторяющиеся границы (когда вы можете только предполагать их количество) всегда ставятся последней колонкой, сделайте и все у вас получится.
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Content Downloader X версии 10.9923 (18.05.2014):

    - В настройку повторяющихся границ парсинга (ctrl+5) добавлен параметр ограничения минимального количества циклов для каждой границы парсинга.
     

Поделиться этой страницей