Повторяющиеся границы для csv

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем sta1ker, 24 окт 2012.

  1. sta1ker

    sta1ker New Member Пользователи

    Регистрация:
    13 авг 2012
    Сообщения:
    18
    Доброго дня!

    Как парсить повторяющиеся границы я в общем разобрался, а вот как оформить выхлоп в csv для импорта не понял. Может конечно и не получится, всё же решил поинтересоваться у спецов.

    Вот сайт "донор" Ссылки недоступны для гостей

    Как разбить

    на колонки

    Картинка - src
    Цвет - 02
    Тип - Suspend
    Вес - 6.1 г.
    Глубина - 1.2 м.
    Цена - 270.94 р.

    там есть кнопка "Показывать в виде таблицы", но тогда становятся недоступны картинки....

    В общем то характеристики одинаковые к одной модели воблера, но цвет разный...

    Может для этого найдется и другое решение, но я сам к нему не прийду...


    Помогите разобраться, Спасибо!
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Укажите правильно в повторяющихся границах и все получится.
    PHP:
    <div class="lGroupItem">
                       <
    class='lightview' rel="gallery[group28695]" href="/uploads/media/images/shop_items/84627a6b0f2b22e93cf8a7430ebb6ae7be7f76b4.jpg"><img src="/uploads/media/images/shop_items/preview/fe8db42206238ba1257277427411543e5554f66b.jpg" /></a>
                                          <
    br />
                       <
    span class="cnum">27</span>
                       <
    span class="name">28695 / </span>
                       <
    br />
                       <
    div class="more">
                           <
    div class="data">
                            
    Suspend<br />
                            
    6.1 г.<br />
                            
    1.2 м.<br />
                           </
    div>
                           <
    div class="form">
                                                                                                                      <
    span class="price">270.94 р.</span>
                               <
    input type="text" name="count" class="count" value="1" /> <span class="count_text">шт.</span>
                               <
    br />

                                <
    a onclick="return addToCart(28695)" href="#">В корзину</a>
                                <
    input type="hidden" id="item_28695_name" value='Воблер Liberty  Pitty SB 65sp # 27C' />
                                <
    input type="hidden" id="item_28695_price" value='270.94' />
                           </
    div>
                       </
    div>
    Вполне можно разделить зацепившис границами например за <div class="data"> и за <br />
     
  3. sta1ker

    sta1ker New Member Пользователи

    Регистрация:
    13 авг 2012
    Сообщения:
    18
    я так делал, но так парсится страница целиком и если отпарсить 300-1000 позиций, то разобрать получившееся займёт гораздо больше времени, чем копи-пастить таблицу с товарами в файл и подставлять имена картинок....

    может есть другой вариант?
     
  4. sta1ker

    sta1ker New Member Пользователи

    Регистрация:
    13 авг 2012
    Сообщения:
    18
    в конечном итоге нужно спарсить всё от сюда Ссылки недоступны для гостей
     
  5. sta1ker

    sta1ker New Member Пользователи

    Регистрация:
    13 авг 2012
    Сообщения:
    18
    а можно в повторяющихся границах настроить доп границы парсинга?
     
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    1. простой границей отмеьте область где повторяются все блоки с инфой.
    2. потом эту границу укажите в SET (выпадающий список с номерами) для одной из повторяющиейся границы.
    3. укажите повторяющуюся границу (тоесть один из повторяющихся блоков с инфой/кодом)
    4. Теперь переходите в "настройки повторяющихся границ" и настраивайте выборку цены, картинки, бренда и т.д.
    5. В "шаблон вывода" должен быть только <CD_CYCLE_GRAN_ALL!>

    недавно писали о повторяющихся границах на форуме - http://forum.sbfactory.ru/showthread.php?t=104&page=2 почитайте
     
  7. sta1ker

    sta1ker New Member Пользователи

    Регистрация:
    13 авг 2012
    Сообщения:
    18
    Спасибо огромное! Незнаю как не заметил кнопку...

    Идеальный парсер!

    Вывел всё прямо под импорт!
     

Поделиться этой страницей