Не получается скачать картинки и характерристики с одной страницы

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем МАРКИ, 25 фев 2014.

  1. МАРКИ

    МАРКИ New Member Пользователи

    Регистрация:
    25 фев 2014
    Сообщения:
    8
    Ниже кусок исходного кода страницы, откуда мне надо выдернуть картинки типа Ссылки недоступны для гостей
    и характерристики к каждой, например: color58 Epoca (cat.A) FR ARM состав: 19,5%CO 26,3%PES 54,28%PU высота: ALT140
    Не полдучается создать повторяющуюся границу для картинок.
    Я задаю начало цикла <a href=" конец class="lightbox{skip}"></a>, а внутри цикла задаю обычные границы парсинга, как написано здесь
    Ссылки недоступны для гостей

    Но поскольку в коде страницы полно <a href= программа не находит нужный цикл. В этом коде больше не за что зацепиться.
    Кто знает, посоветуйте как правильно сделать.

    Вот кусок кода:
    HTML:
    <a href="http://www.sevensedie.ru/fabrics">Вернуться в раздел Коллекции тканей</a></em>
                    </p>
                     
     
     
      <div class="clear"></div>
      
           
                        
                                          
                                
                                <div class="box_quarter  mt35 overflow">
                                    <a href="http://www.sevensedie.it/image/big/370-aal-1.jpg" rel="color58" title="Epoca (cat.A) FR AAL-1"  class="lightbox58"><h2>AAL-1</h2>
                                        <div class="mag"><!-- magnifying glass div -->
                                            <img src="http://www.sevensedie.it/image/th/439-miniatura.jpg" alt="" />
                                        </div><!-- end magnifying glass div -->
                                    </a>
                                </div>
                                                                    <a href="http://www.sevensedie.it/image/big/549-aal-2026-09.jpg" rel="color58" title="Epoca (cat.A) FR ARM&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox58"></a>
                                                                        <a href="http://www.sevensedie.it/image/big/544-aal-2026-19.jpg" rel="color58" title="Epoca (cat.A) FR ARL&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: ALT140" class="lightbox58"></a>
                                                                        <a href="http://www.sevensedie.it/image/big/770-aal-2026-75.jpg" rel="color58" title="Epoca (cat.A) FR AAL-2026-75&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox58"></a>
                                                                        <a href="http://www.sevensedie.it/image/big/663-aal-2026-45.jpg" rel="color58" title="Epoca (cat.A) FR AAL-2026-45&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox58"></a>
                                                                        <a href="http://www.sevensedie.it/image/big/910-aal-2026-13.jpg" rel="color58" title="Epoca (cat.A) FR AAL-2026-13&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox58"></a>
                                                                        <a href="http://www.sevensedie.it/image/big/308-aal-2026-03.jpg" rel="color58" title="Epoca (cat.A) FR ARK&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox58"></a>
    
                                                                
                                                            
                                
                                <div class="box_quarter  mt35 overflow">
                                    <a href="http://www.sevensedie.it/image/big/224-aal-2.jpg" rel="color59" title="Epoca (cat.A) FR AAL-2"  class="lightbox59"><h2>AAL-2</h2>
                                        <div class="mag"><!-- magnifying glass div -->
                                            <img src="http://www.sevensedie.it/image/th/144-miniatura.jpg" alt="" />
                                        </div><!-- end magnifying glass div -->
                                    </a>
                                </div>
                                                                    <a href="http://www.sevensedie.it/image/big/547-aal-2026-01.jpg" rel="color59" title="Epoca (cat.A) FR AP8&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox59"></a>
                                                                        <a href="http://www.sevensedie.it/image/big/110-aal-2026-11.jpg" rel="color59" title="Epoca (cat.A) FR A6C&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox59"></a>
                                                                        <a href="http://www.sevensedie.it/image/big/105-aal-2026-21.jpg" rel="color59" title="Epoca (cat.A) FR AAL-2026-21&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;состав: 19,5%CO 26,3%PES 54,28%PU&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;высота: H140" class="lightbox59"></a>
    
                                                                
                                                            
                                                    
                            
                            <script type="text/javascript">
                            // <![CDATA[
                                jQuery(document).ready(function($){
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    Поиск по форуму полезная штука, о повторяющихся границах расписано было несколько раз.
    здесь и здесь почитайте, надеюсь поможет решить вашу задачу.
     
    Последнее редактирование: 25 фев 2014
  3. МАРКИ

    МАРКИ New Member Пользователи

    Регистрация:
    25 фев 2014
    Сообщения:
    8
    Благодарю, всё получилось.
    Но есть один непонятный момент.
    Я создал новую задачу, где мне нужно подтянуть из того же кода значения из тегов <h2></h2> и ссылку на картинку к нему.
    Я сделал постоянную границу, а внутри неё две повторяющиеся для картинки и для наименования.
    Наименования выводятся, а вот ссылки на картинку нет.
    Функция html -> txt отключена.
    Что я делаю не так?
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    обновите версию CD до последней (10.02)
    в ней появился макрос [CSVIMAGES(a)]<CD_GRAN_2!>[/CSVIMAGES]
    он вытянет урлы страничек из тегов a href
    Если Вам нужны картинке на диске включите их загрузку (иконка с картинкой) (подробнее Ссылки недоступны для гостей) там для старой версии, но главное суть).
     
  5. МАРКИ

    МАРКИ New Member Пользователи

    Регистрация:
    25 фев 2014
    Сообщения:
    8
    Этим методом выдёргиваются все картинки, для заданной границы. А мне нужна только одна, которая слева от названия (теги h2)
    Это возможно?
    Метод начало|конец применить не могу, т.к. ссылка на картинку рядом с названием ничем ни отличается от других.
     
    Последнее редактирование: 26 фев 2014
  6. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    обратитесь ко мне в скайп
     
  7. МАРКИ

    МАРКИ New Member Пользователи

    Регистрация:
    25 фев 2014
    Сообщения:
    8
    Kreol, благодарю за помощь!
    Решение следующее:
    Надо использовать скрипт REPLACE, чтобы отсеять a href="
    В моём случае так
    [REPLACE(<a href="|{break}"{skip}>|)]<CD_CYCLE_GRAN_1!>[/REPLACE]

    Прога правильная!
     

Поделиться этой страницей