Скачивание картинок при использовании REGEXP в динамических страницах

Тема в разделе "Скачивание картинок и файлов", создана пользователем SeoNew, 11 мар 2014.

  1. SeoNew

    SeoNew New Member Пользователи

    Регистрация:
    13 окт 2013
    Сообщения:
    27
    Большое спасибо за огромные возможности программы, но есть некоторая путаница в мануалах (точнее, неполная информация)

    Мой вопрос:

    использую для выдирания картинок со страницы конструкцию с REGEXP:

    Код:
    [[[0|(Ссылки недоступны для гостей[-0-9a-z]+/[0-9a-z]+/pictures/[0-9_a-z]+?.jpg)||{br}{{{[REGEXPR]}}}]]]
    все отлично работает, выбирает 3-5 картиноки УРЛами, вписывает в файл:

    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей

    но - не могу их скачать :(

    если вписать конструкцию <NIMG>

    Код:
    <NIMG>[[[0|(Ссылки недоступны для гостей[-0-9a-z]+/[0-9a-z]+/pictures/[0-9_a-z]+?.jpg)||{br}{{{[REGEXPR]}}}]]]</NIMG>
    то пытается сохраниться только последняя картинка, и то, какая-то фигня происходит: в файл вывода пишется УРЛ images/NiskET_01.jpg

    (как понимаю, последовательность обработки тут какая-то)
    <img src= тоже непонятно как задавать,в любом месте конструкции ее просто в итоге не выводит :(

    конечно, можно решить задачу двумя проходами: 1) выбрать УРЛы в файлы на диск 2) спарсить с диска и скачать , но хочется красивого решения

    подскажите, пожалуйста, что можно сделать?

    P.S. без регекспов (потворяющимися границами если делать), думаю, не получится, т.к. первая же подпапка различается

    Ссылки недоступны для гостей/pocketbook-515-grey/p297807/pictures/ZhrTs_01.jpg
    Ссылки недоступны для гостей/nook-glowlight/o366750/pictures/NiskET_01.jpg

    Спасибо!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Не мудрено, что если вы взяли все ссылки и поместили в макрос для загрузки одной картинки (NIMG), то будет не очень!

    У вашей задачи есть огромное количество решений, причем не самых сложных =)

    Первое:
    Можно взять каждую ссылку на картинку в макрос NIMG:
    Код:
    <NIMG>[[[0|(http://example.com/[-0-9a-z]+/[0-9a-z]+/pictures/[0-9_a-z]+?.jpg)||</NIMG><NIMG>{{{[REGEXPR]}}}]]]</NIMG>
    Поясняю: циклы разделили не {br} (перенос строки), а </NIMG><NIMG>

    Второе:
    Использовать этот макрос Ссылки недоступны для гостей (информация полная, простите)

    Третье:
    Если бы показали ссылку на товар (или что там у вас), я сто процентов показал бы, как задать повторяющиеся границы.

    Все просто =)
     
  3. SeoNew

    SeoNew New Member Пользователи

    Регистрация:
    13 окт 2013
    Сообщения:
    27
    отлично! первое - идеально, спасибо!

    (второе, наверно, тоже, но мне не только картинки, мне и текст, просто остановка за скачиванием картинок встала)
     

Поделиться этой страницей