Как спарсить файлы картинок из каталога

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем bahus, 22 ноя 2012.

Статус темы:
Закрыта.
  1. bahus

    bahus New Member Пользователи

    Регистрация:
    10 июл 2012
    Сообщения:
    4
    Уважаемые гуру, большая просьба помочь разобраться с проблемкой. Есть сайт с каталогом тракторных запчастей Ссылки недоступны для гостей, никак не могу разобраться с получением файлов изображений. По путям они храняться в каталоге images, но выводяться на страницу сайта скриптом во фрейме пример:
    <IFRAME src="/?id=45&model=1&sx=5" frameborder="0" height="500" align="left" width="95%" name="iframe-0605872653472046" ></IFRAME>
    Что посоветуете?
     
  2. Rezident

    Rezident New Member Пользователи

    Регистрация:
    12 апр 2012
    Сообщения:
    19
    На каждой странице каталога над картинкой, которая открывается во фрейме, есть ссылка Открыть рисунок в новом окне. Соответственно, можно парсить картинки через <GETMORECONTENT>.
     
  3. bahus

    bahus New Member Пользователи

    Регистрация:
    10 июл 2012
    Сообщения:
    4
    Не могу понять какие границы задавать для <GETMORECONTENT>, там только один фрейм в котором и находиться ссылка с изображением.
    <a href=# onclick="window.open('/?id=45&model=5&sx=28','myWindow'); return false;" class=link>Открыть рисунок в новом окне</a><br><iframe src="/?id=45&model=5&sx=28" frameborder="0" height="500" align="left" width="95%"></iframe><br clear=all>
    Само изображение берется отсюда: '/?id=45&model=5&sx=28' то есть images/5/028.bmp
     
    Последнее редактирование: 22 ноя 2012
  4. Rezident

    Rezident New Member Пользователи

    Регистрация:
    12 апр 2012
    Сообщения:
    19
    /?id=45&model=5&sx=28 - это и есть ссылка на страницу с картинкой. Просто в начало надо подставить httр://www.oookoda.ru
    т.е. алгоритм такой - создаете новую границу парсинга и выдираете вот эту часть кода (обозначено красным) <a href=# onclick="window.open('/?id=45&model=5&sx=28','myWindow'); return false;" class=link>, потом в дополнительных настройках границ парсинга подставляете в начало httр://www.oookoda.ru и теперь можете использовать эту границу как url для <GETMORECONTENT>.
     
  5. bahus

    bahus New Member Пользователи

    Регистрация:
    10 июл 2012
    Сообщения:
    4
    C этим разобрался, путь к изображению получаю. А еще хотел спросить, если меняются имена папок как это обойти. Например путь до одной картинки такой images/4/013.jpg до другой images/2/005.bmp и если задавать границы images/4/ то другое изображение не спарситься.
     
  6. Rezident

    Rezident New Member Пользователи

    Регистрация:
    12 апр 2012
    Сообщения:
    19
    Ну а кто мешает задать границу <img src=/images/ ? )))
     
  7. bahus

    bahus New Member Пользователи

    Регистрация:
    10 июл 2012
    Сообщения:
    4
    Все сделал, Rezident большое спасибо за помощь. Тему можно закрыть
     
Статус темы:
Закрыта.

Поделиться этой страницей