Спарсить сайт

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Traffim, 7 мар 2013.

  1. Traffim

    Traffim New Member Пользователи

    Регистрация:
    7 мар 2013
    Сообщения:
    5
    Здравствуйте.
    Только вчера купил CD, пробую разобраться с ним.
    Вроде все понятно, потихоньку вникаю.
    Но к примеру есть задача:
    Спарсить и загнать в DLE данные с сайта myspongebob.ru. Сайт этот на WordPress'e
    Все получается спарсить: текст, титл, саму флешку.
    Но как скачать картинку? Ну и главное привязать ее спарсеной странице?
    Ведь в "полной новости" нет картинки.
    Заранее спасибо за любые советы и внимание! :)
     
  2. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    214
    А справка по программе для кого?
    Ссылки недоступны для гостей

    Но если не хотите разбираться тогда просто закажите проект ;)
     
  3. Traffim

    Traffim New Member Пользователи

    Регистрация:
    7 мар 2013
    Сообщения:
    5
    Вроде уже дальше продвинулся :)
    Но не могу реализовать следующее:
    Есть вот такой код на странице:
    HTML:
    <table>
        <tr><td width="185" valign="top" align="center"><a href="http://myspongebob.ru/omlet/">
    			<img width="150" height="110" src="http://myspongebob.ru/wp-content/uploads/2012/06/OmletSSyrom1-150x110.jpg" class="attachment-150x110 wp-post-image" alt="OmletSSyrom[1]" title="OmletSSyrom[1]" />			<br>Омлет<br></a></td>
    
    Как сохранить изображения с привязкой к ссылке? Т.е. скаченные картинки называть именем ссылки.
    К примеру изображение "OmletSSyrom1-150x110.jpg" переименовать при сохранении в "omlet.jpg".
    Пробую IMAGESNAMES_<CD_CYCLE_GRAN_Адрес_ссылки!>
    Но файлы как то не так сохраняются. Повторяются названия.
    С одним изображением проблем нет.
    Но как массово это правильно сделать, когда на одной странице несколько картинок-ссылок?
    Спасибо!
     
  4. Igor_st

    Igor_st New Member Пользователи

    Регистрация:
    8 фев 2013
    Сообщения:
    47
    Я в этом также новичок,

    Я выставляю в границах парсинга от начала до конца парсить страницу и ставлю галочку txt, там можно дополнительно указать какие теги не трогать, а также юзаю поиск замену.
     
  5. Traffim

    Traffim New Member Пользователи

    Регистрация:
    7 мар 2013
    Сообщения:
    5
    Вот куда меня завела эта задача:
    В <CD_CYCLE_GRAN_1!> - список ссылок на картинки
    В <CD_CYCLE_GRAN_2!> - список нужных названий картинок

    В "Настройке повторяющихся страниц" делаю:
    В шаблоне 1:
    <DOWNLOADFILE>[VALUE]</DOWNLOADFILE>
    В шаблоне 2:
    DOWNLOADFILENAMES_[VALUE]
    ------
    Насколько я понимаю, скачиваем файл и обзываем его текущим значением из <CD_CYCLE_GRAN_2!>.
    Но почему то не работает. Имена файлов повторяются.

    Вот что в текстовом файле после парсинга:
    Код:
    files/semejnyj-obed.jpg
    files/semejnyj-obed_2.jpg
    DOWNLOADFILENAMES_piratskaya-svadba
    files/semejnyj-obed_3.jpg
    DOWNLOADFILENAMES_shef-povar
    files/semejnyj-obed_4.jpg
    DOWNLOADFILENAMES_stritrejsery
    files/semejnyj-obed_5.jpg
    DOWNLOADFILENAMES_novyj-obraz-2
    files/semejnyj-obed_6.jpg
    DOWNLOADFILENAMES_devochka-na-lugu
    files/semejnyj-obed_7.jpg
    Кто может помочь с этим?
     
    Последнее редактирование: 8 мар 2013
  6. Igor_st

    Igor_st New Member Пользователи

    Регистрация:
    8 фев 2013
    Сообщения:
    47
    Что то очень сложно все у Вас получается.

    Я задаю парсинг от начала до конца вместе с картинками, а в дополнительных настройках парсинга ставлю html в txt. Таким образом у меня парситься весь документ, а ссылки на картинку остаются. (иногда юзаю поиск замену и добавляю какие теги пропускать).

    В главном окне программы ставлю загружать картинки, и получается что картинки у меня загружаются в отдельную папку.

    После чего эти картинки выгружаю на сервер, а ссылки на них лежат в спарсенных описаниях.

    Надеюсь понятно объяснил.


    Сори недосмотрел, что нужно спарсить с краткой новости картинку.
     
    Последнее редактирование: 8 мар 2013

Поделиться этой страницей