Вопрос по парсингу картинок

Тема в разделе "Решение различных задач по парсингу", создана пользователем roman_k, 5 ноя 2015.

  1. roman_k

    roman_k Member Пользователи

    Регистрация:
    4 ноя 2015
    Сообщения:
    46
    Добрый день!

    Итак через повторяющиеся границы парсинга получил список картинок которые нужно спарсить:

    <div style=""><img src="/upload/iblock/b9b/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_1.JPG.pagespeed.ce.yEATToxJMc.jpg" alt=""/></div>
    <div style=""><img src="/upload/resize_cache/iblock/a24/800_800_1/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_10.JPG.pagespeed.ce.s3fD0JV2SR.jpg" alt=""/></div>
    <div style=""><img src="/upload/resize_cache/iblock/413/800_800_1/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_5.JPG.pagespeed.ce.rHuGoUY1QJ.jpg" alt=""/></div>
    <div style=""><img src="/upload/resize_cache/iblock/5a7/800_800_1/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_7.JPG.pagespeed.ce.tfjZo_twFm.jpg" alt=""/></div>
    <div style=""><img src="/upload/iblock/2b1/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_6.JPG.pagespeed.ce.3m8ncJNtK7.jpg" alt=""/></div>
    <div style=""><img src="/upload/iblock/692/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_4.JPG.pagespeed.ce.FgauhqGo86.jpg" alt=""/></div>
    <div style=""><img src="/upload/iblock/56e/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_3.JPG.pagespeed.ce.PU09FZMk5K.jpg" alt=""/></div>
    <div style=""><img src="/upload/iblock/c65/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_8.JPG.pagespeed.ce.XtXnmgecjC.jpg" alt=""/></div>
    <div style=""><img src="/upload/resize_cache/iblock/d79/800_800_1/MOYKI_BLANCO_DALAGO_SHAMPAN_N000125721_9.JPG.pagespeed.ce._qj4LROidT.jpg" alt=""/></div>

    Далее в настройках повторяющихся границ парсинга прописал <DOWNLOADFILE>[VALUE]</DOWNLOADFILE>

    Делаю предпросмотр, программа говорит, что не удалось скачать картинку.

    Увидел, что программа взяла весь адрес ссылки на товар с которым проводил тесты и подставила туда (Ссылки недоступны для гостей/kategoria/tovar/upload/resize_cache..................jpg)

    Но картинки лежат по адресу Ссылки недоступны для гостей[/U]resize_cache...........jpg)

    Как сделать так, чтобы система указывала именно источник Ссылки недоступны для гостей далее повторяющиеся границы парсинга)?

    Заранее благодарен за помощь!!!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Видимо, вы задали начало повторяющейся границы вместе со слешем:
    Он является частью ссылки и вам нужно его убрать из начала повторяющейся границы парсинга.

    С уважением к вам, Сергей...
     
  3. J!Life

    J!Life Модератор Команда форума Модератор

    Регистрация:
    6 дек 2013
    Сообщения:
    83
    перед value поставить нужный путь Ссылки недоступны для гостей[VALUE]
    или Ссылки недоступны для гостей[VALUE] - в зависимости что дает value
     
  4. roman_k

    roman_k Member Пользователи

    Регистрация:
    4 ноя 2015
    Сообщения:
    46

    да, сейчас попробую исправить..
    Сергей, еще вопрос - при скачки одной картинки - все понятно, а как быть чтобы фотки переименовывались когда загружаю их массово через <DOWNLOADFILE>?
     
  5. roman_k

    roman_k Member Пользователи

    Регистрация:
    4 ноя 2015
    Сообщения:
    46
    Благодарю! протестирую данный способ!
     
  6. J!Life

    J!Life Модератор Команда форума Модератор

    Регистрация:
    6 дек 2013
    Сообщения:
    83
    [DFN]
    Ссылки недоступны для гостей (Переименование файлов)
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Как и написали выше, вставлять макрос [DFN] в настройку повторяющихся границ (shift+ctrl+5).
     
  8. roman_k

    roman_k Member Пользователи

    Регистрация:
    4 ноя 2015
    Сообщения:
    46
    Да, все получилось, спасибо!

    Еще вопрос - при предпросмотре, все замечательно парсится, картинки попадают в папку, все работает.

    Сейчас запустил парсер всех товаров по ссылкам, данные парсятся в csv, в столбике с картинками прописывается директория, но в самой папке картинки не появляются... по какой причине это может быть? тестирую на одной ссылке - все работает, тестирую на нескольких - не грузит просто картинки и все.

    Спасибо за помощь
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Попробуйте парсить в 1 поток. Если это не поможет, вышлите мне или выложите тут файл проекта, постараюсь разобраться в проблеме.

    С уважением к вам, Сергей.
     
  10. roman_k

    roman_k Member Пользователи

    Регистрация:
    4 ноя 2015
    Сообщения:
    46
    к сожалению не помогло, прикладываю файл проекта
     

    Вложения:

  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Никаких проблем. Файлы в папке files появляются.

    Обратитесь к специалистам по настройке, пусть они удаленно посмотрят, в чем дело Ссылки недоступны для гостей

    Как альтернативный вариант, можно перенести программу на другой ПК. Думаю, проблема со стороны вашей системы.

    С уважением к вам, Сергей.
     

    Вложения:

Поделиться этой страницей