Не могу спарсить картинку через <GETMORECONTENT>

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем tkm, 19 фев 2015.

  1. tkm

    tkm Member Пользователи

    Регистрация:
    22 ноя 2011
    Сообщения:
    85
    С Яндекс-Маркета пытаюсь через <GETMORECONTENT> спарсить картинку. Ничего не получается , так как при обращении к странице с картинкой и попытке задать границы парсинга вылазит вот такое сообщение

    не удалось загрузить контент по заданному URL (IOHandler value is not valid)

    Бывает что в коде появляется страница с предупреждением , что надо вводить капчу, хотя при обращении напрямую к этой странице никакого бана не происходит. Помогите ! Сроки горят. Бьюсь второй день и все бесполезно...

    Образец проекта прилагаю.
    Ссылку на страницу с картинкой пытаюсь задать в 20 границе парсинга.
    В настройка программы разделители CSV ^ и '
    А также включен режим
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
    Последнее редактирование: 19 фев 2015
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    11.580
    Здравствуйте!

    В вашем проекте я не увидел макроса GETMORECONTENT, да и ладно. Вот, настроил (меню - файл - загрузить проект). Проблем при настройке не испытал.

    Рекомендация: Не использовать лишние запросы для загрузки одной лишь картинки во избежание временного бана от Яндекс. Учтите, что на странице характеристик (откуда парсим) присутствует миниатюрная копия картинки товара (мало ли, может подойдет).

    Надеюсь, мы вам помогли.

    С уважением, администрация сайта...
     

    Вложения:

  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.686
    Город:
    Riga
    Еще вариант - парсите в два этапа, потом состыкуете в программе два документа по названию товара.
    1. Первый этап - парсите данные, название товара и колонка картинки
    2. Второй этап - парсите отдельной настройкой характеристики
    п.с. проект не просматривал, ответ на основе вопроса)
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    11.580
    PS: "Состыковать" два CSV можно функцией слияния файлов в редакторе CSV. Для вызова редактора CSV-файлов есть соответствующая кнопка на панели инструментов главного окна программы.
     
  5. tkm

    tkm Member Пользователи

    Регистрация:
    22 ноя 2011
    Сообщения:
    85
    Нужна именно большая картинка. У меня почему-то не получается.
    По результатам парсинга Вашего проекта вижу вот это
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    В чем может быть проблема не подскажете?
     
  6. tkm

    tkm Member Пользователи

    Регистрация:
    22 ноя 2011
    Сообщения:
    85
    попробую по второму варианту.
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    11.580
    Возможно, запросы программы Яндекс "подзабанил", а запросы Internet Explorer (DOM) - нет. Тогда включаем [WBAPPMODE] для GETMORECONTENT (проект приложил).
     

    Вложения:

Поделиться этой страницей