Как спарсить поисковик

Тема в разделе "Подгрузка данных, которых нет в коде WEB-документа", создана пользователем weresa, 24 янв 2018.

Метки:
  1. weresa

    weresa Member Пользователи

    Регистрация:
    14 сен 2014
    Сообщения:
    129
    Здравствуйте, уважаемые мудрецы!
    Появилась задача с сайта для поиска книг по коду ISBN собрать картинки к этим книгам, имея некий список этих кодов.
    Сайт вот этот - Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! , он находит нужную информацию, но представляет ее в рамках одной страницы без каких-либо доп.ссылок. Предполагаю, что нужно воспользоваться WBApp, т.е. имитировать ввод кода и собирать выдаваемые данные. Но вот каким образом это оформить - тупик((
    Подскажите, пожалуйста,в какую сторону думать, если мое предположение верно? Если нет, то направьте, где посмотреть.
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.197
    Список ссылок:
    В шаблоне ссылок поставьте диапазон ссылок, нажмите Ctrl+g и в {key} построчно добавьте список ISBN, вот по такому шаблону ссылки
    Код:
    https://vsepravilno.com/tools/isbn/##[P]:{key} 

    В wbapp код:

    Код:
    [PASTE][id][N]0[/N][FULL]:dictudksearchform-query[TEXT]:[CDPARAM]
    [CLICK][innerhtml][N]0[/N][FULL]:Поиск
    [WAIT]:3500
    Более подробно в справке Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
    Последнее редактирование: 24 янв 2018
  3. weresa

    weresa Member Пользователи

    Регистрация:
    14 сен 2014
    Сообщения:
    129
    Спасибо, протестирую. Но чтобы увидеть какой-либо результат, мне необходимо настроить границы парсинга.
    КАК БЫ увидеть страницу с содержимым запроса? [​IMG]
    По ссылке
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! - встроенный браузер показывает то же самое, что и по ссылке
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    - то есть ничего((( [​IMG]
     
    Последнее редактирование: 26 янв 2018
  4. weresa

    weresa Member Пользователи

    Регистрация:
    14 сен 2014
    Сообщения:
    129
    Просмотрела видео-урок по макросу GETMORECONTENT, но если по-честному, всегда огромные сложности с определением нужного места в плагине HTTP Header Live, там просто сразу столько всего вываливается и ничего непонятно... Двое суток ковыряюсь и каша в голове только увеличивается :(
     
  5. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.257
    Вам выше написали рабочий проект практически, Надо было лишь его воплотить.
    Вот зачем вы полезли в GETMORECONTENT?
    Прикрепил рабочий проект
     

    Вложения:

    dezm, Root и xLime нравится это.
  6. weresa

    weresa Member Пользователи

    Регистрация:
    14 сен 2014
    Сообщения:
    129
    Kreol, это супер! В очередной раз убеждаюсь, что вы гении!
    Спасибо огроменное!!!
     
    Root и Kreol нравится это.

Поделиться этой страницей