Как спарсить сайт на яве (java) и фреймах

Тема в разделе "Решение различных задач по парсингу", создана пользователем seva100, 5 фев 2019.

  1. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    Что бы попасть на раздел сайта, который нужно спарсить, нужно зати на страницу Ссылки недоступны для гостей, справа ввести: Serial number - 70763; Part language - eng; Catalog language - eng. Нажать кнопку "Enter Catalog". Откроется новое окно состоящее из фреймов. Фреймы подгружаются java`ой. Надо спарсить сперва ссылки, а потом и картинки и текст.
    В CD удалось получить исходный код страницы Ссылки недоступны для гостей
    с фреймами. Однако, содержимое фреймов не приехало.
    Что интересно, смотрю Хромом на каталог, вижу и дерево в левом фрейме, картинку посередине, таблицу в правом фрейме - правой мышей на странице - исходный код страницы - а там ни дерева ни картинок. Только отссылки на <frame name="ххх" src="footer.jsp?sig=1373E...</frameset>
    Такой же исходный код я смог получить в CD.
    Еще эти "sig=" непонятные.
    Мой проект
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Вопрос. В принципе такой сайт можно сграбить?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей
     
  3. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    С помощью WBApp не получается. В окне WBApp ввожу адрес начальной страницы Ссылки недоступны для гостей. Открывается. Заполняю поля, нажимаю кнопку "Enter Catalog" и открывается новое окно Internet Explorer с содержимым нужной мне страницы. Т.е. нужная мне страница не открывается в WBApp.
     

Поделиться этой страницей