Динамически подгружаемый контент

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем perseus, 28 окт 2014.

  1. perseus

    perseus New Member Пользователи

    Регистрация:
    22 сен 2014
    Сообщения:
    10
    Добрый день. Нужно спарсить ссылку, которая подгружается динамически.
    http://seetv.tv/see/stbua#link=9993
    Ссылка в плеере на видеопоток, типа: rtmp://194...
    Причем в CD и исходном коде странице ее тоже нет, а в firebug есть. Какие параметры нужно выставить в CD, чтобы ее оттуда вытащить?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Я открыл вашу страницу в Google Chrome и произвел поиск по коду rtmp. Итог - 0 совпадений...

    В коде страницы браузера такой подстроки нет...

    С уважением к вам, Сергей.
     
  3. perseus

    perseus New Member Пользователи

    Регистрация:
    22 сен 2014
    Сообщения:
    10
    Я об этом и говорю. На этой странице откройте Firebug и в его поиске введите rtmp. Там она появляется.
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Программа получает код WEB-документа и работает с ним. В коде WEB-документа запрашиваемых данных нет. Следовательно, парсить эти данные нельзя (их же нет в коде).
     
  5. perseus

    perseus New Member Пользователи

    Регистрация:
    22 сен 2014
    Сообщения:
    10
    Но эти данные все же появляются на странице. Динамически подгружаемый контент тоже не отображается в исходном коде страницы, но программу можно настроить, чтоб его спарсить. Я просто не могу проследить, когда он появляется.
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Простите, но я не знаю ответ на ваш вопрос.
     
  7. perseus

    perseus New Member Пользователи

    Регистрация:
    22 сен 2014
    Сообщения:
    10
    Может подскажете, кто знает.
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Простите, но я не знаю таких людей...
     
  9. perseus

    perseus New Member Пользователи

    Регистрация:
    22 сен 2014
    Сообщения:
    10
    И на этом спасибо.
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста, но, думаю, особо не за что.
    Обращайтесь, когда будут еще вопросы...
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вы привели следующие ссылки:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Попробуйте привести полные ссылки (без ...) возможно пара идей придет на ум...

    Спасибо!
     
  12. perseus

    perseus New Member Пользователи

    Регистрация:
    22 сен 2014
    Сообщения:
    10
    Я нашел. То, что мне нужно подтягивается на страницу запросом json к адресу
    http://seetv.tv/get/player/9997

    [​IMG]
    Но опять таки, отдельно от родительской страницы сам запрос не выдает контент. Не могу разобраться, какие заголовки в парсинге передать этому запросу, чтоб он выдал то, что нужно.
     
    Последнее редактирование: 29 окт 2014
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Тогда, думаю, вот решение Ссылки недоступны для гостей
    При использовании макроса GETMORECONTENT referer будет браться от той страницы, которую вы парсите (она и есть, как вы сказали, "родительская").

    PS: В этом макросе можно передавать любые заголовки.

    С уважением к вам, Сергей.
     
  14. perseus

    perseus New Member Пользователи

    Регистрация:
    22 сен 2014
    Сообщения:
    10
    Спасибо. Подключил подгрузку этим макросом, но результат такой, как просто парсить подгружаемую страницу. Если можно, могу скинуть файл проекта, может найдете мой косяк?
     
  15. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.

    Воспользуйтесь плагином Firefox LiveHTTPHeaders для просмотра передаваемых HTTP-заголовков и пропишите такие же заголовки в макросе GETMORECONTENT (Ссылки недоступны для гостей).

    С уважением к вам, Сергей.
     

Поделиться этой страницей