Помогите спарсить http://www.hotel.de

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем alexander, 25 авг 2012.

  1. alexander

    alexander New Member Пользователи

    Регистрация:
    26 июл 2012
    Сообщения:
    33
    Адрес:
    deutschland
    Два дня уже бьюсь не могу его одолеть вылазит код в место текста,парсил с разных сайтов всё как то получалось,а здесь завис.
    Вот сам адрес Ссылки недоступны для гостей
    Хотелось спарсить весь сайт :confused:буду благодарен кто сможет подсказать версия программы Content Downloader II 2.70
     
  2. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Если вам нужно парсить весь сайт, проще использовать для этого специализированные программы, типа WinHTTrack, либо надо настраивать Content Downloader на каждый раздел по отдельности, то есть, настройка производится на однотипные страницы, а "весь сайт" состоит из страниц с разными структурами. Можно, конечно, спарсить все ссылки, затем парсить при опции "Парсить весь документ", но, всё зависит от того, в каком виде вам нужен спарсенный контент.
     
  3. alexander

    alexander New Member Пользователи

    Регистрация:
    26 июл 2012
    Сообщения:
    33
    Адрес:
    deutschland
    Да мне хотя бы понять как эту страницу Ссылки недоступны для гостей спарсить,чтобы открывалась страница каждого отеля как на этой ссылки Ссылки недоступны для гостей и там уже парсить картинки и текст,вот про что я прошу помочь
     
  4. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Необходимо спарсить ссылки с данной страницы. Смотрите тут -
    - Ссылки недоступны для гостей
    - Ссылки недоступны для гостей
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Чтобы не было разочарования в Content Downloader-e изза игнорирования подгружаемого контента через ajax и прочие яваскрипты, могу посоветовать сохранить весь результат поиска в виде HTML страницы с помощью плагина ScrapBook к броузеру Mozilla потом добавив этот сохраненный файл в программу можно собрать ссылки. Правда неудобный вариант потомучто слишком скроллить надо результаты поиска по 100 добавляя))
     
  6. alexander

    alexander New Member Пользователи

    Регистрация:
    26 июл 2012
    Сообщения:
    33
    Адрес:
    deutschland
    попробую-пока-не чего не помогло.
     

Поделиться этой страницей