Парсинг повторяющихся границ не получается

Тема в разделе "Границы парсинга", создана пользователем zilon, 27 июн 2012.

  1. zilon

    zilon New Member Пользователи

    Регистрация:
    24 дек 2011
    Сообщения:
    80
    Здравствуйте, у меня парсинг повторяющихся границ не получается я всё по инструкции делаю Ссылки недоступны для гостей в общем вот на этой страничке я новости для музыкального сайта генерирую Ссылки недоступны для гостей кнопку нажимаю, окрывается страница в сгенерироваными новостями, а я хочу её спарсить и в вывести в шаблоне вывода, а на выходе получить скрипт на пехе для импорта в базу.

    я у странички с новосями открыл исходный код и сюда сохранил сюда Ссылки недоступны для гостей и сюда Ссылки недоступны для гостей , когда задаю повторяющиеся границы парсинга, жму готово, а на следующей два раза кликаю по ссылке, окно предпросмотра открывается, а там написано Результирующий документ оказался пустым.

    Помогите пожалуста настроить, вот я проект прикрепил
     

    Вложения:

  2. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    По большому счёту непонятно, чего вы хотите сделать?
    Если вы хотите, чтобы произошло нажатие кнопки, вам нужны Zennoposter, Human emulator или другие подобные программы. Принцип работы CD немного иной. Есть страница с контентом, вы берёте её адрес, то есть ссылку, и с этой страницы забираете контент, предварительно настроив границы. В CD не предусмотрена нажатие кнопок на страницах парсинга. Но, возмождно, я чего-то недопонимаю?

    Я вот посмотрел проект, и тоже он порождает вопросы:

    Что-то тут мудрённое очень.
    - Я в PHP не силён, но, кажется ему не место в шаблоне CD. Разве что вы хотите, чтобы у вас на выходе получился php-файл
    - Второе, вы настроили "повторяющиеся границы", а проставили в шаблон обычные, которые даже не активированы
    - третье, почему бы вам не потренироваться для начала на более простом варианте парсинга?

    Начните разбираться поэтапно с каким-нибудь более простым сайтом,- сделайте парсингш текстов с обычными границами, затем выберите страницы, на которых есть повторяющиеся границы, разберитесь как оно работает. Могу предложить страницу какой-либо темы на форуме. Когда поймётете как оно работает, попробуйте усложнить задачу. Даже если вы решите сразу сложную задачу, всё равно без знаний азов вам не обойтись.
     
  3. Лёпа

    Лёпа New Member Пользователи

    Регистрация:
    14 апр 2012
    Сообщения:
    2
    Доброго времени суток!
    У меня похожая проблема. После Обновления программы на CD 2 не работает парсинг повторяющихся границ (<CD_CYCLE_GRAN_ALL!> <CD_CYCLE_GRAN_1!> и.т.д. ). пробовал на разных сайтах, везде выдает: Результирующий документ оказался пустым.
    Но если эти же название границ прописать например в границы парсинга 1 (<CD_GRAN_1!>) то все прекрасно парсится! подскажите в чем может быть проблема?
     

    Вложения:

  4. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    1. Создайте проект заново Меню Файл - Создать новый проект (Ctrl+n)
    2. Чтобы воспользоваться старым проектом
    -> меню -> Файл -> "Загрузить проект со старой версии программы"

    В вашем случае, Лёпа, после того как создадите проект или откроете этот правильно в шаблоне проставьте <CD_CYCLE_GRAN_ALL!> (предварительно настроив чуть правильнее вторую границу)
     
  5. Лёпа

    Лёпа New Member Пользователи

    Регистрация:
    14 апр 2012
    Сообщения:
    2
    Большое спасибо за оперативность) Все работает!
     
  6. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Куда ему деваться
     

Поделиться этой страницей