Парсинг текста с другой страницы

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем seokotik, 15 ноя 2012.

  1. seokotik

    seokotik New Member Пользователи

    Регистрация:
    14 окт 2012
    Сообщения:
    6
    Добрый вечер, подскажите.
    Часть характеристик берем с урла, в котором содержится model.xml? а остальное берется с ссылки которая отличается заменой этой части на model-spec.xml?

    Как это реализовать в шаблоне вывода?
    SELF параметр никак не изменить, а как еще подставлять ссылку в getmorecontent, чтобы она изменялась, я никак не додумался.

    Есть идеи?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Почитайте описание макроса GETMORECONTENT - вместо self може быть и адрес страницы который обработан макросом
     
  3. seokotik

    seokotik New Member Пользователи

    Регистрация:
    14 окт 2012
    Сообщения:
    6
    Сразу помогло.
    Спасибо большое, буду читать еще!
     
  4. seokotik

    seokotik New Member Пользователи

    Регистрация:
    14 окт 2012
    Сообщения:
    6
    Надо спарсить повторяющиеся границы, которые расположены на другой странице.
    Я открываю задание границ парсинга, там ставлю галочку у первой повторяющейся границы, указываю сами границы и нажимаю расширенные настройки.
    Там для первой границы прописываю
    [GETMORECYCLECONTENT]Ссылки недоступны для гостей[START]<p class="user-opinion">[/START][END]</p>[/END][TOSTART][/TOSTART][TOEND][/TOEND][PARAMS]htmtotxt[/PARAMS][SEP]{br}[/SEP][/GETMORECYCLECONTENT]

    И ничего не парсится, что я делаю не так?
    Описание для этой функции очень короткое и видео нет.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Урл забыли (адрес, откуда парсить).
    URL.../URL
     
  6. seokotik

    seokotik New Member Пользователи

    Регистрация:
    14 окт 2012
    Сообщения:
    6
    Если бы это было так.
    У меня прописано так.
    Ссылки недоступны для гостей[START]

    Есть еще варианты?
     
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    как вариант - почитайте описание макроса Ссылки недоступны для гостей
    PHP:
    [GETMORECYCLECONTENT][URL]ссылка[/URL][START]начало парсинга[/START][END]конец парсинга[/END][TOSTART]добавить в начало каждого цикла[/TOSTART][TOEND]добавить в конец каждого цикла[/TOEND][PARAMS]параметры[/PARAMS][SEP]чем разделять циклы[/SEP][/GETMORECYCLECONTENT]
    PHP:
    Заместо [URL]ссылка[/URLвы можете вставить [SOURCE]текст/код[/SOURCE], где текст/код может быть и <CD_GRAN_…!>, и макрос GETMORECONTENTВ этом случаепоиск повторяющихся границ будет осущетсвляться в заданном текст/код.
     
  8. seokotik

    seokotik New Member Пользователи

    Регистрация:
    14 окт 2012
    Сообщения:
    6
    Все уже прочитано, и у меня этот макрос не хочет работать, вот что использую я.
    PHP:
    [GETMORECYCLECONTENT][URL="[FIRST_REPLACE(model.xml?|model-spec.xml?)][CD_DOCURL!][/FIRST_REPLACE]"][/URL][START]<class="user-opinion">[/START][END]</p>[/END][TOSTART][/TOSTART][TOEND][/TOEND][PARAMS]htmtotxt[/PARAMS][SEP]{br}[/SEP][/GETMORECYCLECONTENT]
    Подскажите еще, плиз.
     
  9. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    <CD_DOCURL!>
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вы зачем изменили макрос, у вас URL=", а надо
    PHP:
    [URL]ссылка[/URL]
    Зачем-то еще у CD_DOCURL скобки квадратные заместо угловых поставили.
    Просто прочитайте хелп и разберитесь, все расписано!
     

Поделиться этой страницей