Повторяющиеся границы при парсинге

Тема в разделе "Решение различных задач по парсингу", создана пользователем smart, 13 дек 2013.

  1. smart

    smart New Member Пользователи

    Регистрация:
    22 авг 2013
    Сообщения:
    4
    Добрый день коллеги,

    Пользуюсь 7 версией, но не могу нормально освоить парсинг с повторяющимися границами.
    Перечитал мануалы вдоль и поперек, но выдачу в CSV все равно не могу получить с повт. границами:

    Есть каталог
    на каждой страниц 1 общее описание и список компаний с адресами
    нужно в CSV чтобы под каждую компанию была отдельная строка, а описание одинаковое на каждую

    Код:
    Стандартное описание для всех добавляю в <CD_GRAN_1!> до <CD_GRAN_10!>
    PHP:
    <div class="halfed">
            <
    div style="padding-right: 10px;">
            
                <
    div class="h2-wrapper">
                    
                    <
    h2 class="card">Информация</h2>
                    <
    div class="clear"></div>
                </
    div>
                
                <
    ul class="dl-in-card fixedWidth" style="float: left;">
                  <
    li>
                    <
    span class="dt"><dfn>неповторяющиеся тексты тут</dfn></span>
                   </
    li>
    Код:
    Повторяющиеся границы, тут код повторяющегося блока целиком
    PHP:
    <h2 class="card card-woLi">новый товар 1<br /><span class="sub">тип товара</span></h2>
      <
    div class="c_valid c_valid_green">
      
          <
    div class="c_valid_l">дата</div>
      <
    ul class="dl-in-card dl-in-card-16">
        <
    li>
          <
    span class="dt"><dfn>описание1</dfn></span>
          <
    span class="dd">содержание1</span>
        </
    li>
        <
    li>
          <
    span class="dt"><dfn>описание2</dfn></span>
          <
    span class="dd">содержание2</span>
        </
    li>
        <
    li>
          <
    span class="dt"><dfn>описание3</dfn></span>
          <
    span class="dd">содержание3
     
        
    </span>
        </
    li>
      </
    ul>

      <
    h2 class="card card-woLi">новый товар 2<br /><span class="sub">тип</span></h2>
      <
    div class="c_valid c_valid_green">


    нужно получить в итоге

    общее описание1;общее описание2;общее описание3;новый товар1;тип1; дата1;содержание1
    общее описание1;общее описание2;общее описание3;новый товар2;тип2; дата2;содержание2
    общее описание1;общее описание2;общее описание3;новый товар3;тип3; дата3;содержание3
    общее описание1;общее описание2;общее описание3;


    Я прописал стандартные границы
    1-9

    Стандартные границы для повторяющегося содержимого
    10-18

    Повторяющиеся границы 1 задал
    card card-woLi"> до <h2

    в настройках повт границ указал
    [GRAN10];[GRAN11];[GRAN12];[GRAN13];[GRAN14];[GRAN15];[GRAN18];

    В шаблоне вывода
    <CD_GRAN_1!>;<CD_GRAN_2!>;<CD_GRAN_3!>;<CD_GRAN_4!>;<CD_GRAN_5!>;<CD_GRAN_6!>;<CD_GRAN_7!>;<CD_GRAN_8!>;<CD_GRAN_9!>;<CD_CYCLE_GRAN_ALL!>

    но после 9 границы ничего не выводит в файл.:headbang:

    Просьба помочь с настройками, где ошибка?
     
  2. smart

    smart New Member Пользователи

    Регистрация:
    22 авг 2013
    Сообщения:
    4
    В общем разобрался по видео, я выбирал ПОВТОРЯЮЩИЕСЯ границы в общем меню с обычными,
    когда переделал все то же самое с кнопкой SET вопрос решился.

    Теперь косметические вопросы остались,
    как в файле вывода убрать лишние теги HTML
    нигде галочка HTML-TXT не стоит, ставил -убирал никакой реации.



    /link/?to=www.ццц.ru" target="_blank">Ссылки недоступны для гостей

    <h2 class="card card-woLi slider up"> <a href="#" class="slider">текст1</a><br />
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Поиск-замена, макрос шаблона вывода REPLACE:
    <{skip}>|
    Удалит все теги...
     

Поделиться этой страницей