Про повторяющиеся границы

Тема в разделе "Границы парсинга", создана пользователем mos, 28 мар 2017.

  1. mos

    mos New Member Пользователи

    Регистрация:
    15 янв 2013
    Сообщения:
    6
    Вопрос в следующем:
    Есть некая повторяющаяся граница, которая содежит данные. Всего этой повторяющейся границе соотвествуют 10 кусков контента.
    В основном контент внутри повторязщейся границы разбит на 3 части последовательные части ОДИН: ДВА: ТРИ:, но бывает, что какие то части осуствуют и может быть 2 1 или 0
    Вопрос можно ли каким либо макросом или способом вытаскивать все данные в соотвествующие столбцы таблицы, а тех которых нет тоже вытаскивать в столбцы csv (аналогично как будто данные есть) , но присваивать им значение , например 0 или произвольный текст или пустую ячейку.

    Спасибо
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
  3. mos

    mos New Member Пользователи

    Регистрация:
    15 янв 2013
    Сообщения:
    6
    Уточню.
    Есть повторяющаяся граница (10 кусков ей соотвествует на странице парстинга), а ВНУТРИ границы есть еще 3 повторящиеся границы ОДИН ДВА ТРИ, которые в основном повторяются, но бывает что какая то из границ (или 2 или все 3) отсутствует и тогда контент выглядит (вместо ОДИН ДВА ТРИ) вот так ОДИН ТРИ / ОДИН ДВА / ДВА ТРИ / ОДИН/ ДВА / ТРИ итд и недостающие куски (те что пропущены) тоже надо вытаскивать и помещать в ячеку csv но с пометкой какой то


    например граница содежит все давнне ОДИН ДВА ТРИ их мы можем корректно поместить в csv в соотвествующих столбцах (цифры это столбцы) Тут проблем нет:
    1 2 3
    ОДИН ДВА ТРИ

    теперь рассмотрим случай, когда данные не полны, а именно, например, граница соджержит только ОДИН ТРИ, то есть отсуствует ДВА и вот ее тоже надо поместить в ячеку, но указать, что она пуста и заполнить произвоьным значением, например текстом ПУСТО. В итоге надо получить данные в таком виде (см ниже).

    1 2 3
    ОДИН ПУСТО ТРИ

    То есть чекто структурированном виде каждое поле в своей ячейке, даже если данных нет
     
    Последнее редактирование: 28 мар 2017
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Мне кажется вы не тем способом парсите. Опишите задачу.
     
  5. mos

    mos New Member Пользователи

    Регистрация:
    15 янв 2013
    Сообщения:
    6
    звонил вам в ватсап, нет ответа.


    Попробую еще раз здесь

    Есть список страниц. На каждой странице есть повторяющаяся граница. На одной странице этой границе может соотвествестовать всего 1 кусок контента, а на другой странице 10 кусков, на третьей 4 куска итд, то есть полный рандом от страницы к странице.

    Внутри каждого такого куска есть еще повторяющиеся границы всего их 6 штук, 3 из них приличествуют всегда, а три оставшиеся "плавают" от куска к куску в рамках одной и той же страницы . Задача вытащить из куска данные в столбцы, если данные пусты - заполнить ячейку корректно каким либо значением, а не просто пропускать, как будто данных нет. Например вместо 6ти столбцов делает всего 5, а необходимо заполнять все 6 но отсутствующее(ие) значение заполнять строкой ПУСТО.
     
    Последнее редактирование: 28 мар 2017
  6. mos

    mos New Member Пользователи

    Регистрация:
    15 янв 2013
    Сообщения:
    6
    в общем сделал через обычные границы внутри повторяющейся границы
    спасибо
     

    Вложения:

  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Так и нужно было!
     

Поделиться этой страницей