Не записывать в результирующий файл строки в которых одна из границ пустая

Тема в разделе "Обработка данных при парсинге во вкладке "Контент"", создана пользователем CSVCS, 29 июл 2019.

  1. CSVCS

    CSVCS New Member Пользователи

    Регистрация:
    28 дек 2016
    Сообщения:
    42
    Добрый день.
    Произвожу парсинг интернет-магазина, в котором отсутствующие товары не скрываются. В итоге получаю результирующий CSV файл, в т.ч. с товарами поле наличия, у которых пустое, т.к. при парсинге программа не находит у этого товара в коде заданных границ парсинга для этого поля. Далее приходится в ручную редактировать CSV файл, удаляя отсутствующие товары.

    Вопрос:
    можно ли задать какое-то условие, чтобы товары с "пустым" результатом определенной границы парсинга сразу не попадали в результирующий CSV файл.

    Вопрос №2: можно ли как-то задать для вывод построчно в CSV файл с сортировкой в алфавитном порядке по одной из границ парсинга, в моём случае - это название товара.

    Т.е. сейчас так:
    1. Артикул 585857; Арбуз с косточками ...
    2. Артикул 545454; Дыня спелая ...
    3. Артикул 578795; Арбуз без косточек ...

    Надо так:
    1. Артикул 578795; Арбуз без косточек ...
    2. Артикул 585857; Арбуз с косточками ...
    3. Артикул 545454; Дыня спелая ...

    п.с. по обоим вопросам, на самом деле отредактировать результирующий файл в excel не проблема, просто таких файлов много и парсинг осуществляется периодически, поэтому, сразу бы получить заветный результат было бы суперски.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    12.562
    Здравствуйте.

    1) 2019-07-29_15-09-33.png

    2) 2019-07-29_15-07-56.png
     
    CSVCS нравится это.
  3. CSVCS

    CSVCS New Member Пользователи

    Регистрация:
    28 дек 2016
    Сообщения:
    42
    @Root , здравствуйте.
    Эта настройка сортирует столбцы в алфавитном порядке (по значению первой строки), т.е. получается файл в котором столбцы идут так
    url Артикул Бренд и т.д.
    А надо, чтобы строки сортировались в алфавитном порядке, причем по одному столбцу - наименование...
     
    Последнее редактирование: 6 авг 2019
  4. CSVCS

    CSVCS New Member Пользователи

    Регистрация:
    28 дек 2016
    Сообщения:
    42
    @Root здравствуйте!
    Скажите, пожалуйста, а нет ли еще какого-нибудь способа сделать действие противоположное этому
    т.е., надо наоборот, если граница окажется НЕ пустой, то тогда документ не должен сохранятся?
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.897
    Город:
    Riga
    Пробуйте CHECKENTRY в связке с CLEARDOC
     
    Root нравится это.
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    12.562
    Код:
    [CHECKENTRY([ANYTEXT])]<CD_GRAN_1!>[THENTEXT][CLEARDOC][SKIPFILESDOWNLOADING][/CHECKENTRY]
     
    CSVCS нравится это.
  7. CSVCS

    CSVCS New Member Пользователи

    Регистрация:
    28 дек 2016
    Сообщения:
    42
    Супер! Спасибо! Все получилось.
    Конструкция также работает и с повторяющейся границей внутри <CD_CYCLE_GRAN_1!>

    А можно еще как-то исключить из результата документы содержащие в одной границе определенные значения?

    Задача в парсинге товаров интернет-магазина. Нужно, чтобы товары с определенными артикулами не попадали в результат парсинга.
     
  8. CSVCS

    CSVCS New Member Пользователи

    Регистрация:
    28 дек 2016
    Сообщения:
    42
    В доп.настройках границы сделал её обязательной и добавил в поле поиск/замена все ненужные артикулы
    Код:
    артикул1|
    артикул2|
    и т.д.
    получилась внушительная портянка) может можно как-то через запятую прописать или вообще по-другому это сделать?
     
  9. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.897
    Город:
    Riga
    Используйте фильтр документов по списку слов Shift+Ctrl+f
     
    CSVCS и Root нравится это.

Поделиться этой страницей