Лишний [NEXTPAIR].

Тема в разделе "Парсинг характеристик товаров", создана пользователем Rosbiz, 18 дек 2017.

  1. Rosbiz

    Rosbiz Member Пользователи

    Регистрация:
    10 ноя 2016
    Сообщения:
    14
    Приветствую.
    Собираю технические характеристики заключенные в теги <dt> и <dd> с большим кол-вом лишнего посредине. Вроде все отфильтровал, но получаю лишний [NEXTPAIR]. Из за этого сбиваются колоноки в [DYNAMICVALUES]
    Уже сломал мозг как это исправить. Помогите пожалуйста, проект прилагаю.
     

    Вложения:

    • isolux_ru2.cdp
      Размер файла:
      35,7 КБ
      Просмотров:
      1
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    2017-12-18_14-01-37.png

    Также не вижу в вашем проекте макроса [DYNAMICVALUES]
     
  3. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте
    Так как вы не предоставили вид конечной таблицы и не описали что именно сбивается то тут есть несколько вариантов и явно проблема не в [NEXTPAIR]
    1) У вас попадает мусор в сам текст, в идеале текст должен быть полностью приведен к нуждам [DYNAMICVALUES] а не просто заменить <dt> и <dd>
    2) У вас возможно <dt> и <dd> имеют внутренние <dt> Это довольно частое явление, но выявляется только при парсинге
    Например имя характеристики "Мощность, Вт" это не тоже самое что "Мощность,Вт"
    3) У вас происходит сбой при парсинге (если например вы через прокси это делаете и получаете бан) и у вас не 1 файл а множество, тогда файлы не сойдутся.
    [DYNAMICVALUES] подразумевает непрерыввный парсинг 1 раз без банов и тд, во всех других случаях нужно использовать более извращенные способы обработки.
     
    Root нравится это.
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Root нравится это.
  5. Rosbiz

    Rosbiz Member Пользователи

    Регистрация:
    10 ноя 2016
    Сообщения:
    14
    Спасибо за ответы и тысяча извинений. Ошибку заметил сам.
    Много возился с фильтрацией поэтому протупил.
    В строку заголовка не был добавлен разделитель [CSVCS] поэтому и сползали колонки
    Скриншот Ссылки недоступны для гостей
    Тему можно убить, что бы не вводить в заблуждение пользователей.
     
    Kreol и Root нравится это.

Поделиться этой страницей