выпаршивается меньше строк чем загружено

Тема в разделе "Решение проблем с использованием программы", создана пользователем AlexSeo, 19 янв 2023.

  1. AlexSeo

    AlexSeo New Member Пользователи

    Регистрация:
    19 янв 2023
    Сообщения:
    3
    Пытаюсь спарсить 2795 строк (бренд товара), а на выходе получаю 1793 строки (не везде указан бренд). Но строки идут подряд и непонятно на каких страницах спарсилось, а на каких нет
    Раньше вроде было, что если страница не подходит условиям парсинг, то оставалась пустой (но могу ошибаться). Возможно ли сделать строку пустой, если она не удовлетворяет условиям парсинга?

    И вопрос 2.

    если часть кода который находится до нужного фрагмента, дублируется на странице несколько раз, возможно ли выпарсить эту часть? или не получится?

    p/s/ хочется сказать спасибо за софт ) из того что видел, для непрограммиста это очень простой в использовании
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Если код документа абсолютно пустой, то строка в общий результат не добавляется. Очистка происходит автоматически и это обойти нельзя.

    Либо добавьте сохранение еще какой-либо информации (помимо бренда), либо настройте границу парсинга с брендом таким образом, чтобы, если бренд пустой, выводилось, например (Empty).

    Второй вопрос так и не понял, нужен конкретный пример.

    PS: Пожалуйста
     
  3. AlexSeo

    AlexSeo New Member Пользователи

    Регистрация:
    19 янв 2023
    Сообщения:
    3
    по второму вопросу имелось ввиду,

    например:
    мне нужно выпарсить третью строку в таблице, но там, допустим, код:
    <tr>
    <td>X (переменное значение)</td>
    <td>
    нужный кусок</td>
    <td>Y</td>

    т.е. получается у меня из постоянного будет только то что отмечено зеленым, но таких фрагментов на странице много
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Выделите нужный <td> и нажмите F1 (Чтобы задать начало парсинга для второго <td>).
     
  5. AlexSeo

    AlexSeo New Member Пользователи

    Регистрация:
    19 янв 2023
    Сообщения:
    3
    мммм... круть, я думал одинаковые фрагменты путать будет. Спасибо!
     
    Root нравится это.
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста
     

Поделиться этой страницей