Установка условия для парсинга

Тема в разделе "Решение различных задач по парсингу", создана пользователем 0619225, 17 апр 2018.

  1. 0619225

    0619225 New Member Пользователи

    Регистрация:
    28 мар 2018
    Сообщения:
    67
    Город:
    Подольск
    На странице сайта то начинается с одного дива то с другого.
    Нужно сделать условие начать с этого дива если нет его, то с другого парсить.
    Начало не на всех страницах есть <div class="блок-1">
    <div class="блок-2">
    <div class="конец">
     
    Последнее редактирование: 17 апр 2018
  2. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    [REPLACE(<div class="блок-1">{AUTO}div|{AUTO}{GETMETHOD}{break_if_not_nil}{reset_if_nil}<div class="блок-2">{AUTO}div|{AUTO}{GETMETHOD})][DOCSOURCE][/REPLACE]
     
  3. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    Добрый день.

    [​IMG]
     
    Felix_b и Root нравится это.
  4. 0619225

    0619225 New Member Пользователи

    Регистрация:
    28 мар 2018
    Сообщения:
    67
    Город:
    Подольск
    Спасибо огромное!:)

    И еще одна хрень
    При замене
    <table class="data"><tbody><tr>| <table class="sony"><tbody><tr class="ooo">
    На некоторых страницах не меняется, что за косяк может быть?
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Посмотрите код, к которому применяется поиск-замена в логе в нижней части окна предпросмотра результатов парсинга контента.
     
  6. 0619225

    0619225 New Member Пользователи

    Регистрация:
    28 мар 2018
    Сообщения:
    67
    Город:
    Подольск
    Не меняется и все тут, в логе ничего что бы указывало на ошибки не вижу
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Приложите проект, в котором будет одна ссылка с указанной проблемой.
     
  8. 0619225

    0619225 New Member Пользователи

    Регистрация:
    28 мар 2018
    Сообщения:
    67
    Город:
    Подольск
    Проект
     

    Вложения:

    • site.cdp
      Размер файла:
      35,5 КБ
      Просмотров:
      2
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Функция htm to txt удаляет классы тегов. Поэтому поиск-замену нужно применять уже без классов тегов.

    2018-04-17_17-28-41.png
     
    xLime нравится это.

Поделиться этой страницей