Не сохранять страницу если длина определенного поля менее Nсимволов

Тема в разделе "Решение различных задач по парсингу", создана пользователем v2254303, 27 ноя 2017.

  1. v2254303

    v2254303 Member Пользователи

    Регистрация:
    12 июн 2017
    Сообщения:
    29
    Город:
    Самара
    Доброго вечера. Помогите советом как не сохранять данные если одно из полей менее допустим 300 символов.
    Я нашел про [DIGIFILTER] но думаю это мне не поможет.
    Спасибо и всем добра и теплой зимы
     
  2. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    Добрый день.
    Воспользуйтесь макросом Ссылки недоступны для гостей совместно с [CHARCOUNT].

    Используйте Ссылки недоступны для гостей по форуму.
    Не сохранять документ если в заголовке символы, буквы и длина его меньше, чем..
    Повторяющиеся границы - не парсить текст менее N символов
     
    Последнее редактирование: 28 ноя 2017
    kagorec и Root нравится это.
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    [CHECKENTRY([ANYTEXT])][COPY:301|1]<CD_GRAN_1!> (ОДНО ИЗ "ПОЛЕЙ")[/COPY][ELSETEXT][FILTERDOCUMENT][/CHECKENTRY]
     
    xLime и kagorec нравится это.
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    В поиск-замена добавить проверку регулярным выражением, если до 300 символов, то удаляем все
    Код:
    re:^.{0,300}$|
    и получаем пустоту выводимую границей в шаблоне вывода, далее макросы можно использовать [IFNIL] или [MUSTBIEMACRO]
     
    Последнее редактирование: 21 май 2019
    mur и xLime нравится это.
  5. Petruha

    Petruha New Member Пользователи

    Регистрация:
    26 янв 2015
    Сообщения:
    12
    Здравствуйте, дабы не плодить темы, схожая проблема прокси мрут и банятся так быстро, что нужно какое-либо решение для проверки длины статьи и если оно скажем также ниже 300 символов, отправлять URL, на повторный парсинг с новым прокси, Root взял вашу конструкцию и прописал так:
    <h3><CD_GRAN_1!></h3>[CHECKENTRY([ANYTEXT])][COPY:301|1]<CD_GRAN_2!>[/COPY][ELSETEXT][RELOADDOCUMENT][/CHECKENRTY]
    но все равно сохраняет страницу заглушки забаненого прокси, хотя по логам вроде и пытается 2-3 раза отправить страницу на перезагрузку с новым прокси. Может что-то иначе прописать?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Увеличьте максимальное количество срабатываний для макроса [RELOADDOCUMENT]

    2018-03-20_03-01-01.png
     
    Petruha нравится это.
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    2018-03-20_03-02-26.png
     
    Petruha нравится это.
  8. mur

    mur New Member Пользователи

    Регистрация:
    5 июн 2014
    Сообщения:
    44
    здесь двоеточие не нужно? re:

    каким будет выражение: "если БОЛЬШЕ 300 символов, то удаляем все" ?
     
  9. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Код:
    re:^.{300,}$|
     
    Root и mur нравится это.
Similar Threads
  1. jozess
    Ответов:
    2
    Просмотров:
    1.268
  2. jozess
    Ответов:
    12
    Просмотров:
    1.056
  3. rmano
    Ответов:
    7
    Просмотров:
    714
  4. _Den_
    Ответов:
    0
    Просмотров:
    303
  5. _Den_
    Ответов:
    0
    Просмотров:
    288
Загрузка...

Поделиться этой страницей