[EXTRACTPHONES] парсит лишние номера телефонов

Тема в разделе "Разное", создана пользователем AlexandrSorokin, 5 май 2020.

Статус темы:
Закрыта.
  1. AlexandrSorokin

    AlexandrSorokin Active Member Пользователи

    Регистрация:
    27 ноя 2018
    Сообщения:
    71
    Город:
    Пермь
    Привет!
    Почему-то странно работает [EXTRACTPHONES].

    Например, сайт Ссылки недоступны для гостей

    [​IMG]

    Телефон всего 1 в шапке.
    А парсится 4 штуки.
    Откуда берутся остальные?
    И как настроить верный парсинг номеров? без мусора

    Шаблон вывода
    Код:
    [EXTRACTPHONES][DOCSOURCE][/EXTRACTPHONES]
     

    Вложения:

  2. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    Привет. Потому-что вы извлекаете телефоны со всей страницы, а там их 4 штуки. Если нужно брать номер из конкретной части страницы, то надо извлекать по конкретному тегу, например в этом теге будет только один номер Ссылки недоступны для гостей, указываете границу парсинга и применяете к этой границе макрос
    [EXTRACTPHONES]
     
  3. AlexandrSorokin

    AlexandrSorokin Active Member Пользователи

    Регистрация:
    27 ноя 2018
    Сообщения:
    71
    Город:
    Пермь
    Спасибо за участие!

    Для очистки мусора, следует указать поиск замену всех placeholder у input и удалить все комментарии, потому что даты в телефоны превращаются

    Код:
    [EXTRACTPHONES]
    [FIRST_REPLACE(<head{skip}head>|
    placeholder="{skip}"|
    <!--{skip}-->|
    <script{skip}script>|
    <style{skip}style>|
    style="{skip}"|)]
    [DOCSOURCE]
    [/FIRST_REPLACE]
    [/EXTRACTPHONES]
     
  4. AlexandrSorokin

    AlexandrSorokin Active Member Пользователи

    Регистрация:
    27 ноя 2018
    Сообщения:
    71
    Город:
    Пермь
    А если у всех сайтов разные места хранения телефонов? у кого в шапке, у кого в подвале, у кого посередине страницы
    Поэтому парсинг со всего документа
     
  5. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    Ну да, или можно костыль применить
     
  6. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    Если с разных сайтов, то со всего документа, только ошибок не избежать, т.к. любое одиннадцатизначное число в коде будет восприниматься как телефон
     
    AlexandrSorokin нравится это.
  7. AlexandrSorokin

    AlexandrSorokin Active Member Пользователи

    Регистрация:
    27 ноя 2018
    Сообщения:
    71
    Город:
    Пермь
    Спасибо за ответ!


    Тему можно закрывать или удалять..
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Можно ввести список кодов в параметре [ALLOW] для фильтрации нежелательных данных.

    Ссылки недоступны для гостей
     
    AlexandrSorokin нравится это.
Статус темы:
Закрыта.

Поделиться этой страницей