Использование макроса [CRAWLER] в повторяющихся границах парсинга (парсинг e-mail с разных сайтов)

Тема в разделе "Макросы шаблона вывода", создана пользователем sotex2, 18 авг 2020.

  1. sotex2

    sotex2 Member Пользователи

    Регистрация:
    12 авг 2020
    Сообщения:
    130
    Город:
    нижний новгород
    Подскажите, как после парсинга адресов сайтов, вытащить емайл адреса из повторяющихся границ.
     

    Вложения:

  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Так же, как и из обычных.
     

    Вложения:

  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
  4. sotex2

    sotex2 Member Пользователи

    Регистрация:
    12 авг 2020
    Сообщения:
    130
    Город:
    нижний новгород
    пробовал я так и видать не заметил, что выводит с одного сайта только в самом конце и то почему то с дублем.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Потому, что на том сайте есть две разных страницы, удовлетворяющие условиям поиска по тексту анкора.
     
  6. sotex2

    sotex2 Member Пользователи

    Регистрация:
    12 авг 2020
    Сообщения:
    130
    Город:
    нижний новгород
    спасибо. там второй сайт и третий нормальный и не заскриптован, но не зацепился.
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Не понимаю. Вы сначала пишите, что третий сайт парсит с дублями, потом пишете, что он "не зацепился". Определитесь.

    Второй сайт
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    По GET запросу отдает код
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Соответственно, имейлов в таком коде не найдет.

    Писать перенаправление для такого почти единичного случая я не вижу смысла.
     
    sotex2 нравится это.
  8. sotex2

    sotex2 Member Пользователи

    Регистрация:
    12 авг 2020
    Сообщения:
    130
    Город:
    нижний новгород
    ссория не мог посмореть и скопировать конкретные адреса, так как был запущен парсинг.
     
    Root нравится это.

Поделиться этой страницей