Сканер сайтов не находит ссылки (ссылки не в стандартных тегах)

Тема в разделе "Сбор ссылок сканером сайтов", создана пользователем Stan, 7 июн 2017.

  1. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    Здравствуйте.
    Собираю ссылки сканером, а в коде сайта есть ссылки
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 5 постов.**
    Т.е. вместо Href там data-link, и соот-но программа их не собирает. Как тут быть?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    2017-06-07_15-44-43.png
     
    Stan нравится это.
  3. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    эти ссылки потом попадают в список очереди .
    а как сделать чтобы в очередь попадали все ссылки с сайта , а отсеивались только из кода такого <div class="name"><a href="{get}"> ?

    вроде как то делал на одном сайте, а сейчас не получается.
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    В текстовое поле функции поиск-замены добавить следующее правило:
    Код:
    <div class="name"><a href="{skip}">|
    2017-06-25_23-59-04.png
     
  6. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    чот не получается
    вот страница
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 5 постов.**
    не берет так ссылки на товары
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вы сначала говорите про отсеивание, теперь вам надо их парсить. Выражайтесь, пожалуйста, однозначно!

    Не буду переделывать по нескольку раз из-за некорректных изъяснений. Способ отсеивания лишнего исходного кода для очереди сканера я указал. Думайте.
     
    Последнее редактирование: 26 июн 2017
  8. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    да, я имел ввиду что сканер бегает по всему сайту, добавляет в очередь все ссылки с сайта, а в выдачу ссылок добавлял бы только ссылки которые находятся в коде
    <div class="name"><a href="{skip}">, эти ссылки на товары.
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    В написанном вами тексте речь шла о попадании и одновременном отсеивании ссылок списка очереди (что я так и не смог понять, как это может быть). Что вы думали - мы не знаем. Пытались осознать написанное и сделали с ваших слов более-менее подходящее предположение, что требуется в итоге получить. Работу по запросу сделали. Переделывать не намерены.

    PS: Халатное отношение к письменному выражению мыслей (со стороны многих пользователей) сильно подрывает желание вообще разбираться в их текстах. Сначала разгадываешь текстовые ребусы, затем переделываешь по нескольку раз работу, зачем...

    Если человек рассчитывает на бесплатную помощь он обязан позаботиться о том, поймет ли его человек, к кому он обратился. Чтобы не потребовались различного рода уточнения на всю страницу или лишние многократные переделки.
     
    Последнее редактирование: 26 июн 2017
    Stan нравится это.
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Код:
    <div class="name"><a href="{get}">|<a href="{multiget}">
    2017-06-26_01-05-14.png
     
    Stan нравится это.
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    2017-06-26_01-06-43.png
     
    Stan нравится это.

Поделиться этой страницей