Некоректная работа макроса GETURLSBYANCHORS

Тема в разделе "Решение проблем с использованием программы", создана пользователем localnet, 1 апр 2020.

  1. localnet

    localnet New Member Пользователи

    Регистрация:
    20 авг 2012
    Сообщения:
    19
    парсил Ссылки недоступны для гостей (сайт размещен на локальном сервере, там просто html вида)
    <html>
    <body>
    <a href="Ссылки недоступны для гостей">in http link</a><br>
    <a href="ftp://test.ru/a-test2.html">in ftp link</a><br>
    <a href="Ссылки недоступны для гостей">in https link</a><br>
    <a href="test.ru/a-test4.html">in without prefix link</a><br>
    <a href="./a-test5.html">in dot link</a><br>
    <a href="/a-test6.html">in slash link</a><br>
    <a href="Ссылки недоступны для гостей">out http link</a><br>
    <a href="ftp://outlink.ru/a-test8.html">out ftp link</a><br>
    <a href="Ссылки недоступны для гостей">out https link</a><br>
    <a href="outlink.ru/a-test10.html">out without prefix link</a><br>
    </body>
    </html>

    Макрос [GETURLSBYANCHORS(*[ADDANCHOR])][DOCSOURCE][/GETURLSBYANCHORS]


    Не корректно выдаёт результаты на следующих ссылках.
    Далее:
    html код ссылки
    результат работы программа

    Тут при ссылке на ftp, дописывает ДОМЕН
    <a href="ftp://test.ru/a-test2.html">in ftp link</a><br>
    Ссылки недоступны для гостей
    <a href="ftp://outlink.ru/a-test8.html">out ftp link</a><br>
    Ссылки недоступны для гостей


    Тут дописывает Домен с http://
    <a href="test.ru/a-test4.html">in without prefix link</a><br>
    Ссылки недоступны для гостей
    <a href="outlink.ru/a-test10.html">out without prefix link</a><br>
    Ссылки недоступны для гостей

    А тут дописывает без http://
    <a href="/a-test6.html">in slash link</a><br>
    test.ru/a-test6.html

    P.S. а есть макрос для сборы ссылок из тэгов?
    <link href='Ссылки недоступны для гостей' />
    <form action="Ссылки недоступны для гостей"></form>
     
  2. localnet

    localnet New Member Пользователи

    Регистрация:
    20 авг 2012
    Сообщения:
    19
    Так будут фикситься эти недоразумения?
     
  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Зачем?
    Все и так работает корректно, обычно такие файлы html с недоразумением правятся во время парсинга с помощью глобальной поиск-замена.
     
  4. localnet

    localnet New Member Пользователи

    Регистрация:
    20 авг 2012
    Сообщения:
    19
    Ну во первых, это костыли воротить над макросом, который вроде как для этого и создавался,
    а во вторых, а как?
    kagorec приведите пример, на ссылках из первого поста
     
  5. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    анука ... быстро, человек со среды ждет
     
    kagorec нравится это.
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ну да, хотя бы поздоровались, как минимум.

    По теме: Я пока не могу решать сразу все вопросы мгновенно.
     
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Достаточно иметь базовые знания и смекалку чтоб решать задачу альтернативными способами, которых в C.D. предостаточно. Ниже привел самый упрощенный вариант, но есть и регулярные выражения и повторяющиеся границы и макросы ( кроме GETURLSBYANCHORS).
    Применить поиск-замена в Shift+Ctrl+R
    Код:
    '|"
    <a{skip}href="|<podgotovka="
    <link{skip}href="|<podgotovka="
    <form{skip}action="|<podgotovka="
    <podgotovka="{get}"|{multiget}
    п.с. постарайтесь без хейта отвечать.
     

Поделиться этой страницей