Как парсить сайт с тегом href base?

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Odessky, 31 окт 2013.

  1. Odessky

    Odessky New Member Пользователи

    Регистрация:
    29 июн 2013
    Сообщения:
    19
    У сайта тег href base стоит как Ссылки недоступны для гостей
    Все ссылки имеют вид article/category/some.html
    При этом сканер ссылок игнорирует base, делая бесконечное вложение /category без учета base
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    В фильтрах ссылок можно прописывать этот самый href base.
    Напишите, какой сайт парсите, чтобы было понятнее.
    Спасибо!
     
  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Предоставьте часть кода страницы где присутствует href base
    п.с. Нехватает тега HIDE на форуме чтоб пользователи не боялись публиковать ссылки, так накрыл хайдом и быстро решили проблему.
     
  4. lopuhnet

    lopuhnet New Member Пользователи

    Регистрация:
    30 сен 2013
    Сообщения:
    13
    Да простит меня ТС, не могу подготовить импорт фото для опенкарта

    У источника ссылка на фото такого вида:
    group="gallery" href="/upload/iblock/ced/foto.jpg">

    Задаю границы, на выходе получаю ссылку такую:

    <img src="images/foto.jpg">

    Для импорта же нежно такого вида:

    marka/foto.jpg

    Проблема в том, что первые три /../../ разные "/upload/iblock/ced/"

    Можно ли задать что бы программа убирала первые три слэша и что в них находится?
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте. ТСу, думаю, все равно! =)

    [REPLACE(/{get}|{get)]<NIMG>ФОТО</NIMG>[/REPLACE]
     
  6. Odessky

    Odessky New Member Пользователи

    Регистрация:
    29 июн 2013
    Сообщения:
    19
    Спасибо, я нашел где это делать
    Просто до обновления CD брал этот тег автоматически
     

Поделиться этой страницей