Вставка url страницы парсинга

Тема в разделе "Шаблон вывода", создана пользователем cdcustomer, 11 авг 2012.

  1. cdcustomer

    cdcustomer New Member Пользователи

    Регистрация:
    17 мар 2012
    Сообщения:
    41
    Если макрос позволяющий вставить url страницы с которой осуществляется парсинг?
     
  2. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Вопрос как-то не совсем понятно сформулирован. Вы, наверное хотели сказать: "Есть ли", то есть "существует ли"...? Да, существует. В программе, открыв "Редактор шаблона вывода", с левой стороны вы можете увидеть список всех макросов. Если я правильно понял ваш вопрос, то вам нужен макрос <CD_DOCURL!>, который "вставляет ссылку с того web-документа, с которого осуществляется парсинг". Кроме этого, если вам нужна просто ссылка на "Источник", вы можете проставить галочку в "Дополнительных настройках" в главной вкладке "Контент",- внизу слева,- "Ссылаться на источник". И ссылки на спарсенную страницу будут вставляться в таком виде:
     
    krdin нравится это.
  3. cdcustomer

    cdcustomer New Member Пользователи

    Регистрация:
    17 мар 2012
    Сообщения:
    41
    Да вы правы и ваш ответ исчерпывающий! Спасибо!
     
  4. ahrefer

    ahrefer New Member Пользователи

    Регистрация:
    23 авг 2012
    Сообщения:
    1
    Что бы не создавать новую тему, похожий вопрос:

    как парсить сайт и сохранять его структуру по разделам и url?
    Нужно полностью сохранять сайт и урлы.
     
  5. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Чтобы сохранить спарсенное по разделам или рубрикам, надо эти рубрики настроить, в шаблоне парсинга границы настройки рубрики, должны стоять в первой строчке. Далее, возле поля, в котором задаёте путь сохранения, нужно проставить галочку "Сохранять загружаемые документы и картинки по разным папкам". Будет проставлено то имя папки, которое имеет категория, Из шаблона имя удалится.

    Что такое "сохранять урлы" мне непонятно? Если сохранить имена спарсенных ссылок, то это задаётся в вернем меню "Сервис", "Смотреть лог парсинга контента", далее надо проставить галочку "Сохранять ссылки загруженных элементов в файл". Ссылки сохраняется в той папке куда происходит парсинг, с тем именем, который имеет сам проект
     
  6. possess1on

    possess1on New Member Пользователи

    Регистрация:
    18 мар 2018
    Сообщения:
    2
    Город:
    Astana
    Здравствуйте, подскажите пожалуйста а как в excel вставлять в виде кликабельных гиперссылок
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Насколько я знаю, формат CSV (в который парсите) не поддерживает кликабельные гиперссылки.
     
  8. possess1on

    possess1on New Member Пользователи

    Регистрация:
    18 мар 2018
    Сообщения:
    2
    Город:
    Astana
    Поддерживает, вчера нашел все таки) вот такой =ГИПЕРССЫЛКА("<CD_DOCURL!>")
     
    Root нравится это.
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Спасибо.
     
  10. Vlad_M

    Vlad_M Member Пользователи

    Регистрация:
    12 май 2018
    Сообщения:
    45
    Здравствуйте а если ссылка с редиректом?
    <CD_DOCURL!> получается берёт ту ссылку которая в списке ссылок для парсинга а не ту с которой парсится
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Код:
    [GETREDIRECT][WINLIB]<CD_DOCURL!>[/GETREDIRECT]
     
    ivanoff012 и Vlad_M нравится это.
  12. Dandrei

    Dandrei Member Пользователи

    Регистрация:
    4 ноя 2017
    Сообщения:
    41
    Скажите, а есть ли возможность при парсинге "Ссылки" использовать ЧАСТЬ родительской ссылки.
    Нужна такая конструкция:
    Родительская ссылка: site/XXX/name.com
    В коде находим ссылку: parsing/1/tekst.com
    И на выходе получаем: parsing/XXX/tekst.com

    Возможно ли это реализовать и если да то какими макросами?
     
    Последнее редактирование: 18 окт 2019
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    2019-10-19_08-49-10.png

    Код:
    site/{skip}/|[DONOTHING]
    parsing/{skip}/|parsing/{prevskip}/
    Ссылки недоступны для гостей
     
  14. Dandrei

    Dandrei Member Пользователи

    Регистрация:
    4 ноя 2017
    Сообщения:
    41

    Сергей, спасибо за ответ!
    Только я не сделал важного уточнения - в выдаче родительская ссылка отсутствует.
    И скорее даже вопрос в том, как родительскую ссылку засунуть в код для дальнейшего использования ее части....
     
  15. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Парсите во вкладке «Контент» или «Ссылки»?
     
  16. Dandrei

    Dandrei Member Пользователи

    Регистрация:
    4 ноя 2017
    Сообщения:
    41
    Во вкладке "Ссылки"
     
  17. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Такой возможности нет.

    Под хайдом предоставьте адрес WEB-страницы с аннотацией, где указано, что и во что нужно преобразовать.
     
  18. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    используйте [PARAM] для ссылок
     
  19. Dandrei

    Dandrei Member Пользователи

    Регистрация:
    4 ноя 2017
    Сообщения:
    41
    При использовании такого макроса конструкция получается вида:

    parsing/tekst.com[PARAM]:site/XXX/name.com

    А по факту надо:
    parsing/XXX/tekst.com

    Т.е. данные, передаваемые с [PARAM] идут на выдаче в конце ссылки и с указанием атрибута [PARAM]:

    Или есть возможность передаваемые с данным макросом данные вставить внутрь найденной ссылки?...
     
    Последнее редактирование: 20 окт 2019
  20. maximus

    maximus New Member Пользователи

    Регистрация:
    23 дек 2019
    Сообщения:
    1
    Город:
    Пенза
    Здравствуйте, наверное вопросы лузерские, но разобраться самостоятельно не получается.
    Задача, есть сайт из webархива и его html копия, необходимо всё это перенести на WP, с сохранением структуры url и что бы картинки лежали по старым папкам.
    [​IMG]
    Использовать макрос <CD_DOCURL!>, но как потом сделать что бы страницы были нужного вида после импорта понять не могу, в добавок ко всему url получается вида site.ru/cat1/cat2/заголовок страницы.html, а нужно как я понимаю просто "заголовок страницы.html".
    И ещё такой момент есть такой параметр как "просмотры" числа я в шаблон выделил, как их правильно импортировать в WP так же не знаю, в [postmeta] обрамлять?
     

Поделиться этой страницей