Категории взять из карточки

Тема в разделе "Решение различных задач по парсингу", создана пользователем Grafin, 29 июн 2019.

  1. Grafin

    Grafin Member Пользователи

    Регистрация:
    14 ноя 2018
    Сообщения:
    130
    Город:
    Киров
    Доброго времени.
    Столкнулся с необычным представлением категорий в карточке.
    Не могу понять как собрать.
    В карточке есть часть ссылки только на нижнюю (материнскую) категорию, в которой и лежит данный товар.
    Выше по коду в карточке структура всех категорий на сайте, названия и ссылки.
    Идея такая: зная ссылку на материнскую категорию, как найти ее же на участке кода выше и взять ее с названием (только ее) и ее верхние категории через повторяющиеся граница с предварительной поиск-заменой?

    Товар Ссылки недоступны для гостей

    Часть кода с частью ссылки на категорию товара
    <a class="backButton" href="/eshop_group/item/id/440/">Возврат на предыдущую страницу</a>

    Часть кода, где есть материнская категория (для наглядности разбил по строкам)
    </div><div class="level0" ><a href='/eshop_group/item/id/1002/' >15. АКСЕССУАРЫ ДЛЯ ДЕТЕЙ</a><span class='pip'></span>
    </div><div class="subs"><div class="subGroup" ><a href='/eshop_group/item/id/1035/' >АКВАГРИМ ДЛЯ ДЕТЕЙ</a>
    </div><div class="subGroup" ><a href='/eshop_group/item/id/438/' >БАТАРЕЙКИ</a><span class='pip'></span>
    </div><div class="nextSub"><a class="nextSub-item" href='/eshop_group/item/id/443/' >Батарейки БОЧОНКИ</a>
    <a class="nextSub-item" href='/eshop_group/item/id/441/' >Батарейки КРОНА</a>
    <a class="nextSub-item" href='/eshop_group/item/id/440/' >Батарейки МИЗИНЧИКОВЫЕ</a>
    <a class="nextSub-item" href='/eshop_group/item/id/442/' >Батарейки ПАЛЬЧИКОВЫЕ</a>
    <a class="nextSub-item" href='/eshop_group/item/id/439/' >Батарейки ТАБЛЕТКА</a>
    </div><div class="subGroup" >

    Необходимая структура категории на выходе "15. АКСЕССУАРЫ ДЛЯ ДЕТЕЙ-БАТАРЕЙКИ-Батарейки МИЗИНЧИКОВЫЕ"

    upload_2019-6-29_7-31-38.png
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    2019-06-29_08-14-18.png

    Код:
    a class="backButton" href="{skip}"|[DONOTHING]
    a class="nextSub-item" href='{prevskip}'{skip}</a>|a class="subcat" href='{prevskip}'{skip}[CURRENTCATMARKER]
    [CURRENTCATMARKER]{skip}<div class="level0" >|[CURRENTCATSMARKER]<div class="level0" >{skip}[/CURRENTCATSMARKER][REV]
    [CURRENTCATSMARKER]{get}[/CURRENTCATSMARKER]|{get}
    <a class="nextSub-item"{skip}</a>|
    <div class="nextSub">{skip}<div class="subGroup"{skip}<div class="subs">|{skip(1)}[REV]
    <{skip}>|
    [DELEMPTYSTRINGS]
    >|
    {br}|-
     |
    Если не будет работать корректно для всех товаров, вам придется подключать специализированный PHP-скрипт для извлечения названий рубрик для этого сайта.
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Подправил съедание пробелов

    Код:
    a class="backButton" href="{skip}"|[DONOTHING]
    a class="nextSub-item" href='{prevskip}'{skip}</a>|a class="subcat" href='{prevskip}'{skip}[CURRENTCATMARKER]
    [CURRENTCATMARKER]{skip}<div class="level0" >|[CURRENTCATSMARKER]<div class="level0" >{skip}[/CURRENTCATSMARKER][REV]
    [CURRENTCATSMARKER]{get}[/CURRENTCATSMARKER]|{get}
    <a class="nextSub-item"{skip}</a>|
    <div class="nextSub">{skip}<div class="subGroup"{skip}<div class="subs">|{skip(1)}[REV]
    <{skip}>|
    [DELEMPTYSTRINGS]
    >|
    {br}|-
    - |-
     
  4. Grafin

    Grafin Member Пользователи

    Регистрация:
    14 ноя 2018
    Сообщения:
    130
    Город:
    Киров
    Ввел в закладке контент
    На страницах код перестал загружаться

    На обсуждаемой карточке вместо кода выводит в любой границе структуру категории карточки
    upload_2019-6-29_8-47-48.png

    Другая карточка тоже Ссылки недоступны для гостей
    upload_2019-6-29_8-46-24.png

    В этой карточке и категории не выводит
    Ссылки недоступны для гостей
     

    Вложения:

    Последнее редактирование: 29 июн 2019
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ну а зачем вы поиск-замену для извлечения рубрик прописали в shift+ctrl+r.

    Раз не работает на всех товарах, тогда специализированный PHP-скрипт для извлечения названий рубрик, как я писал выше.
     
  6. Grafin

    Grafin Member Пользователи

    Регистрация:
    14 ноя 2018
    Сообщения:
    130
    Город:
    Киров
    Специализированный скрипт каким образом получить?
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Просто поместите в шаблон вывода
    Код:
    [REPLACE(a class="backButton" href="{skip}"|[DONOTHING]{break}|{get}|{prevskip}{break}href='{prevskip}'{skip}</a>|<href='{prevskip}'{skip}[CURRENTCATMARKER]{break}[CURRENTCATMARKER]{skip}<div class="level0" >|[CURRENTCATMARKER]{skip}[/CURRENTCATMARKER][REV]{break}[CURRENTCATMARKER]{get}[/CURRENTCATMARKER]|[CURRENTCATMARKER]{get}[/CURRENTCATMARKER]{break}[/CURRENTCATMARKER]{skip}<href='{skip}<span class='pip'>|<href='{skip(1)}[/CURRENTCATMARKER][REV]{break}[/CURRENTCATMARKER]{skip}<href='{skip}<div class="subGroup" >{skip}<div class="subs">|{skip(2)}<href='{skip(1)}[/CURRENTCATMARKER][REV]{break}[CURRENTCATMARKER]|{break}[/CURRENTCATMARKER]|{break}</a>|-{break}<{skip}>|{break}{br2}|)][DOCSOURCE][/REPLACE]
     

    Вложения:

  8. Grafin

    Grafin Member Пользователи

    Регистрация:
    14 ноя 2018
    Сообщения:
    130
    Город:
    Киров
    Сергей, проект не увидел. Видимо вы добавили его уже после.
     
    Root нравится это.

Поделиться этой страницей