Как парсить катигории в нестандартном случае

Тема в разделе "Решение различных задач по парсингу", создана пользователем nsklital, 24 дек 2021.

  1. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    добрый день. как спарсить катигории? по хлебным крошкам не выходить спарсить катигории.
    есть такой сайт. сразу пример на товар Ссылки недоступны для гостей
    к примеру катигория Ссылки недоступны для гостей \ Ссылки недоступны для гостей \ Ссылки недоступны для гостей в нем товар Ссылки недоступны для гостей и в этом товаре в крошках показана так Ссылки недоступны для гостей \ Ссылки недоступны для гостей \ Ссылки недоступны для гостей K2 VENA PRO 1L
    то есть теряется Ссылки недоступны для гостей \ Ссылки недоступны для гостей \ как это можно победить?? уже голову сломал((
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Просидел примерно час с этим вопросом. Не решил.

    Тут нужно специальную функцию под это дело писать. Другого способа для решения этой задачи я не нашел.

    Могу взяться за это за 3000 рублей. Думаю, уйдет на это часов 5. Если устроит и это того стоит, пишите.
     
  3. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    это очень дорого. если бы 500 р еще куда не шло ???
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    За 500 рублей не могу потратить на это пол дня.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Наработки по этому вопросу так могу отдать вам. В проекте парсится первая активная рубрика и последняя.

    Если путь состоит из трех элементов, средняя не берется. Под ее взятие, думаю, однозначно нужна спец функция. От этого и стоимость.

    Либо как-то поиск-заменой. Но я не сообразил сразу, как. Больше часа просидел.
     

    Вложения:

    • k2_com_pl.cdp
      Размер файла:
      48,9 КБ
      Просмотров:
      3
  6. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    спасибо большое. та я вчера вообще весь день провел чтоб это решить((( а с помощью PARAM нельзя это решить?
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    На страницах категорий та же самая пагинация.
     
  8. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    а как отключить WBapp использование событий ?? или потом не будет работать? требует Ultimate лицензию.
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Только что сделал обновление.

    Обновите программу.

    Сделал, чтобы можно было парсить через WBAppCEF и в версии Start (но без выполнения списка событий).
     
  10. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    у меня версия не старт. у меня лицензия стандарт
     
  11. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    можите перечислить все варианты работы с катигориями (рубриками) макросы операторы?
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    ПО стандарту макрос [BREADCRUMBS].

    В случае с этим сайтом нужно писать спец функцию или создать очень сложные правила поиск-замены для извлечения рубрик.
     
  13. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    а как отсканировать ссылки товаров в катигории? к примеру Ссылки недоступны для гостей
     
  14. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Файл проекта приложил.

    2021-12-27_01-50-54.png
     

    Вложения:

    • Scaner_3.cdp
      Размер файла:
      43 КБ
      Просмотров:
      1
  15. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    ваш проект работает. добавляю в свой проект. находит 196 ссылок. фильтр ставил на /produkty/ и ?pp= тоже добавил
     
  16. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    В моем проекте применена поиск-замена к исходному коду списка ссылок (кнопка "поиск-замена" в сканере сайтов). Это нужно для парсинга ссылок на товары только из определенной части кода WEB документа.
     
  17. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    супер. нашел. спасибо
     
  18. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    до того как вы написали я организавал немного по другому. через "ограничить область поиска ссылок" и через ?pp={num} но ваш вариант вроде интереснее.
    имею вот еще какой вопрос. в том окне где задавать границы парсинга начала и конец. у вас на видео почему то код сартировон красиво. у меня каша как включить это?
    вот пример моей кашы
    <path d="M1216 832q0-185-131.5-316.5t-316.5-131.5-316.5 131.5-131.5 316.5 131.5 316.5 316.5 131.5 316.5-131.5 131.5-316.5zm512 832q0 52-38 90t-90 38q-54 0-90-38l-343-342q-179 124-399 124-143 0-273.5-55.5t-225-150-150-225-55.5-273.5 55.5-273.5 150-225 225-150 273.5-55.5 273.5 55.5 225 150 150 225 55.5 273.5q0 220-124 399l343 343q37 37 37 90z"/> </svg> </button></form></div></div> <a href="#" class="button white openFilters"><span>
     
    Последнее редактирование: 27 дек 2021
  19. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Некоторые сайты выдают теги скопом. Это уже вопросы к разработчикам сайтов, почему они организовали такой вывод данных.

    Вот решение для удобства.

    2021-12-27_12-20-41.png
     
  20. nsklital

    nsklital New Member Пользователи

    Регистрация:
    24 дек 2021
    Сообщения:
    32
    Город:
    nsever
    большое спасибо получилось. какая разница между стандарт и ультимейт лицензией?
    и можно ли делать парсинг с Excel ??
     
    Последнее редактирование: 27 дек 2021

Поделиться этой страницей