Банально но помогите спарсить определенные категории

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем Gnom41k, 20 июл 2015.

  1. Gnom41k

    Gnom41k Member Пользователи

    Регистрация:
    20 июл 2015
    Сообщения:
    47
    В основном разобрался но с некоторыми сайтами есть проблемы, буду крайне благодарен если Вы мне поможете их решить. Интересуют простые данные - название, артикул, цена
    Итак:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Заранее спасибо за помощь.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    1) Ссылки недоступны для гостей

    2) Постараюсь сделать решение в течении суток

    С уважением к вам, Сергей.
     
  3. Japonec

    Japonec Well-Known Member Пользователи

    Регистрация:
    19 июл 2015
    Сообщения:
    92
    Адрес:
    Kiev
    Частично занялся вашим вопросом, ввел ваш раздел в первой ссылке, потом вытянул ненужные мне там небольше 6 ссылок, и вставил в фильтррацию ссылок, и указал какие ссылки мне нужны, в итоге напарсил все товары, ссылки которых ведут внутрь нужного товара, тоесть полная новость с описанием, ценой и кодом.
    И при задавании первой граници, у меня открылась страница уже с конкретным мне товаром, ну а дальше уже граници ставите, что Вам нужно, и думаю всё норм должно быть.

    Конечно, если я вас понял правильно. Что Вам нужны были с категории внутренние ссылки товаров которые отображались на странице раздела.
     
  4. Japonec

    Japonec Well-Known Member Пользователи

    Регистрация:
    19 июл 2015
    Сообщения:
    92
    Адрес:
    Kiev
    Вот по поводу вашей категории, всё дселал даже код товара, но есть некая помарка, ввиде того, что почему то не для всего товара артикуль вытащился, может там повторяющиеся границу нужно было сделать, но первая ссылка всё как надо.

    Думаю с микромомеентами Вам помогут, или вообще пришлют Вам отельный проект под ваши нужды.

    Извините, что не 100% решил вашу проблему, но очень старался, так как парсер в руках всего сутки)
     

    Вложения:

  5. Gnom41k

    Gnom41k Member Пользователи

    Регистрация:
    20 июл 2015
    Сообщения:
    47
    С уроком все получилось ну и за остальные подсказки тоже большое спасибо. При парсинге родились новые вопросы:

    1. Не могу понять почему не сохраняются или где сохранить список ссылок категорий из которых парсить ссылки на товары. То есть при следующем парсинге нужно снова вручную добавлять все списки категорий чтобы получить список ссылок на сами товары.

    2. Указал файл для сохранения ссылок и не могу понять каким образом или какой кнопкой оставать их оттуда, просто уверен что Вы как разработчик не оставили такое действие на волю копи паста. Снова спасибо за ответы.
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Обновиться до:
    И запустить прикрепленный к сообщению проект (в нем уже настроен сканер).
     

    Вложения:

    • Scaner.cdp
      Размер файла:
      27,1 КБ
      Просмотров:
      33
  7. Gnom41k

    Gnom41k Member Пользователи

    Регистрация:
    20 июл 2015
    Сообщения:
    47
    !За файл спасибо, все работает.
    Скорее всего Ваш ответ не относится к моему вопросу... а если относиться я к сожалению не понял как сохранить список категорий которые в будущем будут парситься и как импортировать список ссылок сохраненный в файл.

    Так же во время парсинга еще одного проекта столкнулся с такой же сложностью. То есть структура сайта до товара идет правильная:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    п.с. заранее спасибо
     
    Последнее редактирование: 21 июл 2015
  8. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте!
    1) какая у вас cms? многие системы не требую наличия отдельного файла с категориями.
    2)
    Не используйте сканер сайтов, напрямую задавайте ссылки с которых получать нужно товар.
    например:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Ясное дело ссылки нужно РУКАМИ добавить в проект
    При использовании ручного метода, у вас пропадет эта проблема.
    А такая ссылка нормально в контенте открывается
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     

Поделиться этой страницей