помогите собрать ссылки.

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем seven, 4 июн 2014.

  1. seven

    seven New Member Пользователи

    Регистрация:
    30 ноя 2013
    Сообщения:
    17
    Добрый день всем!
    никак не могу одолеть задачку. есть сайт -донор
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    категория карты памяти, если скролить вправо то кол-во страниц доходит до 100 - это по 6 наименований на стр. = 600 шт.
    моя задача собрать все ссылки на товар. каким образом лучше в этом примере сделать? настраивал разными способами собираю не больше 300 остальные теряются:headbang:
    .. кто знает как, посоветуйте.
     
    Последнее редактирование модератором: 5 июн 2014
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте =)

    Посмотрите вот эту ссылку:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Где page=3 - номер страницы.
    Генерируете Ссылки недоступны для гостей и вперед во вкладку контент повторяющимися границами парсить ссылки...

    А как, навскидку, изучая код
    Видим там Slug, это, походу и есть часть ссылки.
     
  3. seven

    seven New Member Пользователи

    Регистрация:
    30 ноя 2013
    Сообщения:
    17
    спасибо большое!
    идея отличная. но, но...
    настроил, в результатирующем файле все-равно половина дублей вылазит(((
    есть идеи почему?
     

    Вложения:

  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Могу подсказать, если вам важны категории при парсинге, то во вкладке "ссылки" вручную назначить каждой ссылке PARAM с именем категории/подкатегории/подподкатегории. Примертого как делал:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Подключив WBapp идет прокликивание до остановки по прокрутке списка товара, после остановки начинается процесс сборки ссылок. (с одной ссылки категории и по 50 и по 600 товаров бывает)
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    А удалить дубли из списка ссылок через правый клик перед парсингом вас не устроит?)
     
  6. seven

    seven New Member Пользователи

    Регистрация:
    30 ноя 2013
    Сообщения:
    17
    да
    я понимаю как удаляются дубли..
    я об этом и писал
    где остальные ссылки на товар? вот непонятно.:wtf:

    WBapp - хорошо.
    но имею лицензию 10.9928 start...
    так категории абсолютно не важны, важно собрать все ссылки на товар в опр категории (с напр. категории "флешки" для дальнейшего парсига хар-к и т.д)
    вот так.
     
    Последнее редактирование: 5 июн 2014
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Собираем ссылки на товары со 100 страниц
     

    Вложения:

  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Удаляем дубли ссылок и их остается 304.
    Делаем вывод, что выдача магазина содержит 304 разных флешки (51 уникальная страница по 6 товаров (последняя содержит 4 товара)).
    Некоторые магазины делают бесконечное количество псевдо-страниц для того, чтобы казалось, что у них море товаров, на самом деле товары могут повторяться.
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Может я ошибаюсь, но к этому выводу я пришел и дальше идти в этом направлении не собираюсь =)
     

Поделиться этой страницей