Парсинг ссылок пагинации

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем Stan, 24 ноя 2016.

  1. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    спарсил страницы, с отзывами - первые страницы, их много десятки тысяч, и у них пагинация, есть, от 2 до десятков страниц page=50 и т.д.
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 23 постов.**
    как бы их выпарсить все? (имеется ввиду ссылки страниц с page=1 и т.д)
    с одной страницы максимум берет 7 page=7 допустим,
    а как остальные взять page=8 и т.д.

    написал шаблон на зенке, но там долго как то парсит.
     
    Последнее редактирование: 24 ноя 2016
  2. Reset

    Reset Active Member Пользователи

    Регистрация:
    16 дек 2013
    Сообщения:
    114
    Сканером сайтов вестимо
     
    Root нравится это.
  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    В сканере где правило для ссылок очереди впишите две строки
    Код:
    http://otrude.net/employers/
    ?page=
    также эти строки отметьте в фильтре ссылок
    и отметьте галочку "и\или"
     
    Stan и Root нравится это.
Similar Threads
  1. dmitryt
    Ответов:
    6
    Просмотров:
    1.463
  2. ddeathru
    Ответов:
    4
    Просмотров:
    1.201
  3. 4toy
    Ответов:
    9
    Просмотров:
    1.449
  4. asvv
    Ответов:
    5
    Просмотров:
    1.378
  5. artur
    Ответов:
    2
    Просмотров:
    848
Загрузка...

Поделиться этой страницей