Как спарсить ссылки с сайта

Тема в разделе "Решение различных задач по парсингу", создана пользователем Yurijd, 18 дек 2012.

  1. Yurijd

    Yurijd New Member Пользователи

    Регистрация:
    29 мар 2011
    Сообщения:
    18
    Есть сайт mosday.ru . Мне к примеру нужно из этой галере mosday.ru/photos/gallery.php?group=best+church&alt=7 спарсить ссылки на фотки mosday.ru/photos/?38_305

    Как не пробовал не парсятся они почему то?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    1. В фильтре ссылок указать маску в разрешенных photos/?*
    2. Поскольку страниц мало то собирайте "через броузер" - нажмите F6
    3. Теперь в галлерее переходите по страницам очередно 1....4, нажимая периодически клавиши F6 (выделит все) и F2 (выберет ссылки и добавит в главный список)
     
  3. Yurijd

    Yurijd New Member Пользователи

    Регистрация:
    29 мар 2011
    Сообщения:
    18
    Да в том то и дело что ссылок много должно получиться 24000+ Мне нужно выпарсить их все с маской photos/?
    Почему то эту маску не воспринимает программа.
    Причем до того как распарсить с этой маской я выпарсил все ссылки на галереи т.е. там глубина парсинга до нужных ссылок равна 1 должны парситься, но не хотят. Просто хочется понять в чем загвоздка
     
    Последнее редактирование: 19 дек 2012

Поделиться этой страницей