Ссылки вида [https://www.google.ru/#q=наш_запрос]

Тема в разделе "Решение различных задач по парсингу", создана пользователем rodyeug, 9 янв 2014.

  1. rodyeug

    rodyeug New Member Пользователи

    Регистрация:
    31 дек 2013
    Сообщения:
    19
    хай пипл,

    есть список ссылок как в сабже для парсинга повторяющихся, ну вы понимаете

    проблема в том что когда открываешь задание границ для (повторяющихся) границ, то открывается пустой гугл т.е. без результатов поиска

    подскажите плиииз

    ps замена https на http не помогает
     
  2. rodyeug

    rodyeug New Member Пользователи

    Регистрация:
    31 дек 2013
    Сообщения:
    19
    победил!

    отбой, спасибо
     
  3. anch

    anch New Member Пользователи

    Регистрация:
    15 ноя 2013
    Сообщения:
    4
    Каким образом решил проблему?У меня при парсере ссылок с гугла вылазиет список "гугловских" ссылок.
    Внешнии ссылки сайтов не проходят
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Anch, здравствуйте, конкретно какую ссылку парсите?
    Если типа такой Ссылки недоступны для гостей, то все, что стоит после решетки для гет-запроса не важно. Для гет-запроса параметры прописываются после знака "?", например: Ссылки недоступны для гостей
     
  5. anch

    anch New Member Пользователи

    Регистрация:
    15 ноя 2013
    Сообщения:
    4
    Попробывал убрать решетку, запрос получился вида https://www.google.ru/?q={key} {key2} ,изменений никаких не получил
    [​IMG]
    [​IMG]
     
    Последнее редактирование: 9 янв 2014
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Откройте ссылку Ссылки недоступны для гостей в браузере, выдачу тоже не получите.
     
  7. anch

    anch New Member Пользователи

    Регистрация:
    15 ноя 2013
    Сообщения:
    4
    Изменил запрос на: Ссылки недоступны для гостей и какие гет запросы только не совал, результат тот же.Внешние ссылки сайтов не проходят.
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вот вам, пожалуйста, проект (меню - файл - загрузить проект).
    Если и сейчас не сработает, то может у вас версия программы не самая свежая, или Гугл вас забанил (если забанил, переподключите интернет).
    Желаю успехов! Всегда рады помочь!
     

    Вложения:

    • google_com.cdp
      Размер файла:
      25 КБ
      Просмотров:
      17
  9. anch

    anch New Member Пользователи

    Регистрация:
    15 ноя 2013
    Сообщения:
    4
    Проблему решил, благодаря вам, спасибо, но возникла тут же другая, например при парсере ссылок вида site.ru/name.php?id=12 урл сохраняется не корректно, отображается
    урл вида: site.ru/name.php%3Fid%3D12
    На сколько я понял он не сохраняет знаки ? и = а заменяет их,возможно ли как то это обойти?
    п.с. при переходе на спарсенную ссылку ответа от сервера нет, т.е этой страницы не существует.
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.
    В фильтрах ссылок есть поиск-замена.
    Замените:
    %3F|?
    %3D|=
     

Поделиться этой страницей