Как парсить выдачу результатов с Гугл?

Тема в разделе "Решение различных задач по парсингу", создана пользователем comp56, 10 мар 2018.

  1. comp56

    comp56 New Member Пользователи

    Регистрация:
    25 ноя 2011
    Сообщения:
    18
    Задача такая. Нужно спарсить
    <meta name="description" content=" **** " />
    <meta name="keywords" content="
    **** " />
    с результатов выдачи google.

    Например ищу - строительная компания. Как с результатов Google получить список сайтов для парсинга ? И вставить их в список ссылок.
    Пробовал сканер сайтов но не могу настроить правильно фильтр (
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    У вас есть хорошие прокси? чтоб парсить гугл?
     
  3. comp56

    comp56 New Member Пользователи

    Регистрация:
    25 ноя 2011
    Сообщения:
    18
    парсинг 10-15 страниц результатов примерно. Мне нужна помощь с добавлением результатов страниц в раздел ссылки для парсинга.
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    ЭТО бан айпи или капча 100%
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    На каждый ип прокси примерно по 2-10 запроса и потом идут каптчи. Вот и считайте сколько прокси надо.
    На данный момент в интернете много прокси-сервисов продают заспамленные прокси, которым сразу и всегда будет каптча при парсинге гоогле.
     
    igor333333 и Root нравится это.
  6. igor333333

    igor333333 New Member Пользователи

    Регистрация:
    25 ноя 2017
    Сообщения:
    5
    ПОмогите распарсит 100 страниц Гугл
     
  7. Reset

    Reset Active Member Пользователи

    Регистрация:
    16 дек 2013
    Сообщения:
    114
    А что сложного то ?
     
  8. igor333333

    igor333333 New Member Пользователи

    Регистрация:
    25 ноя 2017
    Сообщения:
    5
    Банит и с прокси даже
     
  9. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Видать прокси - заспамлены
    Как вариант прокси + разгадывание каптчи
     
  10. Reset

    Reset Active Member Пользователи

    Регистрация:
    16 дек 2013
    Сообщения:
    114
    Гугл парсят все кому не лень, конечно у него стоит приличная защита, поэтому 5-7 запросов и гадай капчу.

    Поэтому или приличные прокси или специализированные программы, т.к. рекапча по идее cd не поддерживается
     
  11. XMLRiver

    XMLRiver New Member Пользователи

    Регистрация:
    10 сен 2021
    Сообщения:
    2
    Город:
    Киев
    Можете попробовать Ссылки недоступны для гостей, api привычное (Yandex.XML), CD легко справится с этим форматом
     
  12. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Здравствуйте.
    Возможно вы представитель сервиса XML RIVER, и скидку предоставите для пользователей CD?)
     
  13. bek

    bek Member Пользователи

    Регистрация:
    22 фев 2017
    Сообщения:
    28
    Город:
    Краснодар
    <meta name="keywords" content=" **** " /> не актуален для ПС
    тем более гугл с августа подтягивает снипет из тега h1
     
  14. XMLRiver

    XMLRiver New Member Пользователи

    Регистрация:
    10 сен 2021
    Сообщения:
    2
    Город:
    Киев
    Здравствуйте!
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
    kagorec нравится это.

Поделиться этой страницей