Как спарсить результаты поиска в Linkedin?

Тема в разделе "Решение различных задач по парсингу", создана пользователем VitalyTR, 20 июн 2018.

Метки:
  1. VitalyTR

    VitalyTR Member Пользователи

    Регистрация:
    18 июн 2018
    Сообщения:
    29
    Город:
    Минск
    Дано на входе: страница результатов поиска на LinkedIn - например, такая: Ссылки недоступны для гостей

    LinkedIn выводит список результатов:
    upload_2018-6-20_10-59-3.png

    Надо: получить прямые ссылки на эти профайлы (все, которые в результате поиска, не только первые 3) - они имеют вид Ссылки недоступны для гостей

    А сложность в том, что даже в самом коде страницы не видно этого блока. Если смотреть под отладчиком, то да, код есть:
    upload_2018-6-20_11-9-42.png
    но в HTML-просмотре он закодирован, и программа эту ссылку не видит.
    upload_2018-6-20_11-16-31.png

    Как лечить проблему, как все же спарсить эти ссылки?
     
  2. VitalyTR

    VitalyTR Member Пользователи

    Регистрация:
    18 июн 2018
    Сообщения:
    29
    Город:
    Минск
    Решение использовать WPApp, имитировать клик правой кнопкой мыши по ссылке и копирование в буфер обмена.
    Но проблема в том, что наведение фокуса на данный объект помещает курсор чуть выше, вне зоны <a href> :(
     

Поделиться этой страницей