Парсинг ссылок с определенным текстом

Тема в разделе "Решение различных задач по парсингу", создана пользователем kadabra12345, 9 апр 2017.

  1. kadabra12345

    kadabra12345 New Member Пользователи

    Регистрация:
    2 апр 2017
    Сообщения:
    5
    Здравствуйте, друзья. Озадачился такой проблемой: Есть довольно большая база урлов сайтов. Нужно спарсить ссылки с текстом "Контакты" или "Обратная связь". Да, проблем не было бы, если бы все ссылки были с одинаковыми алиасами типа "/contacts/", но эти ссылки могут иметь совершенно разные алиасы... и /contacts/, и /kontakt/, и /hren-znaet-chto/.... Поэтому решил шагать от текста ссылки. Я решил парсить все ссылки с главных страниц моих сайтов (это не сложно сделать через повторяющиеся границы парсинга), но как сделать, чтобы программа, перебрав все ссылки на главной, выдала мне в файл только ссылки с текстом "Контакты", "Обратная связь"??? Ткните носом в мануал, где это написано, наверняка ведь кто-то это уже делал. Спасибо)
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Через поисковик работайте, первым этапом формируя запрос для гугла
    Код:
    site:kakoito-sayt.com контакты
     
    Root и kadabra12345 нравится это.

Поделиться этой страницей