Парсинг значений прокси отдающихся скриптом

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем infernalrain, 5 янв 2016.

  1. infernalrain

    infernalrain New Member Пользователи

    Регистрация:
    5 янв 2016
    Сообщения:
    21
    Здравствуйте.

    Есть ресурс с проксями:_http://seprox.ru/ru/proxy_filter/0_0_0_0_0_0_0_0_0_0.html
    Внизу страницы есть меню пагинации страниц ( с 1 до 85)

    Необходимо спарсить с этих 85-и страниц все имеющиеся значения прокси.

    Проблема возникла в том, что прокси-адреса в коде страницы отдаются скриптом. В настройках я применил использование IE DOM.
    В формате htm значения прокси появляются, но есть ряд проблем (приложен мой пример файла):

    1. Можно ли вывести значения прокси в обычный txt файл в столбик (т.е. каждый прокси с новой строки). Сейчас в txt выводятся данные скрипта, а не нужные значения прокси.

    2. Если нельзя вывести в txt, то как настроить шаблон вывода что бы в htm значения были не в строку, а в столбец ( т.е. каждый прокси с новой строки)

    3. Значения прокси дублируются при выводе. В чем моя ошибка в шаблоне вывода?
     

    Вложения:

    • seprox_ru.cdp
      Размер файла:
      28,1 КБ
      Просмотров:
      2
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Проект настроек приложил. Если будут нужны пояснения - обращайтесь.

    С уважением к вам, Сергей.
     

    Вложения:

    • seprox_ru.cdp
      Размер файла:
      33 КБ
      Просмотров:
      20
  3. infernalrain

    infernalrain New Member Пользователи

    Регистрация:
    5 янв 2016
    Сообщения:
    21
    Здравствуйте.
    Спасибо, пояснения не нужны, я все понял.
     

Поделиться этой страницей