Как скачать файл, спрятанный под javascript'ом.

Тема в разделе "Решение различных задач по парсингу", создана пользователем iSerge, 8 апр 2014.

  1. iSerge

    iSerge New Member Пользователи

    Регистрация:
    8 апр 2014
    Сообщения:
    5
    Всех приветствую, помогите решить задачу.

    Как скачать файлы, спрятанные под яваскрипт таким образом

    <a class="OutLnk" href="javascript:" onclick="downloadPlanGraphDocument(569568);return false;"><span>план-работ на 2014.xls</span></a>

    есть ссылка на файл без расширения, вида сайт.ру/документы?documentId=569571

    В браузере появляется всплывающее окно для сохранения файла на диск.
    Как парсить такие файлы?
     
    Последнее редактирование: 8 апр 2014
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Для загрузки файлов используйте макрос шаблона вывода DOWNLOADFILE.
    То, что вы сказали - не говорит ни о чем, для каждого сайта свои методы...
    Для экономии своего и нашего времени лучше сразу говорить конкретно (давать адрес страницы, с которой парсите).
     
  3. iSerge

    iSerge New Member Пользователи

    Регистрация:
    8 апр 2014
    Сообщения:
    5
    Вот страница с файлами для парсинга
    Ссылки недоступны для гостей
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пришлось немного повозиться.
     

    Вложения:

  5. iSerge

    iSerge New Member Пользователи

    Регистрация:
    8 апр 2014
    Сообщения:
    5
    Спасибо, большое. Все разобрал - теперь стало понятно!
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста. Рады помочь. Обращайтесь!
     
  7. iSerge

    iSerge New Member Пользователи

    Регистрация:
    8 апр 2014
    Сообщения:
    5
    Возникла сложность в названии папки, в которую парсятся все документы с одной страницы.
    Т.е. есть ссылка Ссылки недоступны для гостей и необходимо парсить все доки м нее в папку с названием 676899, взяв ID с конца ссылки.

    Пробовал таким образом

    [DFN][REPLACE(http://zakupki.gov.ru/pgz/public/action/planview/main?source=epz&activeTab=D&planGraphRevisionId=|)]<CD_DOCURL!>[/REPLACE][/DFN]

    понял, что макросы не в нужном порядке вызываются.

    Можете подсказать с этим вопросом?
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Использовать FIRST_REPLACE:
     
  9. iSerge

    iSerge New Member Пользователи

    Регистрация:
    8 апр 2014
    Сообщения:
    5
    Благодарю, во всем разобрался.

    P.S. А пока разбирался уже структуру на сайте поменяли)))
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.
    Не переживайте, верстку сайтов редко меняют, просто вам повезло =)
     

Поделиться этой страницей