Помогите новичку спарсить базу резюме)) сайт под хайдом

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем romanvl, 25 фев 2014.

  1. romanvl

    romanvl New Member Пользователи

    Регистрация:
    21 фев 2014
    Сообщения:
    18
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Уважаемые гуру!

    основная проблема - электропочта под кнопкой, и как-то хитро подгружается.

    Вроде начал постигать основы парсинга и ... пока не получается, понимаю что нужно гдето смотреть http заголовки.

    В настоящее время думаю над проблемой. Буду благодарен если ткнете носом.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Очень хитро подгружается =)
    Вот, что показал мне плагин Firefox LiveHTTPHeaders:
    Со страницы
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Почта подгружается по ссылке
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Проблема в этой части 19d6b3a936e05bfe54d388823bac7479_530c5f66 - как ее узнать, если бы она была, то ссылку подгрузить макросом GETMORECONTENT не проблема. Теоретически можно разгадать метод кодирования, но я этим заниматься не буду, на это может уйти часов 10 работы. Проще найти альтернативный сайт.
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Роман, нам повезло) Вот проект, грузите в последней версии программы.
     

    Вложения:

  4. romanvl

    romanvl New Member Пользователи

    Регистрация:
    21 фев 2014
    Сообщения:
    18
    я понял что в CD_GRAN_2 парсится ссылка на аякс запрос, и через <GETMORECONTENT> оно должно появляться на выходе в таблице, но...

    блин, короче в редакторе шаблона вывода оно не работает, пишет Результирующий документ оказался пустым.

    но по факту все работает!!! Мегасофт. еще бы понять как его отлаживать
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Роман, конкретно мой проект, который я выложил в этой теме конкретно на последней версии программы (X, 10+) работает и в результате мы получаем то, что нужно:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Может у вас старый IE или из-за чего-то страница не успевает обрабатываться. Попробуйте в ctrl+h вместо 1001 прописать 5000, попробуйте обновить IE...
     
  6. romanvl

    romanvl New Member Пользователи

    Регистрация:
    21 фев 2014
    Сообщения:
    18
    Вобщем, дело такое

    IE обновлен до 11 версии со всеми дополнениями.

    В окошке которое открывается просмотре результата в шаблоне вывода открывается запись что браузер устарел... в логах вот такое

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    а при запуске проекта на исполнение все работает ок.

    где копать?
     
  7. romanvl

    romanvl New Member Пользователи

    Регистрация:
    21 фев 2014
    Сообщения:
    18
    первую проблему решил, нужно было ткнуть кнопку обрабатывать get mc
    и тогда можно смотреть лайв вью в шаблоне вывода

    вопрос второй, прописал Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko
    всеравно при просмотре говорит что ие старый и рекомендует обновить
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Не обращайте внимания на это сообщение, данные парсятся...
     
  9. progger

    progger New Member Пользователи

    Регистрация:
    27 фев 2014
    Сообщения:
    1
    каждый раз убеждаюсь, что еще не придумали такого решения для сайта, которое не смог бы обойти другой программист :)
     

Поделиться этой страницей