Как парсить сайт на аяксе

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Таня, 2 апр 2013.

  1. Таня

    Таня New Member Пользователи

    Регистрация:
    2 апр 2013
    Сообщения:
    3
    Здравствуйте!
    Нужно спарсить магазин maytoni.ru. Сначала все было понятно - взяла все ссылки на товары, задала границы.... Но. при выдаче информации работает скрипт /ajax/catalog.php, описание товаров сделано каруселью. И при загрузке программы эта карусель все время выдает первый из списка товар в данной категории, независимо от указания точной ссылки с id.
    Подскажите пожалуйста, как взять информацию например с этой страницы: Ссылки недоступны для гостей. CD при задании границ выдает совершенно не ту картинку и описание.
    Спасибо за участие!
     
  2. Таня

    Таня New Member Пользователи

    Регистрация:
    2 апр 2013
    Сообщения:
    3
    Ну неужели совсем шансов нет?
    Мне не понятно, почему когда я захожу по конкретной ссылке на товар в мозиле - вижу корректную информацию. А когда этот же адрес страницы ввожу в программе и там смотрю через браузер - то товар отображается другой.
     
  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    Сканером собрало 616 ссылок _http://pastebin.com/NpJHDm75
    В сканере, поиск-замена задано
    PHP:
    <a href="#" class="|<a href="?id=
    Но собрать это легко, а парсить подобные сайты надо сохранив на компьютер (автоматизировать процесс можно в Mozilla +addon iMacros)
     
  4. Таня

    Таня New Member Пользователи

    Регистрация:
    2 апр 2013
    Сообщения:
    3
    Значит, все-таки iMacros... Читала про него в Помощи и уже устанавливала но не разобралась и бросила. Думала, мож полегче есть путь?)
    Kagorec, спасибо за помощь!
    Как там Траволта кричал? БИТВА!!!
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    Вот вам эти золотые три строчки :D
    PHP:
    URL GOTO=http://kaoito-sayt.ru/tovar/100500
    WAIT SECONDS=2
    SAVEAS TYPE
    =HTM FOLDER=d:\contentFILE={{!NOW:dd-mm_hh-nn-ss}}
    Но можно и без последней строки если +addon "Scrabook" и autosave
     

Поделиться этой страницей