Какой способ использовать - когда на 1 странице несколько товаров.

Тема в разделе "Решение различных задач по парсингу", создана пользователем Djahat, 2 апр 2015.

  1. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Всем ЗДРАСТЕ.

    Какой способ лучше использовать для парсинга магазина, когда на 1 странице несколько товаров сразу (тоесть нет карточки товаров)

    Вот сайт для примера:

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    У меня 2 вопроса, если кто в теме подскажите плиз:

    1) Какая стратегия при парсинге (в двух словах как правильно делать)? - чтобы вывести в 1 большой CSS в каждую строку по 1 товару. НАЗВАНИЕ|ОПИСАНИЕ|КАРТИНКА

    2) Можно как-то спарсить каждый товар на локальный комп в виде одной, отдельной html страницы ?
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте!
    1) Стратегия всегда должна быть подкреплена фактами:
    1.1 Есть ли аякс запрос? да/нет Если да идем в направлении аякса, если нет идем изучать дальше
    1.2 Если нету, идем изучать как и где вызывается модальное окно? (firefox и аддон в помощь) Если есть все понятно, если нет идем дальше.
    1.3 Найти в коде где есть нужная нам информация. И если очень внимательно посмотреть, то мы найдем ее внизу страницы.
    2) Все зависит от вашего умения это делать, вообще да. Все возможно, но не думаю ,что тут будет все так просто. Как вариант, повторяющаяся граница + сохранение в html
     
  3. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Там все просто, все есть в html страницы - никаких аяксов и прочей хрени.

    Можно за счет повторяющейся - внутри повторяющейся - как я умею, но вопрос в другом.


    особенно интересно: Можно ли при парсинге одной страницы, вывести 4 html страницы, в каждой из которой будет только 1 повторяющаяся граница.
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Не пробовал, не могу сказать. Попробуйте.
     
  5. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Я попробовал - но у меня выводится только одна граница в один html файл.

    Но как вывести все границы - в отдельные html файлы, не понятно, наверное нельзя вообще.

    Только Сергей сможет сказать - можно или нет, видать....
     
  6. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Зачем вам повт, внутри повтор?
    обычной вроде можно обойтись
     
  7. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Да точно, я что тупанул.
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей
     
  9. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Спасибо

    А не скажете программа умеет ?

    Можно ли при парсинге одной страницы, вывести 4 html страницы, в каждой из которой будет только 1 повторяющаяся граница ?
     
  10. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Соберите сылки вида
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    и потом примените повт. границу для распарсивания каждого цикла как отдельный товар.
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей
     

Поделиться этой страницей