Вопрос по парсингу в повторяющихся границах с большим кол-вом данных

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем artproma, 19 фев 2015.

  1. artproma

    artproma New Member Пользователи

    Регистрация:
    3 фев 2013
    Сообщения:
    32
    Добрый день.
    Есть некая страница
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Так вот мне нужно спарсить все характеристики.
    Все бы хорошо, но тут повторяющиеся границы парсинга и в каждой границе 29, а иногда еще и больше, нужных мне строк. (выпадающие списки)
    как быть?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    С ваших слов не понятно, что именно нужно спарсить. Можете указать это на скриншоте WEB-страницы. Также рекомендуется показать пример желаемого результата (на основе одного товара).

    С уважением к вам, Сергей...
     
  3. artproma

    artproma New Member Пользователи

    Регистрация:
    3 фев 2013
    Сообщения:
    32
    Вот это все
    В том числе и точки снизу (у них можно спарсить само значение (кол-во точек)
    Соответственно таких полей на странице много

    Ниже вид того как я бы хотел это видеть
    точки ставил, чтоб не все заполнять
    Нижняя строчка это вторая повторяющаяся граница
     

    Вложения:

    • Image 2.png
      Image 2.png
      Размер файла:
      17,4 КБ
      Просмотров:
      0
    • Image 4.png
      Image 4.png
      Размер файла:
      7,1 КБ
      Просмотров:
      0
    Последнее редактирование: 19 фев 2015
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Теперь все ясно (ранее не видел раскрывающихся "спойлеров"). Задача эта не самая простая. Я попробую найти время на реализацию решения в ближайшие 20 часов. В случае решения данного вопроса я опубликую в этой теме ответ.

    Из рекомендаций: парсить эти таблицы нужно таким методом -> Ссылки недоступны для гостей (сказал навскидку).

    С уважением к вам, Сергей...
     
  5. artproma

    artproma New Member Пользователи

    Регистрация:
    3 фев 2013
    Сообщения:
    32
    за наводку спасибо, но тут еще и повторяющиеся границы
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Вот, посмотрите решение (меню - файл - загрузить проект) + требуется ULTIMATE версия Content Downloader.

    Что касается "полос прогресса" (SPEED, Rolling...): С ними пока возиться не стал (критично ли это...).

    С уважением к вам, Сергей...
     

    Вложения:

    • 12.cdp
      Размер файла:
      26,7 КБ
      Просмотров:
      11
  7. artproma

    artproma New Member Пользователи

    Регистрация:
    3 фев 2013
    Сообщения:
    32
    До это критично.
    Они там они еще и меняются.....
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Меню - файл - загрузить проект!
     

    Вложения:

    • 12_2.cdp
      Размер файла:
      27,4 КБ
      Просмотров:
      2
  9. artproma

    artproma New Member Пользователи

    Регистрация:
    3 фев 2013
    Сообщения:
    32
    Спасибо...
    Буду изучать метод.
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста, обращайтесь...
     

Поделиться этой страницей