Парсинг инфы с нескольких сайтов

Тема в разделе "Решение различных задач по парсингу", создана пользователем paqwerty, 14 май 2015.

  1. paqwerty

    paqwerty New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    5
    Всем гуру большой привет.

    Есть задача - спарсить цены на товар, который расположен на нескольких разных страницах или сайтах. Все в принципе работает, но не совсем так как надо.

    Я добавил, например, 2 ссылки, настроил 2 простые границы парсинга, настроил шаблон вывода: <CD_GRAN_1!>[CSVCS]<CD_GRAN_2!>.

    При запуске парсинга все парсит, но выводит не правильно, т.е. результат выглядит так:

    Безымянный.jpg

    Т.е. в результате присутствует перенос строки, а как мне спрасить с нескольких страниц в одну строку?
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте!
    Нажмите ctrl+4 выберите вверху кнопку с вашей границей и установите галочку "в одну строку"
     
  3. paqwerty

    paqwerty New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    5
    Спасибо что помогаете. Сделал как сказали, но ничего не изменилось...
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    покажите проект, можно на почту.
     
  5. paqwerty

    paqwerty New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    5
    отправил на почту
     
  6. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Открыл ваш проект, все нормально вроде, запустил, вот результат, не совсем понятно, что именно не так.
     

    Вложения:

  7. paqwerty

    paqwerty New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    5
    Да, парсить он парсит, но разбивает результат на две строки, а мне нужно в одну
     
  8. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    каждая ссылка в проекте это новая строка в файле.
    Если вы хотите в 1 строку, значит нужна и 1 ссылка с параметрами
    например сайт.ру[PARAM]:<site1>site1.ru<site2>site2.ru<->
    И забирать инфу гетмором с последующими танцами в виде поиск/замен
     
  9. paqwerty

    paqwerty New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    5
    Getmorecontent работает, просто с ним не так удобно работать как с простыми границами. Т.е. выход из такой ситуации только один?
     
  10. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Из такой ситуации по другому никак.
    Разве что делать несколько проектов и потом сливать данные в цсвшках
     

Поделиться этой страницей