Не удается задать повторяющиеся границы внутри повторяющихся

Тема в разделе "Границы парсинга", создана пользователем maxwelhelp, 26 окт 2017.

  1. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    Не работают повторяющихся границ парсинга внутри повторяющихся если включить
    Internet Explorer (DOM)

    Ссылки недоступны для гостейфайл проекта с демонстрацией задания повторяющихся границ парсинга внутри повторяющихся отсюда Ссылки недоступны для гостей

    и включил Internet Explorer (DOM)


    Пишет: Результирующий документ оказался пустым.
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    а зачем вы включаете DOM?
     
  3. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    потому что без DOM не грузится сайт Ссылки недоступны для гостей я на нем хочу реализовать повторяющиеся границ парсинга внутри повторяющихся
     
  4. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    мне надо спарсить емейлы и имена в ексель, возможно есть еще какие то пути что бы это сделать ?
     
  5. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    Добрый день.
    IE DOM по-другому обрабатывает код страницы. Проверьте и при необходимости обновите установленные границы парсинга.
     
    maxwelhelp и Root нравится это.
  6. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    1) предоставьте логин и пароль
    2) предоставьте ТЗ, что куда и как надо сделать. куда зайти, что сделать.
    3) возможно тогда вам помогут
    4) повторяющиеся внутри повторяющихся довольно трудная для понимая конструкция, очень часто не выходит с первого раза.
    5) попробуйте изучить эту конструкцию на более простых сайтах, а еще лучше на примере из справки.
    6) скорее всего там она не нужна.
     
    maxwelhelp и xLime нравится это.
  7. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    maxwelhelp@gmail.com
    :bdjnjr89

    необходимо перейти по ссылке Ссылки недоступны для гостей и стянуть все емейлы в одну колонку екселя а в другую имена.
    повторяющиеся граница для емейлов: <div class="email">richard.thoms@cfdrc.com</div>
    повторяющиеся граница для имен: <span class="name">Richard Thoms</span>

    Результат:

    колонка 1 колонка 2
    richard.thoms@cfdrc.com Richard Thoms

    david.thomas@cfdrc.com David Thomas
    .... .....


    Если не включить DOM то страница Ссылки недоступны для гостей не отображается корректно - список емейлов отсутствует.
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вам xLime правильно ответил.

    Парсите так: Ссылки недоступны для гостей
     
    maxwelhelp нравится это.
  9. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    границы не поменялись, но на всякий случай обновил их, результат тот же - Результирующий документ оказался пустым.
     
  10. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    Добрый день.
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
     
    maxwelhelp нравится это.
  11. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    сделал как в примере:
    обычная граница1 - емейл <div class="email">richard.thoms@cfdrc.com</div>
    обычная граница2 - имя <span class="name">Richard Thoms</span>
    повторяющиеся граница1 - [GRAN1][CSVCS][GRAN2]
    шаблон вывода - <CD_CYCLE_GRAN_1!>

    Результат: Результирующий документ оказался пустым.
     
  12. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    По апи есть ограничение по количеству запросов, а покупать дорого, к тому же если купить там сразу есть выгрузка в ексель и потребность в парсере отпадает.
     
  13. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    И так и так работает. Не знаю в чем у вас проблема.

    [​IMG]
     

    Вложения:

    • hunter_io.zip
      Размер файла:
      7,5 КБ
      Просмотров:
      3
    maxwelhelp нравится это.
  14. maxwelhelp

    maxwelhelp Member Пользователи

    Регистрация:
    24 ноя 2016
    Сообщения:
    35
    Все получилось, просто забыл задать повторяющеюся границу, огромное спасибо за помощь.
     
    xLime нравится это.
  15. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Чет у меня такая же проблема. Вот это вот: Ссылки недоступны для гостей (точнее фал примера оттуда) при включенном WBApp перестает работать. Как собственно и проект, который делаю и в котором надо реализовать все точно так как в примере. Проект без WBApp не работает, т.к. там JS.

    PS Полдня прыгаю с бубном, но чет не выходит чаша. Реализовать надо вот точно так же как в примере, который по ссылке. С WBApp никак не работает и какой-нить костыль подобрать не получается.

    Помогите, пожалуйста!
     

    Вложения:

    Последнее редактирование: 13 май 2019
  16. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Так как код WEB-страницы из браузера отличается от кода обычного запроса (браузер форматирует код), то может потребоваться перезадание границ парсинга в соответствии с измененным кодом.

    От вас увидел проект в котором все работает, в чем у вас проблема - неясно!
     
  17. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Может у меня настройки WBApp какие-то не такие? С включенным WBApp при редактировании границ они не слетают. Перезадал границы. Эффект тот же самый. Вложенные повторяющиеся границы перестают работать напрочь. Все остальное, в том числе вывод повторяющихся границ без вложений, работает как надо. Как только WBApp отключаю - вложенные повторы начинают работать. Вы могли бы приложить проект, настроенный под WBApp? Хочу потестить на своем компе. Может с браузером что не так?
     
  18. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Еще раз:
    Отличия только в коде, проект вам не поможет.
     
  19. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    То есть функции поиска границ парсинга не важно, откуда берется код, важно, какой код приходит. В логах окна предпросмотра результатов парсинга код отображается.
     
  20. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Да я и в первый раз прочитал про перезадание
    Я правильно понял, что надо сбросить границы парсинга и с включенным WBApp взять их снова? Или этого не достаточно? В логах вижу код и он вроде ничем не отличается от того, который вижу в редакторе границ при включенном WBApp.

    В рабочем файле проекта код брал только в включенным WBApp и вложенные повторы тоже не работают. Только WBApp там нельзя отключить, чтобы без него потестить, т.к. там весь код JS генерится. Просто считаю, что если Ваш тестовый проект под WBApp заработает, то и мой рабочий тоже.
     

Поделиться этой страницей