не выводятся html теги при настройке парсинга

Тема в разделе "Разное", создана пользователем Andrijr, 20 фев 2017.

  1. Andrijr

    Andrijr Member Пользователи

    Регистрация:
    15 фев 2017
    Сообщения:
    32
    Всем привет

    пробую настроить парсинг специфичесой страници
    Ссылки недоступны для гостей

    это софт который хорошо преобразовывает PDF в HTML

    при настройке границ парсинга все html теги превращаются в cWMzIWFRQjIiYiBiI1NDYzPgE3PgE1NCcDLgIjIjU0MzIWMzI2,,,,,

    при просмотре в браузере view-source:Ссылки недоступны для гостей
    тегов тоже не видно

    но при Ctrl + shift + i
    все теги просматриваются

    как можно заставить програму увидеть html теги
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Если парсить через браузер, то теги видно.

    Только что с ними потом делать - непонятно. Как вариант, делать скриншоты таблицы...

    2017-02-20_13-18-38.png

    С уважением к вам, Сергей.
     
  3. Andrijr

    Andrijr Member Пользователи

    Регистрация:
    15 фев 2017
    Сообщения:
    32
    Спасибо
    работает

    (пробую распознавать pdf и в нормальный HTML загонять
     
    Root нравится это.

Поделиться этой страницей