Парсить весь документ

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем c.alk, 15 дек 2013.

  1. c.alk

    c.alk New Member Пользователи

    Регистрация:
    15 дек 2013
    Сообщения:
    4
    я обновился до новейшей версии и не могу найти опцию "парсить весь документ", только с границами.
    а я качаю тексты сайтов сплошняком, там границы вообще разные
    где теперь чекбокс "парсить весь документ" находится?
     
  2. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    создайте новый проект и он закачает вам весь документ по ссылке. потому что в шаблоне вывода изначально стоит макрос [DOCSOURCE]
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Открыть шаблон вывода (кнопка на панели инструментов) и вставить туда [DOCSOURCE]
     
  4. c.alk

    c.alk New Member Пользователи

    Регистрация:
    15 дек 2013
    Сообщения:
    4
    Сделал, возник второй вопрос: несмотря на то, что поставлена галочка "html to txt" выводится код страницы, а мне нужен контент (текст) страницы:




    --
    <li id="menu-item-505" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-505"><a href="http://newspressreliz.ru/?cat=37">Мероприятия</a></li>
    <li id="menu-item-506" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-506"><a href="http://newspressreliz.ru/?cat=64">Театр</a></li>
    </ul>
    </li>
    <li id="menu-item-509" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-509"><a href="http://newspressreliz.ru/?cat=15">Образование</a></li>
    <li id="menu-item-510" class="menu-item menu-item-type-taxonomy menu-item-object-category parent menu-item-510"><a title="Общество" href="http://newspressreliz.ru/?cat=32">Общество и политика</a>
    <ul class="sub-menu">
    <li id="menu-item-511" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-511"><a href="http://newspressreliz.ru/?cat=12">Благотворительность</a></li>
    <li id="menu-item-706" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-706"><a href="http://newspressreliz.ru/?cat=88">Люди</a></li>
    <li id="menu-item-512" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-512"><a href="http://newspressreliz.ru/?cat=5">Правительство</a></li>
    </ul>
    </li>
    <li id="menu-item-513" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-513"><a href="http://newspressreliz.ru/?cat=33">Спорт</a></li>
    <li id="menu-item-514" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-514"><a href="http://newspressreliz.ru/?cat=35">Технологии</a></li>
    </ul></div>

    --
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Используйте макрос шаблона вывода HTMTOTXT Ссылки недоступны для гостей
     
  6. c.alk

    c.alk New Member Пользователи

    Регистрация:
    15 дек 2013
    Сообщения:
    4
    Общий шаблон вывода стал:

    [HTMTOTXT:][DOCSOURCE][/HTMTOTXT]

    Все работает отлично, спасибо.
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста, рады помочь, обращайтесь :bow:
     

Поделиться этой страницей