Подскажите, есть пару вопросов

Тема в разделе "Функции и интерфейс программы", создана пользователем freemast, 17 апр 2017.

  1. freemast

    freemast New Member Пользователи

    Регистрация:
    14 апр 2017
    Сообщения:
    5
    Подскажите может есть такой функционал к примеру:

    Запарсил я ссылки вчера, сегодня начал парсить контент, за это время некоторые ссылки превратились в ошибку 404 (были удалены пользователем), может есть такой функционал чтобы проверить это и не записывать в csv такие страницы? (а то записываются одни разделители)


    Еще вопрос может есть где настройка такая чтобы WBApp не всплывал по верх всех страниц при парсинге, а то компом пользоваться невозможно при парсинге ?

    И последний вопрос, можно при парсинге собирать в zip файлы? (упаковать csv файл и файлы картинок относящихся к записям в этом csv файле в один zip архив)

    Спасибо!
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте
    Опять же, почему не приводите ссылки?
    1) Обычно 404 не попадает в итоговый файл и так. Если у вас например в шаблоне прописано <CD_DOCURL!> тогда по идее должна будет остаться только ссылка.
    Если же есть получение имени в границе <h1>404</h1>, то возможно вы и получаете 404 в файл, тогда используйте фильтрацию shift+ctrl+f там интуитивно понятно вроде как работать (выбираем границу к которой надо применить, в текстовое поле написать что искать, внизу выбрать что делать с документом)
    2) при нажатии ctrl+w внизу слева есть галочка показывать при парсинге (она должна быть снята), но wbapp сам по себе всегда виден (вроде бы)
    3) Только если вы сами пропишите данные к программе и все ключи (нажав ctrl+u справа посередине окошко)
     
    freemast нравится это.
  3. Dron25

    Dron25 Well-Known Member Пользователи

    Регистрация:
    17 июн 2014
    Сообщения:
    263
    Добрый день
    делаете границу обязательной
    [​IMG]
    иногда сканирую все ссылки на сайте и таким методом беру только страницы с ценой например
     
    freemast нравится это.
  4. freemast

    freemast New Member Пользователи

    Регистрация:
    14 апр 2017
    Сообщения:
    5
    там не стандартная 404

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 5 постов.**
    понял, кажется лучше парсить в базу а потом из базы собрать картинки и csv в zip

    с работало

    То что нужно, заработало
     

Поделиться этой страницей