Предложения по улучшению программы

Тема в разделе "Развитие Content Downloader", создана пользователем Root, 13 мар 2010.

  1. cdcustomer

    cdcustomer New Member Пользователи

    Регистрация:
    17 мар 2012
    Сообщения:
    41
    А по моему предложению? Или пошлите уже куда подальше или скажить, ждать или не ждать.
     
  2. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Не надо, cdcustomer, столько раз напоминать, сказали же: когда будет достаточно оснований для ускорения или в порядке очередности, вот тут есть ещё предложение, вкупе они дадут стимул ускорить решение.
     
  3. zilon

    zilon New Member Пользователи

    Регистрация:
    24 дек 2011
    Сообщения:
    80
    А можете сделать для каждой границы парсинга отдельное окошко поиска|замены ?

    например если отмечено - применять везде то поиск замена относится ко всей страницы.

    Уменьшайте картинки, если их размер превыщает 640Х240

    А если для каждой границы в отдельности сделать, то допустим я выбираю границу - Ссылки появляется пустое окно, я туда вбиваю то что надо заменить. Потом выбираю границу - Полная новость и снова открывается пустое окно и туда вбиваю то, что надо заменить. И так для всех границ парсинга.
     
    Последнее редактирование модератором: 10 июл 2012
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    это уже давно есть - Дополнительные настройки границ там для каждой границы можно настраивать поиск/замену с регулярками и тегами или без
     
  5. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    В программе используется многооконность и хоть я с программой работаю давно, но бывает,
    что по запаре закрываю окно самой программы и такие настройки как границы парсинга приходится с начала делать.
    Предлагаю перед закрытием программы выводить сообщение.
    Сохранить проект перед закрытием? Да. Нет.

    Ещё не понял, как в новой версии в столбик делать <CD_CYCLE_GRAN_1!>; ?
    (проект прикрепил)

    Логично было бы, если я вставил enter в настройках повторяющихся границ, там где [VALUE]

    [​IMG]

    PS: спасибо за новые фишки в последних версиях
     

    Вложения:

    Последнее редактирование: 10 июл 2012
  6. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Если мы выходим из программы, потом заходим в неё опять, видим, что ВСЕ ДАННЫЕ СОХРАНИЛИСЬ. Если выйти из редактора "границ парсинга", без нажатия на кнопку "ОК" не сохраняется всего лишь одна граница, та, что мы редактировали последней. Так что, не получается что-то задать работы автору...

    Этот вопрос не совсем понятен. Если речь идёт о выводе в CSV (сужу по проекту), то необходимо в "дополнительных настройках повторяющихся границ" выставить в "Чем разделять циклы повторяющихся границ...", проставить ;. Тогда данные будут выводиться построчно и в столбик.

    Если нужно просто в столбик, тогда надо сохранять в тхт и [HTMTOTXT:]<CD_CYCLE_GRAN_1!>[/HTMTOTXT] и без ;.

    В случае чегото-то другого,- уточните вопрос, пожалуйста

    Автор постоянно радует нас новыми возможностями в программе
     
    Последнее редактирование: 11 июл 2012
  7. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Да, вот не могу понять - что-то изменилось в этих повторяющихся границах, или нет, обычно всегда чередующиеся использовал, а тут в новом CDII решил потестить <CD_CYCLE_GRAN_1!> , <CD_CYCLE_GRAN_2!>


    для csv всё фигачет либо в одну строку, либо в столбиках всё склеивает, да и в txt так же

    Результат шаблон вывода <CD_CYCLE_GRAN_1!>;<CD_CYCLE_GRAN_2!>

    [​IMG]

    Результат шаблон вывода<CD_CYCLE_GRAN_ALL!> (всё правильно выводит)
    [​IMG]

    Посмотреть вложение liveinternet_ru_2.rar


    Сейчас появилась новая фишка с [VALUE], если я добавлю в поле символы, например 123, то в конце к каждому значению они добавляются
    [​IMG]

    А если добавить enter, вместо 123, то никакой реакции, поэтому я и написал, что было бы логично, если он там работал (ентер или переход на новую строку) тогда в csv результат был такой, как на скрине для <CD_CYCLE_GRAN_ALL!>

    надеюсь, понятно расписал :)
     
    Последнее редактирование: 11 июл 2012
  8. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    В поддержку bork75 тоже отмечу что если указывать в шаблоне одну или несколько <CD_CYCLE_GRAN_1!> , <CD_CYCLE_GRAN_2!> то все идет в одну строку (несколько ячеек но в одну строку). А сейчас поправляя проект что выложен постом выше - убедился о факте "в одну строку", НО странно что только <CD_CYCLE_GRAN_ALL!> смог исправить ситуацию.
    Это так задуманно может?)
    ---
    Насчет проекта сбора статы с liveinternet, проект поправил и теперь работает.
    Используйте не просто запустив а посмотрите как реализовано
    тоесть [VALUE] это стандарт, а еще можно конкретно настроить каждую повторяющееся границу где внутри назначить еще границы которые обрамлены будут не галочками а скобками квадратными.
    [GRAN1];[GRAN2];[GRAN3]
    * Кликните по отмеченному синим и назначьте границы
    [​IMG]
     

    Вложения:

    Последнее редактирование: 12 июл 2012
    bork75 нравится это.
  9. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Что-то вы, bork75, кажется замечтались. Существуют два разных инструмента, для решения двух разных задач.
    <CD_CYCLE_GRAN_1!>;<CD_CYCLE_GRAN_2!>
    имеет одни возможности
    <CD_CYCLE_GRAN_ALL!>
    другие. Потому и созданы два инструмента, чтобы по разному выводить контент.

    Энтер, добавленный к [VALUE] ничего не даст, для этого достаточно проставить в шаблоне <CD_CYCLE_GRAN_1!>;<CD_CYCLE_GRAN_2!> в столбик

    [​IMG]

    получим такой вот результат

    [​IMG]

    чтобы получить

    [​IMG]

    используем - <CD_CYCLE_GRAN_ALL!>

    В обеих случаях, надо проставить разделители CSV

    [​IMG]

    Как видите, ваш вопрос теряет смысл, если использовать предназначенные для решения задачи инструменты.

    Если вы хотели чего-то другое получить,- поясняйте.
     
  10. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Пока писал ответ, появилось сообщение kagorec.
    Интересное решение, но, моё мнение, что оно излишнее в данном случае.
    - создано несколько лишних границ
    - несколько лишних настроек,
    - использованы 3 макроса там, где достаточно было одного <CD_CYCLE_GRAN_ALL!>
    - <CD_CYCLE_GRAN_ALL!> - прекрасно решает задачу, зачем же усложнять себе жизнь?
     
  11. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    я просто обратил внимание на то, что в том виде как сейчас работают повторяющиеся границы с использованием <CD_CYCLE_GRAN_1!>;<CD_CYCLE_GRAN_2!> они без полезны, даже х.з. где они могут пригодится в таком виде.
    Не хватает простой поддержки переноса, вот и вся проблема.

    kagorec, понял о чём я говорю.

    ps: kagorec, посмотрел проект - круто!
    Я даже этих фишек и не видел. (хотя давно ещё предлагал такую возможность - использовать обычные границы, для задания повторяющихся)
     
    Последнее редактирование: 12 июл 2012
  12. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Я показал,- перенос для данных границ не нужен. А использоваться они будут там, где нет необходимости парсить в CSV. Есть же ещё html, txt.

    Эти опции существовали в программе очень давно, только выглядели иначе. Сейчас, стоит обратить внимание на "задание обычных границ внутри повторяющихся"
     
  13. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Можно в программе увеличить список user agent
    тут выложили Ссылки недоступны для гостей
     
  14. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Что мешает? См. тут
     
  15. zilon

    zilon New Member Пользователи

    Регистрация:
    24 дек 2011
    Сообщения:
    80
    а можите сделать, чтобы спарсилось например 500 новостей и парсинг остановился? Просто я спарсённые новости, сразу импортирую в движок и если больше 2000 новостей одновременно импортировать то может памяти не хватить которая выделена на php или ещё хуже, например у 587 новости кавычка не зазеркалится и ничего не импортируется и придётся её искать ошибку...
     
  16. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Просьба не совсем понятная, zilon? 500 новостей откуда должно спарсится?
     
  17. zilon

    zilon New Member Пользователи

    Регистрация:
    24 дек 2011
    Сообщения:
    80
    вот, я проект открываю, там выбираю парсить 500 новостей в один файл

    [​IMG]

    сейцас Content Downloader сохраняет 500 новостей в один файл, и создаёт следующий, в котором тоже будет 500 новостей и так, пока не спарсит все ссылки из главного окна программы. А можно там переключатеь сделать - "спарсить указанное количество новостей из списка" и когда Content Downloader спарсит указанное количество новостей, то парсинг остановится?
     
  18. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Теперь понятно, я передам вашу просьбу автору. судя по всему, это будет означать, что программа должна скачать 500 ссылок.
     
  19. zilon

    zilon New Member Пользователи

    Регистрация:
    24 дек 2011
    Сообщения:
    80
    Спасибо, лучше чтобы можно было скачать указанное количество новостей, то есть если указать 20 то спарсит 20 новостей, а если указать 500 то скачает 500 новостей и.т.д.
     
  20. Benjamin Coleman

    Benjamin Coleman New Member Пользователи

    Регистрация:
    23 окт 2010
    Сообщения:
    152
    Очень-очень бы хотелось такое улучшение: в сканере сайтов стартовый url сделать не один, и список их нескольких (многих сайтов) чтобы потом последовательно проходить по каждому из них.
    Это было бы просто супер.
     

Поделиться этой страницей