Баг-репорты

Тема в разделе "Развитие Content Downloader", создана пользователем Root, 10 мар 2010.

  1. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Спасибо! Будем исправлять.
     
  2. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Спасибо, вот ты гений, я что-то сразу не сообразил :D

    Нужно это в уроки добавить "Альтернативные границы"
    У меня не раз возникали моменты, когда на одном сайте были разные признаки для однотипных страниц и я не знал как быть,
    оказывается всё просто, нужно было обе границы указать рядом без разделителя "точка с запятой"

    да да, я про это и говорю, частенько проскакивают атрибуты javascript, типа onmouseover=
     
    Последнее редактирование: 19 фев 2012
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей - пока поиск-заменой лишнее убирайте.
     
  4. jozess

    jozess Member Пользователи

    Регистрация:
    19 дек 2010
    Сообщения:
    122
    Нужна небольшая доработочка. Если стоит галочка, НЕ сохранять документ если нет картинок, и если в шаблоне есть загрузка файлов, то док. не загружается, а файл загружается. а он не нужен, потому как сбивается все (нумерации [INT_ID]).

    А вообще хотелось бы сделать небольшое исправление. Если в шаблоне несколько раз вставить <DOWNLOADFILE><CD_GRAN_3!></DOWNLOADFILE>, то в файл не записываются пути к файлу (Функция нужна, если я хочу в документе вставить несколько ссылок для скачивания).
     
    Последнее редактирование: 21 фев 2012
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Про второе, с DOWNLOADFILE: скиньте пожалуйста файл проекта с ошибкой на sbfroot@gmail.com
    Спасибо!
     
  6. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    После последнего обновления начал часто получать в Планировщике, выполняющем порядка 20 проектов - надпись: "Пожалуйста, дождитесь окончания предыдущей операции".
    После появления этой надписи проекты перестают сохраняться в отведенные им папки. Вместо этого, они оседают в папке ../CD/"preview_files" (соотв. путь прописывается в логе парсинга) и исчезают оттуда после закрытия программы.
     
  7. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Наверное, это из-за неправильной расстановки времени начала и конца каждого проекта? Один проект не закончен, и тут наступает время исполнения второго. Лучше не проставлять конкретное время запуска проектов, тогда не будет пересечений.
     
  8. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    ????!!!!
    в планировщике программы нет такой функции.

    может, вы недопоняли, о чем я говорил? запускаем программу - открываем планировщик - в него добавляем 20 проектов - и говорим - поехали!

    какое время запуска каждого? это ежедневно выполняемая разовая операция. и проекты отрабатываются четко один за другим. проблема началась с последних версий. раньше ее в помине не было.

    проекты не менялись. да если и менялсь какая разница - я говорю о ситуации когда один проект в очереди мешает другому. тут невозможно натупить и что-то неправильно сделать. потому что от юзера ничего не зависит.
     
  9. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    я даже больше скажу и покажу:
    Ссылки недоступны для гостей

    это архив с тремя проектами -
    32 - Flot-2017.cdp
    33 - POGODA.cdp
    33.1 - POGODA-RP5.cdp

    ставите их в планировщик в указанной последовательности и запускаете парсинг.
    после первого проекта произойдет сбой. следующие 2 за ним уже не сохранятся либо сохранятся некорректно. хотя по отдельности они грузят все замечательно.

    почему это именно баг, а не мои домыслы:
    на сайте, для которого разработан первый проект, поменялась струкутра ссылок, и первый проект не находит там ни одного элемента.
    именно с этого момента он начал "убивать" 2 следующих за ним. он отрабатывает так быстро что где-то происходит накладка. если подправить фильтры ссылок в первом проекте - он начинает находить и загружать документы и последующие проекты тоже работают хорошо.

    но 2 последующих проекта в списке вообще не должны зависеть от того, находит их предшественник ссылки или нет!!
    это явный баг программы. если меня и сейчас не поняли - я пас
     
    Последнее редактирование: 1 мар 2012
  10. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    у человека может быть отпуск или проблемы помимо разрабатываемого ПО?
     
  11. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    Возникла такая ситуация
    Есть сайт __jdswholesales.com/catalog/_ - классический оскомерц. Проблем не должно было быть. Виден в браузере.
    Но у него отдача для СД Ссылки недоступны для гостей
    - эррор 420 ( Ссылки недоступны для гостей ) Ошибка сервака или скрипта.

    Но для СД это критично, и он не может сливать инфу. Хотя суслик есть (((
     
  12. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Парсил сайты на автомате.

    Спарсился кусок кода

    //<![CDATA[(function() {var links = document.getElementsByTagName('a')-var query = '?'-for(var i = 0- i = 0) {query += 'url' + i + '=' + encodeURIComponent(links.href) + '&'-}}document.write('

    htm to txt был включен
     
  13. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Такая ситуация возникает, когда были заданы границы парсинга для одной страницы, но на другой этой границы не оказалось, и границы сместились в другое место.
     
  14. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Парсю из гугла ссылки между тегов <cite> </cite>

    Есть адреса такого вида : site.ru/kategoria/page

    Мне нужно привести ссылку к виду только имени домена, т.е. site.ru

    Пишу в поиске и замене

    /{skip}|

    Ничего не заменяет
     
  15. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    как альтернатива вашему варианту можно гет-ами попрбовать
    {get}/|{get}
     
    Последнее редактирование: 18 апр 2012
  16. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    02.05.2012 Украина.
    16.40 - Запускаю программу. И ничего. В смысле, кнопка "начать парсинг" неактивна. А без нее, сами понимаете, не программа - одно название.
    16.50 - перезапускаю - опять та же история.
    17.00 - то же самое.
    18.30 - ?!!!

    Конечно, это не баг. Это намного хуже. За время пользования программой я наблюдаю это далеко не в первый раз.

    На сегодняшний день, удаленный сервер может в самый ответственный момент оказаться в нерабочем состоянии. В таких условиях, уровень доверия к программе резко падает. Мне непонятна ситуация, когда из-за одного компьютера/сайта (неважно) все клиенты дружно сосут лапу.

    В этой связи, предлагаю продублировать модуль проверки подлиности программы. Одного мало. Он то ли перегружен, то ли не всегда находится онлайн.
     
    Последнее редактирование: 2 май 2012
  17. Focus

    Focus New Member Пользователи

    Регистрация:
    4 апр 2011
    Сообщения:
    38
    Адрес:
    Советский Союз
    Работаю с софтом постоянно, такого еще не было. Могу предположить, что проблема где то на линии, попробуйте сделать трассу, мож там чего
     
  18. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    я запускаю программу до 2-3 раз в день. иногда чаще. поэтому опыт запусков за полгода накоплен немалый. проблему фиксировал раз 8-10.

    до сегодняшнего дня все приходило в норму за 5-10 минут. сегодня первый раз так долго. но суть не в промежутке времени, суть в самой проблеме.

    живу в Севастополе. программа установлена на нескольких компьютерах, на которых абсолютно все отличается - от района города, до провайдера Интернета. проблему наблюдал на обоих. при этом, доступ в Интернет присутствовал.

    так что не в линии дело. разве что линия "Севастополь - окружающий мир".
     
  19. Focus

    Focus New Member Пользователи

    Регистрация:
    4 апр 2011
    Сообщения:
    38
    Адрес:
    Советский Союз
    При чем тут окружающий мир, надо просто сделать tracert и посмотреть где обрыв, если на серваке софта, тогда и претензии к админам. У мея несколько сайов хостилось в Одессе, так я до них периодически достучаться не мог, но хостер утверждал, что у них все работает. Позже выяснилось что магистрал Московский периодически тупит, из за него пришлось хостинг менять. У вас возможно что то аналогичное
     
  20. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Ребята, всё устаканилось, сейчас ищутся новые решения, для того, чтобы в будущем ситуация не повторялась. Действительно всё дело было в сервере, а не в ваших компьютерах. Хотя, у некоторых такое же наблюдалось если теща сварливая. Но, это частный случай
     

Поделиться этой страницей