Баг-репорты

Тема в разделе "Развитие Content Downloader", создана пользователем Root, 10 мар 2010.

  1. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    во-первых, чтобы не мешали смайлики - выделяйте часть кода опциями "ВВ-код". получится так:
    Код:
    [REPLACE(, |{br};;;;;;;)][VALUE][/REPLACE]
    по второму пункту. кажется, я помню, откуда взялась эта конструкция. этот уродливый фрагмент родился из невозможности перехода на новую строку посредством #13 в настройках повторяющихся границ.
    http://forum.sbfactory.ru/showthread.php?t=515&highlight=%EA%EE%F1%F2%FB%EB%FC+%EA%EE%F1%F2%FB%EB%E5
    сегодня, проблемы уже нет. повторяющиеся границы отделяются друг от друга не через #13 а {br} и все переходы работают. соотв. и конструкция эта уже не нужна. замените ее на ;;;;;;;[VALUE], и поставьте {br} в настройках деления циклов повторяющихся границ.
     
  2. Zorro

    Zorro New Member Пользователи

    Регистрация:
    22 дек 2012
    Сообщения:
    17
    у меня что с галкой, что без галки регистр Учитывается

    пишу туда так -
    re:\bName\b|

    (хочу удалить слово Name)

    [​IMG]
     
  3. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    в данном случае заглавная буква попадает в регулярное выражение. вполне логично, что для нее действуют правила, предусмотренные именно для синтаксиса регулярных выражений. в регулярках нечувствительность к регистру прописывается отдельно, в самой формуле. это как в программировании - вы можете вставить в общий блок какую-то часть, внутри которой действуют свои, особые правила, имеющие приоритет над внешними. тут свои переменные, своя логика. а за ее пределами - все общее.
    P.S. не претендую на истину в последней инстанции. все это - мое личное ИМХО.
     
  4. Zorro

    Zorro New Member Пользователи

    Регистрация:
    22 дек 2012
    Сообщения:
    17
    я согласен, с другой стороны, галка есть - должна работать :)
    а с третей, я не пойму куда воткнуть регистронезависимость, так что ли
    (?i)
     
  5. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    легче и надежнее так
    re:\b[Nn]ame\b|
     
  6. mat

    mat New Member Пользователи

    Регистрация:
    8 май 2010
    Сообщения:
    63
    Автокодировка и [PARAM]

    Есть такой мелкий, неприятный и непонятный (по крайней мере, мне) бажик.
    Сразу на примере:
    Берем ссылку на парсинг Ссылки недоступны для гостей
    В принципе, если задаем границы парсинга, то сразу видим, что автоматом CD здесь кодировку не определил (utf-8). Но при этом он все равно отлично парсит страницу, даже если не задавать границу.
    Но только до того момента, пока мы не вставим [PARAM] в ссылку и шаблон вывода, тогда на выходе мы получаем значение [PARAM] в ansi (стоит по умолчанию в кодировке сохраняемого документа), а тело статьи уже в utf-8.
    В принципе таких страниц у меня получается около 3%, не критично (по-этому и бажик мелкий), но и не приятно.
    Может можно как-то подружить парам и автокодировку на этих 3-ех процентах?
     
  7. Benjamin Coleman

    Benjamin Coleman New Member Пользователи

    Регистрация:
    23 окт 2010
    Сообщения:
    152
    del. разобрался :)
     
  8. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Помню по 1 миллиону ссылок загружал в CD и он запускался, а сейчас добавил всего 500к ссылок вида
    Ссылки недоступны для гостей запрос&site=&region=&region_id=&zone=all&wordforms=all&lang%5B%5D=all&within=0&mime%5B%5D=all&numdoc=50&sub=s

    и программа не смогла даже запуститься, появилась полоса загрузки бекапа и на 92% какая-то ошибка выскакивает (не вижу её, полоса бекапа перекрывает её)
     
  9. mat

    mat New Member Пользователи

    Регистрация:
    8 май 2010
    Сообщения:
    63
    Все заработало после обновления internet explorer.
     
    Последнее редактирование: 24 апр 2013
  10. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    парсю страницы
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей

    забираю кусок текста / Турция / Аланья / Кестель (нужно по отдельности страна, город, курорт) спереди бывает лишнее, например "Сеть ACG Hotels"

    пишу границу так
    начало
    title="Отели{skip}<span itemprop="title">

    конец
    </span>

    если указываю номер тега по счёту 1, то программа уже не понимает границу.

    [​IMG]
     
  11. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Это вроде и не баг, а так и предусмотрено ранее было при использовании {skip} в указани границ.
    Как вариант можно регуляркой метки проставить в главном окне "поиск-замена"
    http://forum.sbfactory.ru/showpost.php?p=5414&postcount=9
     
  12. alex12

    alex12 New Member Пользователи

    Регистрация:
    7 июл 2012
    Сообщения:
    17
    DOWNLOADFILENAMES

    [​IMG]
    [​IMG]
    DOWNLOADFILENAMES не парсит точки в название файла и добавляет лишнее расширение файлов.
     
  13. belozy

    belozy New Member Пользователи

    Регистрация:
    29 янв 2013
    Сообщения:
    3
    Здравствуйте!
    Подскажите, как отключить автоматическое создание файлов?
    У меня парсинг идет в MySQL, используются только скрипты, а файлы автоматом создаются. После того, как файлов становится больше 20 тыс в папке, CD периодически подвисает во время парсинга.
     
  14. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Два варианта на такой случай.
    1. сохраните все в один файл с дозаписыванием (стоит обратить внимание что такой вариант наиболее хорошь поскольку напарсенные ссылки страниц тогда фиксируются в подключенном текстовом файле, если подключен)
    [​IMG]

    2. вариант. если парсите в базу по определенному диапазону один раз, то в шаблоне вывода можно все удалить что за пределами макроса подключения пхп скрипта.

    Рекомендую первый вариант, проще и фикируется по надобности спарсенное.
     
    Последнее редактирование: 4 июн 2013
  15. ahut

    ahut New Member Пользователи

    Регистрация:
    10 апр 2013
    Сообщения:
    3
    У меня почему-то программа перестала использовать загруженные прокси.
    Стоит галочка: использовать прокси при парсинге контента и ссылок...
    А в логе парсинга: прокси не используется.
    Только вчера парсил с проксями. А со вчерашнего вечера перестал. Пробовал подставлять разные прокси. Чекает, но не использует почему-то...
    Подскажите, пожалуйста, из-за чего может такое быть?
     
  16. ahut

    ahut New Member Пользователи

    Регистрация:
    10 апр 2013
    Сообщения:
    3
    Скачал новый дистрибутив и переустановил программу. Сейчас опять все работает.
     
  17. Odessky

    Odessky New Member Пользователи

    Регистрация:
    29 июн 2013
    Сообщения:
    19
    Обнаружен баг при генерации XML для Wordpress:
    В самих статях категория указана в нижнем регистре (категория), а в заголовках - регистрозависима (Категория).
    http://forum.sbfactory.ru/showthread.php?t=1136
    Ссылки недоступны для гостей
     
  18. Odessky

    Odessky New Member Пользователи

    Регистрация:
    29 июн 2013
    Сообщения:
    19
    ---
     
    Последнее редактирование: 3 июл 2013
  19. Benjamin Coleman

    Benjamin Coleman New Member Пользователи

    Регистрация:
    23 окт 2010
    Сообщения:
    152
    Возник баг в 7 версии, сегодня обновил:
    оставил сканер на несколько часов, прихожу, пишет:
    В программе запущен сканнер сайтов, желаете закрыть?

    И так несколько раз нажал "нет". Ну и сам он завис. Сканер был с проксями. В 3-й версии при тех же условиях и тот же сайте для сканера такого не было.
     
  20. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Content Downloader 7 версии 7.02 (18.08.2013):

    ВАЖНО!!!: Устранена ошибка, связанная с произвольным закрытием программы, если такое повторится, прошу обратиться в Skype smartbyte_support или ICQ 571-880-051, спасибо! Приносим искренние извинения за предоставленные неудобства и надеемся на ваше понимание. С уважением к вам, администрация SBFactory.ru!

    - Макрос шаблона вывода IFNIL теперь не вставляет пустую строку;
    - В окно добавления ссылок (F8) добавлен хоткей ctrl+enter (добавит ссылки к списку);
    - Хоткеи для перехода к отмеченным элементам (shift+стрелка вверх и shift+стрелка вниз) были заменены на ctrl+стрелка вверх и ctrl+стрелка вниз;
    - Несколько доработок и исправлений.

    Все ли хорошо теперь?
     

Поделиться этой страницей