Баг-репорты

Flash · 25 окт 2011

Понял тебя.
Он и установлен от админа. У меня Windows XP и единственный пользователь администратор.

Focus · 25 окт 2011

хм... может у тебя железо слегонца разогнано?

Flash · 25 окт 2011

Не думаю. Я никогда его не разгонял.

Weetal · 4 ноя 2011

После очередного апдейта CD изменилось макисмальное кол-во добавления ссылок (Добавить ссылки F8) по крайней мере у меня. Сейчас максимум 75010 строк добавляется, а нужно бооольше. Посмотрите пожалуйста.

Root · 19 ноя 2011

Weetal сказал(а): ↑

После очередного апдейта CD изменилось макисмальное кол-во добавления ссылок (Добавить ссылки F8) по крайней мере у меня. Сейчас максимум 75010 строк добавляется, а нужно бооольше. Посмотрите пожалуйста.
Нажмите, чтобы раскрыть...

Увеличено...

bork75 · 24 ноя 2011

Спасибо за оперативные доработки повторяющихся границ. )

По теме... Баг, не баг, но в первые не смог добавить простой кусок кода в "поиск и замена"


*

Текст
Нажмите, чтобы раскрыть...

Хотел заменить всё, что до сам CD, в визуальном видит так
{br} *{br}{br}

Засунул в "поиск и замена" - не обрабатывает.
Полчаса эксперементировал с пробелами и табуляциями и не получилось.

форум сковеркал, прикрепил

Посмотреть вложение пример-cd.txt

Root · 24 ноя 2011

Пожалуйста. Обращайтесь! Рад помочь!
Вместо звездочки в функциях поиск-замены (во всех) используйте {skip}. Переносы строк обозначаются как {br}.

Заменить от начала текста до тега :
HTML:
{skip}|на что заменить
Заменить только эту конструкцию:
HTML:
{br}	{skip}{br}{br}|на что заменить
Получилось?

red · 21 дек 2011

В общем уже несколько раз столкнулся со следующим багом, я всегда когда экспортирую xml файл, его никогда не разделяю на более мелкие файлы, а добавляю 5-6 нуллей в конце выбора размера файла и иногда бывает, что не срабатывает он создает тысячи мелких файлов и все намертво виснит.

Поэтому предлагаю вообще сделать по умолчанию, что бы сохранялось все в один файл, а если кому нибудь надо на мелкие файлы, то дополнительную галочку прикрутить. Или же исправить этот баг, но все равно напрягает все время нули дописывать в размер файла.

Yurijd · 5 янв 2012

А у меня при сканировании сайтов. Периодически перестает парсить ссылки, приходится нажимать кнопку приостановить, затем продолжить. Постоянно следить нет времени, это происходит с периодичностью примерно в 5-10 минут. Хочу поставить на VPS прогу, запустить и забыть, а видимо не получится. В чем может быть проблема?

Root · 5 янв 2012

Здравствуйте.
1.) Какая у вас версия программы?
2.) С какого сайта собираете ссылки?

Yurijd · 5 янв 2012

версия 27.07
сайты допустим вот эти
holoso.ru
bakugan-msk.ru

Мне нужно загрузить список допустим из 500 сайтов с одинаковыми признаками и выпарсить их все. Но почему то зависает даже на этих 3-х

Yurijd · 5 янв 2012

Зависание пока обошел, но тут еще проблема другая возникла.
Вот ссылка politkniga.ru не находит ссылки например на страницы товара politkniga.ru/index.php?productID=3706. Причем я в очереди их вижу, но они не добавляются в нижнее окно. Подскажите в чем может быть дело? И таких сайтов на этом движке много, а парсятся не все, хотя структура одинаковая.

Yurijd · 6 янв 2012

Перезагрузил программу и попробовал поработать с одним этим урлом, блин парсит. Получается что со списком некорректно работает

qazaq1 · 12 фев 2012

Добрый день! вот такая проблема
На картинке открыт файл в экселе, блокноте и опен оффисе
Как видно - в опен оффисе видно, что появились у продукт_ску какие то странные кавычки верхние, причем в блокноте их не видно.
Соответственно, файл не загружается в магазин (загружал ДО открытия, чтоб исключить влияние экселя, блокнота или опен оффиса )
Если в опен оффисе убрать кавычки - то файл в магазин начинает грузиться.
И откуда они берутcя эти кавычки? если их в txt не видно?
Подскажите, как порешать?
Спасибо!
Ссылки недоступны для гостей

Root · 12 фев 2012

Здравствуйте, программа сохраняет в UTF-8 с BOM, теперь появилась возможность сохранять в UTF-8 без BOM (используйте эту опцию).

Content Downloader версии 30.84 (12.02.2012):

- Теперь контент можно сохранять в utf-8 без BOM;
- Теперь можно применять фильтры для обработки существующего списка ссылок очереди сканера сайтов (правый клик по списку);
- Несколько доработок.

bork75 · 16 фев 2012

Использую в проекте настройки:

- Находить статью автоматически
- Использовать шаблон вывода и там <CD_DOCURL!>;<CD_AUTO!>
- Сохранять в один файл csv

Ну и закинул пачку адресов главных страниц сайтов.

В файле csv нет адресов, т.е. не работает <CD_DOCURL!>
Вообще не критично и мне это не нужно особо....

Поставил ещё htm to txt и в файле проскочил такой кусок:

bork75 · 17 фев 2012

В одном проекте задал сегодня в границах парсить <title> и у некоторых это поле осталось пустым,
начал проверять, оказывается CD отреагировал на регистр.

<title> и <TITLE> - парсится что-то одно!

Надеюсь, в ближайшем апдейте это исправится.

Root · 17 фев 2012

Это не баг, просто так задумано , поверьте, это решает больше проблем, чем создает.
Задайте две границы, в одной большие, во второй маленькие буквы, поставьте эти границы рядом (и будет выводиться только одна).

Root · 17 фев 2012

bork75 сказал(а): ↑

Использую в проекте настройки:

- Находить статью автоматически
- Использовать шаблон вывода и там <CD_DOCURL!>;<CD_AUTO!>
- Сохранять в один файл csv

Ну и закинул пачку адресов главных страниц сайтов.

В файле csv нет адресов, т.е. не работает <CD_DOCURL!>
Вообще не критично и мне это не нужно особо....

Поставил ещё htm to txt и в файле проскочил такой кусок:


Нажмите, чтобы раскрыть...

Чтобы шаблон вывода работал, нужно переключиться в "парсить заданные части документа" (также необходимо задать 1 фиктивную границу парсинга, например < и >).

kagorec · 17 фев 2012

Root сказал(а): ↑

Чтобы шаблон вывода работал, нужно переключиться в "парсить заданные части документа" (также необходимо задать 1 фиктивную границу парсинга, например < и >).
Нажмите, чтобы раскрыть...

наврятли это поможет, с выставленными htm to txt не чистит внутреннее содержимое первого тега, это заметно в csv выводе.
Например есть в интернет магазине храктеристика и заключена тегом span и не просто тегом а со всякими эффектами (типа onmouseover="showhint(' и т.д.) на javascript, вот такое добро проскакивает порой какбудто парсер не в силе очистить разрешенный тег

Войти или зарегистрироваться

Баг-репорты

Flash New Member Пользователи

Focus New Member Пользователи

Flash New Member Пользователи

Weetal New Member Пользователи

Root Администратор Администратор

bork75 New Member Пользователи

Root Администратор Администратор

red New Member Пользователи

Yurijd New Member Пользователи

Root Администратор Администратор

Yurijd New Member Пользователи

Yurijd New Member Пользователи

Yurijd New Member Пользователи

qazaq1 New Member Пользователи

Root Администратор Администратор

bork75 New Member Пользователи

bork75 New Member Пользователи

Root Администратор Администратор

Root Администратор Администратор

kagorec Администратор Команда форума Администратор

Поделиться этой страницей

Войти или зарегистрироваться

Баг-репорты

Flash New Member Пользователи

Focus New Member Пользователи

Flash New Member Пользователи

Weetal New Member Пользователи

Root Администратор Администратор

bork75 New Member Пользователи

Root Администратор Администратор

red New Member Пользователи

Yurijd New Member Пользователи

Root Администратор Администратор

Yurijd New Member Пользователи

Yurijd New Member Пользователи

Yurijd New Member Пользователи

qazaq1 New Member Пользователи

Root Администратор Администратор

bork75 New Member Пользователи

bork75 New Member Пользователи

Root Администратор Администратор

Root Администратор Администратор

kagorec Администратор Команда форума Администратор

Поделиться этой страницей

Быстрый поиск