Предложения по улучшению программы

Тема в разделе "Развитие Content Downloader", создана пользователем Root, 13 мар 2010.

  1. Kotjara

    Kotjara New Member Пользователи

    Регистрация:
    4 янв 2011
    Сообщения:
    37
    Все-таки как ни пробовал, ничего не выходит, получается только нижнее подчеркивание, а надо тире. Может можно подправить?
     
  2. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Скиньте проект в ЛС или скайп, чтобы можно было посмотреть
     
  3. OnMan

    OnMan New Member Пользователи

    Регистрация:
    20 апр 2012
    Сообщения:
    11
    Столкнулся с проблемой ресайза картинок... Скриптом обработать картинку не получается так как все пхп скрипты выполняются ДО сохранения картинки на диск. Предлагаю сделать функционал по обработке картинок, ресайз, кроп, водяные знаки и тд.
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Для массовой обработки сохраненных картинок пльзуйтесь программой Ссылки недоступны для гостей
     
  5. vovafrost

    vovafrost New Member Пользователи

    Регистрация:
    31 мар 2012
    Сообщения:
    2

    Да этой же прогой пользуюсь - очень удобно и ресайз масовый и обработка водяных знаков с картинок, все можно делать.

    Хорошо бы макрос переводчика добавить гугловского - с какого на какой при загрузке переводить.
     
  6. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Гугловский макрос сейчас платный, вряд ли многих это устроит. Используйте другие переводчики, которые сейчас бесплатные. Большинство выдают скрипты API бесплатно.
     
  7. Kotjara

    Kotjara New Member Пользователи

    Регистрация:
    4 янв 2011
    Сообщения:
    37
    Написал в личку.
     
  8. Kotjara

    Kotjara New Member Пользователи

    Регистрация:
    4 янв 2011
    Сообщения:
    37
    А такой функционал можно добавить?

    Ссылки недоступны для гостей

    1) В "массовую обработку файлов" в поле "что добавить" возможность использовать макрос <CD_TITLE!>, который будет вставлять текст из поля "заголовок".
    2) В поле "на указанную строку" возможность ставить не одно число. Например, 5-9, тогда вставка в каждую статью будет рандомной с 5 по 9 строку.
     
    Последнее редактирование модератором: 17 июн 2012
  9. cdcustomer

    cdcustomer New Member Пользователи

    Регистрация:
    17 мар 2012
    Сообщения:
    41
    Добрый день. Хочу предложить сделать два вида вывода для спарсенного текста. К примеру, один идёт в формате csv (title,url,image) - сохраняем в ***.csv и второй файл выгрузки как обычно:

    <CD_GRAN_1!>
    <CD_GRAN_2!>
    <CD_GRAN_3!>
    <CD_GRAN_4!>
    <CD_GRAN_5!>
    <CD_GRAN_6!>
    <CD_GRAN_7!>
    <CD_GRAN_8!>
    <CD_GRAN_9!>
    <CD_GRAN_10!>
    <CD_GRAN_11!>
    <CD_GRAN_12!>

    Чтобы не парсить два раза одно и то же для разных нужд. Было бы очень круто добавить такую функцию.
     
  10. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Говорил с автором. Сейчас есть более приоритетные задачи.
    Если хотите реализовать эту, найдите убедительные аргументы, которые показали бы целесообразность того, чтобы удилеть ей время именно сейчас
     
    Последнее редактирование: 28 июн 2012
  11. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    В режиме "Предпросмотр элемента", когда переключаешься по ссылкам, часто нужно знать какое количество элементов спарсилось.

    Если список длинный (у меня частенько больше 30-40 элементов) и не виден на экране, приходится на каждой ссылке скрол вниз опускать.

    Предлагаю рядом со скролом добавить чекбокс "зафиксировать скрол" или "запомнить положение скрола", т.е. когда будем листать по страницам он будет на одном месте

    [​IMG]
     
    Последнее редактирование: 30 июн 2012
  12. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Тут задача мне видится немного шыршэ. То есть, чаще всего при подобном просмотре, приходится отслеживать колонки. Значит, надо, чтобы запоминание происходило и по вертикали и по горизонтали. Так будет правильнее. Ещё лучше, если будет возможность выбора,- горизонталь, вертикаль, или оба.

    Автору я преджложение передал. Ждём приговора
    Приговор автора: будет сделано
     
    Последнее редактирование: 30 июн 2012
  13. yup

    yup Member Пользователи

    Регистрация:
    20 июн 2012
    Сообщения:
    44
    Для парсинга Яндекс.Маркета со страниц такого вот типа Ссылки недоступны для гостей мне нужно перейти на страницу магазина и взять там какое нибудь значение. Для этого я в повторяющихся границах по исходной ЯМ странице использую макрос <GETMORECONTENT><URL="[VALUE]"><START="<title>"><STARTCOUNT="0"><END="</title>"><ENDCOUNT="0"><PARAMS=""></GETMORECONTENT>

    Проблема в том, что, как я понимаю, все запросы этого макроса в рамках одного цикла обработки одной исходной страницы ЯМ выполняются либо одновременно либо последовательно но без пауз. В итоге, не смотря на то что в настройках у меня стоит 1 поток и пауза >5000мс, ЯМ меня банит.

    Предлагаю добавить где нибудь либо в параметрах повторяющихся границ либо в макросах возможность задать паузу между запросами. Ну.е. либо доп чек бокс в параметрах, либо макрос <PAUSE> который можно будет поставить перед <GETMORECONTENT>
     
    Последнее редактирование: 30 июн 2012
  14. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    <GETMORECONTENT> тут ни при чём. Яндекс это нечто особенное и непредсказуемое, но, судя по вашему описанию, у вас проблема возникает не потому что нет пауз между циклами, а потому что запрос выполняется сразу же как только вы открываете страницу Яндекса. Всё решается проще, если спарсить сначала ссылки из Яндекса, а затем, другим проектом, уже гулять себе по нужным сайтам. Если я что-то неправильно понял, высылайте проект, посмотрим.
     
  15. yup

    yup Member Пользователи

    Регистрация:
    20 июн 2012
    Сообщения:
    44
    Да проект то простецкий: открывается страница ЯМ по типу приведенной выше, с неё повторяющимися границами берутся ссылки на сайты продавцов товаров (т.е. с одной страницы ЯМ таких ссылок берется 20шт). Проблема в том, что ссылки не прямые а редирекченые, такого вот типа Ссылки недоступны для гостей
    Мне же нужны либо прямые ссылки (я уже понял что получить их можно только отправляя редиректы в PHP-скрипт и от туда получая значения, но пока этот способ для меня сложен) либо какие то данные с тех страниц продавцов (в частности - заголовки старниц). Для этого я макросом <GETMORECONTENT> лезу по редиретным ссылкам ЯМ и получаю нужные мне значения. Но при этом, как я понимаю, макрос срабатывает БЕЗ ПАУЗ 20 раз (по числу полученных повторяющимися границами редиректных ссылок), и у меня получается цикл: 5000мс перерыв - 20запросов без пауз - 5000мс перерыв - 20 запросов без пауз и т.д. Ну Яндекс меня за это и банит. Как вариант, конечно, можно делать все 2-мя проходами, в первый собирать редиректные ссылки, во второй по ним переходить, но это дополнительные телодвижения, хотелось бы иметь возможность делать всё в один проход...
     
  16. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Теперь стало понятней (надо было сразу показать правильную ссылку). Я передам автору задачу, посмотрим, что он скажет, возьмётся усмирять Яндекса или нет?
     
  17. cdcustomer

    cdcustomer New Member Пользователи

    Регистрация:
    17 мар 2012
    Сообщения:
    41
    Денег предложить чтоли?

    Разве мне одному пригодилась бы функция вывода спарсенного теста в два вида или в разные файлы. Можно ведь выводить разную инфу в разной раскладке, с разным шаблоном. В csv вообще просто. В прогу встроить функцю с галочкой - выводить в csv и меню с галочками возле <CD_GRAN_1!> и др.

    С этой доп. функцией можно выводить как основной текст в один файл, так и в другой файл выводить только ключевики с каждой спарсенной страницы. Увеличивается КПД программы в несколько раз. Примеров использования этого симбиоза можно придумать огромное количество.
     
    Последнее редактирование: 1 июл 2012
  18. zilon

    zilon New Member Пользователи

    Регистрация:
    24 дек 2011
    Сообщения:
    80
    Предлагаю сделать функцию замены русских букв латинскими, пробелов знаком тире и удалять скобки, одинарные и двойные кавычки, слеши, спец символы, знаки препинания, а также переводить все буквы из границы парсинга, в нижний регистр.

    Это нужно, чтобы после парсинга в шаблоне вывода, выводить красивые и оптимизированные под запрос человеко понятные урлы. Например текст из заголовка странички(первой границы парсинга) трансформируется и запишется в ячейку базы данных и станет урлом странички. Просто сейчас, приходится извращатся и выводить, например время установленное на компе вот пример

    то что есть сейчас

    new-muzon.net/4173-2012-06-29-16-47-28.html

    то что может быть

    new-muzon.net/4173-erotic-desires-volume-235-2012.html
     
  19. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Предлагаю добавить таймер - время сколько программа уже работает и хотя бы примерно - время завершения.

    [​IMG]


    zilon, посмотри в доп. настройках перевод в транслит есть и по работе с чпу тоже были инструменты.
     
    Последнее редактирование: 1 июл 2012
  20. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Уже сделано
    - Тепер при предпросмотре результатов парсинга контента в CSV запоминается положение левой колонки и верхней строки (обновление по убедительной просьбе одного человека).

    Сделается
     
    Последнее редактирование: 1 июл 2012
    bork75 нравится это.

Поделиться этой страницей