Предложения по улучшению программы

Тема в разделе "Развитие Content Downloader", создана пользователем Root, 13 мар 2010.

  1. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ctrl+l при парсинге во вкладке контент или ссылки.
     
  2. ilshat

    ilshat New Member Пользователи

    Регистрация:
    18 янв 2014
    Сообщения:
    3
    Будет просто здорово, если появится вывод в формате .xls, xlsx Excel.

    С csv напрягает наличие конфликтов использования точки с запятой, т.к. она часто встречается в тексте документов. Если использовать составные символы, то в excel не всегда просто загнать такой csv. По причине обозначенной выше использую ~ в качестве разделителя, предварительно проверив, нет ли в самих текстах такого символа.
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    В последней версии программы никаких конфликтов с точкой с запятой нет, делать вывод в xls ни к чему. Создайте новый проект (shift+ctrl+n) и пробуйте.
    Спасибо за обращение!
     
  4. Benjamin Coleman

    Benjamin Coleman New Member Пользователи

    Регистрация:
    23 окт 2010
    Сообщения:
    152
    Поля пихайте в кавычки, а в качестве разделителя используйте | - это решает все проблемы, проверено.
     
  5. mat

    mat New Member Пользователи

    Регистрация:
    8 май 2010
    Сообщения:
    63
    Приветствую.
    А можно сделать, чтобы макрос [FIRST_REPLACE] выполнялся до [IFNIL]? Сейчас, судя по логу, он выполняется после [IFNIL].
    Или подскажите, где можно вырезать текст в динамических границах до вывода.


    Разобрался, мне нужен был [IFNIL2]
     
    Последнее редактирование: 22 янв 2014
  6. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    214
    Вношу предложение сделать так чтобы можно было в макросе [GETMORECONTENT] передавать произвольные хеадеры.

    В данный момент приходится отправлять нужный урл в пхп скрипт а потом в нем присваивать хеадеры, получать то что нужно и только после этого возвращать.

    Спасибо что выслушали.
     
  7. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    214
    Другое предложение:
    Когда делаешь csv шаблон приходится заново набивать названия колонок, в то время как у границ уже есть названия. Было бы неплохо если бы при перетаскивании границы в поле названия колонки туда вставлялось название.
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Так и происходит...
     
  9. alamina.moon

    alamina.moon Модератор Команда форума Модератор

    Регистрация:
    14 янв 2013
    Сообщения:
    214
    В режиме редактирования csv таблицы в шаблоне можно переносить, а вот если поле просто текстовое то запрещено.

    Ссылки недоступны для гостей
     
    Последнее редактирование: 31 янв 2014
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Кнопочка самая первая CSV (слева) на панели инструментов (на вашем скриншоте). Нажмите на нее и перетаскивайте в верхние ячейки таблицы.

    Также через две кнопочки вправо( от вышеуказанной кнопочки) есть еще одна заветная кнопочка в виде белого плюсика. Если нажать на нее, то все не вставленные в шаблон вывода границы парсинга будут добавлены вместе с названиями колонок (названия колонок добавятся в строку заголовка).

    Также рекомендую хотя бы просто ознакомиться с кнопками на панели инструментов, это часто бывает очень полезно =)
     
  11. mat

    mat New Member Пользователи

    Регистрация:
    8 май 2010
    Сообщения:
    63
    А можно сделать удаление дублей строк в документе? Чтобы оставалась только первая.
    В массовой обработке файлов, либо макрос в шаблоне вывода.
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Спасибо, учли.
     
  13. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Добрый день всем!
    Так как не совсем ясно будет ли в cd возможность работать с antigate.com предлагаю при парсинге гугла рандомно вводить "пустую или левую ссылку", пользователь ее видеть не будет, которая будет разбавлять цепочки обращений. Очень актуально при 10000 запросов с параметрами, очень уж сейчас гугл не хочет их отдавать. Это на 35% уменьшит возможность получения бана. Проверял при парсинге гугла через excel.
     
  14. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    предлагаю ВЕРНУТЬ в новый интерфейс
    1. опцию "удалять теги ссылок". причина: она элементарно удобнее, чем макрос. одно движение против 4-х. в новом интерфейсе не нашел.
    2. опцию "ссылаться на источник". хорошая, незаслуженно убитая тема. по крайней мере, сходу не нашел.
    3. опцию "ожидать закрытия тега" - вообще бомбовская фича, которая исчезла потому что потому. предлагаю вернуться к вопросу о ее возврате.

    к слову, ликвидированная опция "htm2txt" также удобнее, чем одноименный макрос.
     
    Последнее редактирование: 4 фев 2014
  15. mat

    mat New Member Пользователи

    Регистрация:
    8 май 2010
    Сообщения:
    63
    Макрос <CD_DOCURL!>

    Только я оборачивал его в REPLACE, чтобы оставался только адрес главной:

    Источник: <a target="_blank" href="[FIRST_REPLACE(re:http://(.*?)/.*|http://$1)]<CD_DOCURL!>[/FIRST_REPLACE]" >[REPLACE(re:http://(.*?)/.*|$1)]<CD_DOCURL!>[/REPLACE]</a>
     
  16. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    Уважаемый MAT! Я очень неплохо, если не сказать очень хорошо знаю программу, и могу легко решить все перечисленные мною задачи. Речь не идет о каких-то неразрешимых проблемах, я говорю об элементарном удобстве. Вы сами посмотрите, что написали:

    Код:
    Источник: <a target="_blank" href="[FIRST_REPLACE(re:http://(.*?)/.*|http://$1)]<CD_DOCURL!>[/FIRST_REPLACE]" >[REPLACE(re:http://(.*?)/.*|$1)]<CD_DOCURL!>[/REPLACE]</a>
    Красивое решение. Но почему-то вариант "поставить пычку" мне нравится больше. :)
     
  17. mat

    mat New Member Пользователи

    Регистрация:
    8 май 2010
    Сообщения:
    63
    Уважаемый nikolas1612, я прекрасно понимаю, что в программе Вы отлично разбираетесь, гораздо лучше меня и не раз мне помогали (за что отдельное спасибо), я просто решил поделиться одним из вариантов решения, вдруг кому пригодиться.
    А по-поводу удобства где-то уже было :D
     
  18. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Приветствую!
    Большая просьба в дополнительных настройках повторяющихся границ парсинга, добавить кнопочки разделителей [CSVCS][CSVLB]{SKIP} а то надоедает копипастить и руками писать. Спасибо.
     
  19. catol

    catol New Member Пользователи

    Регистрация:
    8 сен 2013
    Сообщения:
    32
    <CD_AUTO!> - Автоматически парсит текст с текущей web-страницы (по параметрам div). А можете доработать, чтоб парсил, с указанного url. Пример: [CD_AUTO!]http://mysite.ru/post-4322.html[/CD_AUTO!]
     
  20. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте!

    Подобное уже давно реализовано:
    Ссылки недоступны для гостей - обратите внимание на параметр auto
    С уважением к вам, Сергей.
     

Поделиться этой страницей