Предложения по улучшению программы

Тема в разделе "Развитие Content Downloader", создана пользователем Root, 13 мар 2010.

  1. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Почему вы там не хотите обойтись обычной поиск-заменой?
     
    kagorec нравится это.
  2. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Когда значения характеристик "Да" и "Нет" в разных интерпритациях я могу согласиться, их не особо много для какой-то определенной характеристики.

    Но бывают характеристики, значения которых пишутся по разному. И например фраза "0,5 терабайт оперативной памяти" может писаться везде по разному: начиная от случайно пропущенного пробела во фразе или большой буквы, вплоть до транслита всех символов. И при настройках фильтрации в ИМ одно и то же значение характеристики, которое визуально похоже, может выводиться дважды, и только потому что там стоит дополнительный пробел или заглавная/строяная буква в тексте.

    Я говорю про реализацию функции именно в Редакторе CSV. Чтобы функция, при выборе столбца собрала все её значения, автоматом отфильтровала (убрала) дубли, и в дальнейшем можно было сделать выбор нужных тебе столбцов (показывал пример в посте ранее), подставить нужное значение, нажать "Применить" и все значения, которые были выбраны - изменились на то, что было прописано.

    Да, это можно делать обычным поиск-заменой, прописывать для каждого значения и менять их. Но мне кажется предложенный мною функционал облегчил бы жизнь.

    Например я часто использую функцию объединения нескольких CSV (Для дальнейшей выгрузки в CMS). И чтобы в этой объединенной CSV быстренько выбрать нужные столбцы, где в ИМ работает обязательное значение определенных характеристик (Например объем памяти, диагональ экрана и бренд, а у кого то это еще 50 пунктов), отредактировать их так как необходимо, сохранить и выгрузить.

    В целом если заморачиваться, искать каждое значение которое имеет случайный пробел или транслитные буквы, то поиск-замены для этого будет хватать, но моя идея - считаю очень хорошая (ИМХО).
     
  3. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Здравствуйте! В редакторе CSV файлов - при разбитии открытого CSV по названиям рубрик и дальнейшем сохранении в UTF-8 без BOM данные не сохраняются должным образом, остаются пустые ячейки без шапки, при этом этот же файл в кодировке ansi сохраняется без проблем. Хотелось бы подправить этот момент. В хайде ссылка на файл для теста
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 11470 постов.**
    Предлагаю также добавить сохранение файлов обычным UTF-8.

    P.S. При сохранении каждого файла вручную (Если открывать файл, который был разбит, сохранен и открыт в ansi) сохранение в том же UTF-8 без BOM идет нормально
     
    Root нравится это.
  4. jozess

    jozess Member Пользователи

    Регистрация:
    19 дек 2010
    Сообщения:
    122
    Добрый день. Увидел такую фишку в Рипере, и очень хотелось бы чтобы реализовали в CD.
    Данная особенность ускорит работу с макросами в несколько раз, а именно - Поиск по описанию:

    [​IMG]


    Как это работает в Рипере:

     
    kadishev1997 нравится это.
  5. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    В редакторе CSV Файлов добавить функцию "Сортировка столбцов в алфавитном порядке", как это реализовано в Автоматизации парсинга контента (ctrl + u).
    Периодически требуется склеивать несколько CSV, и данная функция немного бы упростила работу с одной склееной CSV (Например, чтобы понимать, что от разных поставщиков характеристика "Объем" и Объём" - будут выдавать разные значения, и чтобы не искать по всей CSV этот параметр, они будут находиться рядом, дабы его отредактировать).
     
    Dron25, green и Root нравится это.
  6. green

    green Active Member Пользователи

    Регистрация:
    25 окт 2017
    Сообщения:
    75
    Добрый день
    Такое предложение..
    В редакторе CSV файлов в инструменте "удалить дубли строк" добавить возможность записи удаленных дублей в отдельный файл.
     
    Root нравится это.
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Приступил к решению вашего вопроса, но файлы на файлообменнике были удалены. Если хотите, можете приложить файл снова.
     
  8. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 11490 постов.**
    - ссылка на файл, обновил
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Замените файл Content Downloader.exe (в папке с программой) этим файлом:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 23 постов.**
     
  10. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Здравствуйте! Скорее всего сложно реализуемая, но идея.
    Такой момент: сделать дополнение к макросу [DYNAMICVALUES]

    Например, есть 50 характеристик, которые были собраны ранее с одного сайта. Для примера возьмем этих 2 товара:
    1. Ссылки недоступны для гостей
    2. Ссылки недоступны для гостей
    Предположим, что у каждого из них 25 разных не пересекающихся характеристик.
    У нас есть шаблон CSV с каждой ранее собранной характеристикой, в котором находятся каждая необходимая характеристика под нужным номером (Например, характеристика "Объем" находится в 10 колонке, а характеристика "Гарантия" находится в 12 колонке)

    При парсинге характеристик с [DYNAMICVALUES] будут с нуля создаваться характеристики и их значение сначала товара №1, а после товара №2.
    Если их переставить местами, то логично сначала будут подтянуты характеристики товара №2, а после №1.

    Добавить функцию в [DYNAMICVALUES], чтобы он брал ранее созданный шаблон CSV, где находятся нам необходимые характеристики по нужным полям, подставлял эти характеристики в строку заголовка, и при парсинге раскладывал значения характеристик в уже созданные из шаблона CSV, а новые характеристики записывал строчками правее.

    Прикрепил скрины, для наглядности.

    Не знаю, можно ли такое реализовать, но думаю будет очень крутое дополнение к этому макросу
     

    Вложения:

    • 001.png
      001.png
      Размер файла:
      37,5 КБ
      Просмотров:
      5
    • 002.png
      002.png
      Размер файла:
      39,8 КБ
      Просмотров:
      5
    • 003.png
      003.png
      Размер файла:
      43,1 КБ
      Просмотров:
      5
    Root нравится это.
  11. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    При парсинге из большого разбитого YML Файла связывать шапку ID Категории с товаром. При этом, чтобы можно было выбирать, привязка будет к "category id", или же к "parentId".
    Как-то про это уже говорилось в видео когда была реализована функция разбития больших XML/YML, но вот привязку категории к товару хотелось бы увидеть в программе
     
    Root нравится это.
  12. ltt

    ltt Member Пользователи

    Регистрация:
    21 дек 2016
    Сообщения:
    112
    Добрый день, Сергей! Можно ли преднастроить шапку и подвал при парсинге в xml файл?
    Например, шаблон вывода для каждого элемента:
    Код:
    <offer id="[INT_ID]" available="true">
        <url><CD_DOCURL!></url>
        <price><CD_GRAN_1!></price>
        <name><CD_GRAN_2!></name>
        <currencyId><CD_GRAN_4!></currencyId>
        <CD_CYCLE_GRAN_1!>
        <vendor>brand</vendor>
        <vendorcode><CD_GRAN_3!></vendorcode>
    </offer>
    хотелось бы добавлять в итоговый файл шапку, например:
    Код:
    <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE yml_catalog SYSTEM "shops.dtd">
    <yml_catalog date="2019-10-28 09:29">
        <name>Brand</name>
        <url>url</url>
        <currencies>
            <currency id="RUB" rate="1"/>
        </currencies>
        <offers>
    и в подвал
    </offers>
    </yml_catalog>
     
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    2019-11-07_13-07-52.png
     
    ltt нравится это.
  14. Grushe

    Grushe Member Пользователи

    Регистрация:
    10 апр 2014
    Сообщения:
    45
    Скажите, а не планируется работа программы с Ссылки недоступны для гостей ?
     
  15. Grushe

    Grushe Member Пользователи

    Регистрация:
    10 апр 2014
    Сообщения:
    45
    Для каждого проекта, хочется вставить комментарий. Куда его записать не могу выбрать. Комментарий может быть типа, "Не парсить сканером сайта, а скачать sitemap, открыть через Exel и взять URL".
     
  16. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Встроенный блокнот Ctrl+J
    или в шаблоне вывода добавить комментарий Ссылки недоступны для гостей
     
  17. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Серега, еще раз ворошу эту тему. Сделай на форуме и сайте колонку донатеров. Заголовок типа "Спасибо за донат!" или "Наши партнеры" или что-то еще в тему и, чтобы туда транслировались сумма доната, имя (ник) и пожелания. Можно туда же транслировать твои ответы типа "и вам хорошего дня" или "спасибо за поддержку проекта" и т.д.

    Можно сделать донатерский раздел на форуме, где разбирать какой-нить эксклюзивчик. Заведи страницу на Патреоне. По подписке можно давать доступ в закрытый раздел форма, публиковать видео по решению прикладных задач, можно выкладывать красивые проекты для парсинга популярных ресурсов. Но главное выкладывать благодарности патронам на видном месте сайта и форума.

    CD - мощнейший инструмент для заработка и пользуюсь я им ежедневно в решении задач даже не связанных с парсингом. И я донатил и буду донатить. Хотя - это единственный проект в который мне действительно хочется донатить. Вот только мне орать хоца, когда я вижу зеленую кнопку с доступным обновлением, но не вижу в окне под списком новшеств ссылочки: "Пожалуйста, поддержите проект. Спасибо!" Ведь ну не трудно же это сделать.
     
    Dron25, GRINE и Root нравится это.
  18. Vsevlod

    Vsevlod New Member Пользователи

    Регистрация:
    4 апр 2019
    Сообщения:
    8
    Город:
    Минск
    Добрый день.
    Можно ли добавить в редактор CSV файлов возможность удалить изображения с диска, которых нет в CSV файле.
    Спасибо.
     
    Root нравится это.
  19. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Допилка функции с автоматизацией.

    При разбитии большого YML/XML создаются файлы формата C:\(папка)\SplitFiles\SplitFile_1.xml; ..._2.xml и т.д.
    В функции фильтрации документов (ctrl + t) создаются эти же пути (SplitFile_1.xml). Допустим, у нас собралось 10 товаров, и они записались, чтобы не было повторного парсинга этих же товаров.

    Например, в XML файле было 10 ссылок на товар. На сайте добавился 1 товар и убрали 1 товар, тем самым у нас осталось тех же 10 товаров, но ссылка этого товара была проигнорирована, т.к. ей прописалось имя файла SplitFile_10.xml, и соответственно она не обработалась.

    Предлагаю добавить:
    1. Формат сбора ссылок на основе файла, который имеет определенный тег (в данном случае <url>...</url>), который будет собирать ссылки, и в дальнейшем новые товары заносить в список и обрабатывать, а старые не трогать.
    2. Прописывать обычную границу парсинга, в которой указан тот самый url-путь товара.

    Как по мне, первый вариант будет немного лучше, т.к. почти все XML/YML прописывают свои url товаров
    _____
    UPD: Также добавить функцию (галочку), которая будет позволять сохранять документ, в котором нет результатов (оказался пустым), и в дальнейшем его отправлять на FTP
     
    Последнее редактирование: 25 ноя 2019
    Root нравится это.
  20. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Замените файл Content Downloader.exe (в папке с программой) этим файлом:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 30 постов.**
    2019-11-27_13-01-24.png
     
    Dron25 и kadishev1997 нравится это.

Поделиться этой страницей