Привести характеристики и значения из множества источников, к единому виду?

Тема в разделе "Парсинг характеристик товаров", создана пользователем itgroup, 5 июл 2022.

  1. itgroup

    itgroup New Member Пользователи

    Регистрация:
    17 ноя 2016
    Сообщения:
    6
    Добрый день славному сообществу, нашего любимого парсера!

    Данные берутся из десятка файлов xml, и десятка интернет магазинов.
    У всех разные характеристики и их значения.
    Настройка поиска-замены потребует невероятных трудозатрат.
    Возможно существуют программные продукты, для подбора по синонимам слов, близким по значению?

    Буду благодарен за каждый совет, как упростить данную работу и сделать удобной.
     
  2. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    1) Данные в бд
    2) характеристики по столбцам
    3) извлекаете уникальные (без дублей) названия характеристик
    4) составляете список замен
    5) запросом к бд - переименовываете названия характеристик по списку замен
     
    itgroup нравится это.
  3. itgroup

    itgroup New Member Пользователи

    Регистрация:
    17 ноя 2016
    Сообщения:
    6
    Спасибо за ответ. Имеется ввиду база данных SQL или DBF?
     
  4. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Любая
     
    itgroup нравится это.
  5. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Можно вообще держать данные в MongoDB в виде json и также запросами обрабатывать
     
    itgroup нравится это.
  6. itgroup

    itgroup New Member Пользователи

    Регистрация:
    17 ноя 2016
    Сообщения:
    6
    К сожалению пока нет знаний, для работы с базами данных. Знаю только эксель.
     
  7. masrub

    masrub Well-Known Member Пользователи

    Регистрация:
    29 июн 2018
    Сообщения:
    194
    Тогда гулите макрос "похожие тексты" для excel и сопоставляйте названия характеристики на разных донорах приводя их единому виду.
     
    itgroup нравится это.

Поделиться этой страницей