Парсинг названий для товаров

Тема в разделе "Решение различных задач по парсингу", создана пользователем Love-world, 14 мар 2014.

  1. Love-world

    Love-world Member Пользователи

    Регистрация:
    19 июл 2013
    Сообщения:
    102
    Добрый день уважаемые форумчане.
    Предположим мы парсим зарубежный ИМ и подключаем автоматический машинный перевод, ну например от гугла.
    Описания еще туда сюда, но самое главное - названия товаров, т.е. их имена, если по другому говорить практически во всех случаях, если не во всех, очень корявые ввиду машинного перевода.
    Известное дело, редактирование имен вручную, а если товаров 1000, а если 3000?! Неужели каждый из нас обременяет себя столь рутинным занятием?! Интересует автоматизация присвоения более менее качественных имен для товаров, и придание им читабельного вида.
    Есть идея, парсинг имен для наших товаров с других, русских тематических шопов по ключевым словам, с последующей скажем синонимизацией.
    Вопрос, как реализовать поиск имен по ключевикам на сторонних ресурсах.
    Понятное дело парсить нужно будет при помощи getmorecontent, но как сопоставлять эти названия с нашими товарами, чтобы не получилась белиберда?! Буду рад любым идеям. Спасибо.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Думаю, надо искать тот параметр товара, что 100% уникален и искать по нему, например SKU...
    Также может не стоит переводить названия товаров...
     
  3. Love-world

    Love-world Member Пользователи

    Регистрация:
    19 июл 2013
    Сообщения:
    102
    Спасибо за ответ. Возьмем для примера набивший оскомину алиекспресс, ваша мысль по поводу артикула хороша, но на али нет ничего близко к этому, плюс ко всему каким образом посредством программы можно производить поиск. И почему вы говорите о том, что не стоит переводить названия?! Ведь в свой шоп не будешь же загружать с англ названиями?!
     

Поделиться этой страницей