Парсинг с сохранение структуры сайта и присвоением ID

Тема в разделе "Решение различных задач по парсингу", создана пользователем fin79dream, 27 авг 2018.

  1. fin79dream

    fin79dream New Member Пользователи

    Регистрация:
    5 авг 2018
    Сообщения:
    10
    Приветствую!
    Тема вроде заезженная, но ответа так и не нашел.

    Как сохранить структуру сайта от главной страницы до конечной страницы?

    Один метод, это использование [DOCNAME]<CD_GRAN_1!>.csv[/DOCNAME], таким образом можно разложить все страница структурно, согласно иерархии, но при этом образовав огромное количество csv файлов. Можно ли в один каждый раздел и конечные страницы, пока не разобрался.

    Но в любом случае, выше описанный метод сохраняет структуру в ввиде папок/подпапок и разрозненных файлов. Но как все это многообразие импортировать в БД с сохранением этой структуры:
    1) где конечная страница будет знать к какой подподкатегории/подподкатегориям она относится;
    2) в свою очередь, как подподкатегории будут знать к какой подкатегории/подкатегориям они относятся;
    3) и как подкатегории будут знать, к какой категории/категориям они относятся?

    в БД все конечные страницы и категории всех уровней, кроме своего уникального цифрового ID имеют ID категории к которой они относятся и таким образом сохраняется структура.

    [​IMG]

    Я понимаю как собрать отдельно категории и отдельно конечные страницы в csv, но как при парсинге и выгрузке прописать категориям и конечным страницам ID, чтобы это ID еще указывалось в дочерней категории или странице, которая следует за родительской категорией?

    Возможно, что присвоить ID в строках csv можно уже после сохранения всех данных?

    Подскажите, в сторону каких макросов смотреть, чтобы прописать ID с сохранением привязки/иерархии или другие методы.

    Спасибо.

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Тут 2 варианта, 1 и на мой взгляд правильный, сделать обработку через макрос excel. Второй попробовать через кучу проэктов с присвоением и последующем чтении [PARAM] (но не всегда работает логика именно осознания, как оно должно быть).
    Надо пробовать.
     
  3. fin79dream

    fin79dream New Member Пользователи

    Регистрация:
    5 авг 2018
    Сообщения:
    10
    Спасибо за ответ!
    Имеете ввиду парсить все древовидно по папкам - категория>подкатегория>подподкатегория>конечная страница - с распределением каждой страницы в свой отдельный файл csv и далее обрабатывать макросом с прописыванием ID согласно местоположению файла?
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    ну типа да
     
  5. fin79dream

    fin79dream New Member Пользователи

    Регистрация:
    5 авг 2018
    Сообщения:
    10
    с написанием макросов excel я на ВЫ, то есть совсем ноль. если у вас есть необходимые знания, можете реализовать подобное присвоение ID в excel на платной основе?
     
  6. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    да, стучите в скайп kreol2011
     

Поделиться этой страницей