Первый раз делаю парсинг

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем kozma, 26 окт 2015.

  1. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    Первый раз парсю и сразу же море вопросов.
    1. Парсер делат сразу два файла csv и csv12. Заполнение у них разное. Для чего это делается?
    2. Автозамена делается для всех проектов? или на каждый проект отдельно?
    3. Я делал список автозамены и не могу найти ее на следующий день. Они где то сохраняются?
     
    Последнее редактирование: 26 окт 2015
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    1) Активируйте опцию "парсить в 1 файл" во вкладке "Контент";
    2) На каждый проект отдельно;
    3) Да, все сохраняется в то же место, где и было для каждого проекта.

    С уважением к вам, Сергей.
     
  3. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    некоторые размеры у меня парсит в даты, простым форматрированием ексел "даты"->"общий" не помогает.
    в csv файл как то можно ссылку на источник-товар оставлять? чтобы легче поиск его происходил?

    И как справку. вопросы могу в отном топике писать? или на каждый вопрос новый топик создавать?
     
    Последнее редактирование: 26 окт 2015
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Замените в ваших размерах точку на запятую и тогда MS Excel не будет менять формат данных. Справка по функциям поиск-замены -> Ссылки недоступны для гостей

    PS: Ваши вопросы можете задавать в этой теме.

    С уважением к вам, Сергей.
     
  5. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    в csv файл как то можно ссылку на источник-товар оставлять? чтобы легче поиск его происходил?

    как указывать парсеру какие категории нужно парсить а какие нет?
    как указывать товары, которые не нужно парсить (например у которых остатки 0 или меньше 5) ?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    1) Вставить в нужное место шаблона вывода (ctrl+2) макрос <CD_DOCURL!>;
    2) Задавать для нужных границы парсинга (смотрите систему помощи);
    3) Использовать макрос [CHECKENTRY] (Ссылки недоступны для гостей).
     
  7. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    ничего не понял.
    1.как узнать где это нужное место?
    2.как их задавать?
    3. где его использовать?

    Я честно говоря ничего не понимаю в программировании и HTML кодах. Есть где нибудь упрощенная инструкция для тех кто в этом ничего не понимает.

    для сайта мы заказывали надстройку. это делается в надстройке?

    PS. Чувствую себя тупым, так как судя по вашим ответам вы говорите элементарные вещи, но мне они не очем не говорят.
     
    Последнее редактирование: 26 окт 2015
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    1) Для начала вставить в любое место шаблона вывода;
    2) Изучить хелп и понять, как;
    3) В редакторе шаблона вывода (ctrl+2).

    Сложного ничего нет, нужно просто приложить усилия и поразбираться.
     
  9. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    Вставил макрос в конце формы, как и сказали, в результате у меня парсит в одну ячейку размер и ссылку:
    128 размер обуви-134 размер обуви см (8-9 лет)Ссылки недоступны для гостей
    и автозамена делается дважды
    Правила автозамены:
    28|28 размер обуви
    34|34 размер обуви
    128-134| 128-134 см (8-9 лет)

    я создал 600 вариантов автозамены и они все пересекаются получаются? Полуается если указать 0|* у меня все цифры 0 на * поменяются? Даже если это 1000 то получится 1***. Как ограничивать что правило действует
     
  10. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Чтобы автозамены не меняли друг друга по нескольку раз изза совпадения заменяемого то строго вказываем начало и конец заменяемого макросами textstart и textend
    Код:
    {textstart}80 cm (9-12 man{textend}|74-80 см (9-12 мес)
    {textstart}56 cм (1-2 мес.){textend}|56 см (0-2 мес)
    {textstart}0{textend}|
    {textstart}1-2{textend}|80-92 см (1-2 года)
    {textstart}2-3{textend}|92-98 см (2-3 года)
    {textstart}3-4{textend}|98-104 см (3-4 года)
    {textstart}4-5{textend}|104-110 см (4-5 лет)
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    А чтобы разделить данные по ячейкам, вставьте между ними [CSVCS]
     
  12. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    открыл настройки парсера Ctrl+o У меня все варианты пропали...? их что нужно было сохранять или они где то у меня сохранились? Как их сохранять перед сменой проекта?
    Чтобы из надстроек убрать категорию во вкладке Ctrl +D нужно соответствующую ссылку удалить просто?
    И как можно сохранить настройки парсера? Может в какой то отдельный фал? переживаю что опять автозамена пропадет
     
    Последнее редактирование: 3 ноя 2015
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Меню - файл - сохранить проект
     
  14. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    Для изменения цены ввел макрос <TOPRICE*1,3><CD_GRAN_20!></TOPRICE> почему то не поменялась цена. в чем дело?
    Ссылки недоступны для гостей
     
  15. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Приложите ваш файл проекта, посмотрим, в чем дело.

    С уважением к вам, Сергей.
     
  16. kozma

    kozma New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    8
    Прикрепил.
     

    Вложения:

  17. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте еще раз.

    У вас срабатывает [IFNIL2] и выводит <CD_CYCLE_GRAN_2!>. Вам нужно редактировать макрос TOPRICE не в редакторе шаблона вывода, а в настройке повторяющихся границ (ctrl+5).

    С уважением к вам, Сергей...
     
  18. Anufriy

    Anufriy New Member Пользователи

    Регистрация:
    22 июл 2013
    Сообщения:
    4
    Парсинг aliexpress.com

    Добрый вечер.
    Сергей, подскажите как спарсить aliexpress.com,
    конкретно - Ссылки недоступны для гостей
    чтобы все разбивало по полкам
    Пример:
    1 Холодный, 7w 24D 110V E27, 108,70 руб
    2 Холодный, 7w 24D 220V E27, 108,70 руб
    3 Холодный, 12w 36D 110V E14, 119,77 руб
    и т.д.
     

Поделиться этой страницей