Ally Express и первое знакомство с CD Х1

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем ПолныйТормоз, 14 ноя 2015.

  1. ПолныйТормоз

    ПолныйТормоз New Member Пользователи

    Регистрация:
    14 ноя 2015
    Сообщения:
    33
    Здравствуйте.
    Надо "позаимствовать" описание, фото с алли экспресса в CSV.

    ( Ссылки недоступны для гостей )

    Но там изложено совсем никак в видео на ютубе.

    Описание:
    Ссылки недоступны для гостей
    Тут надо в 1 ячейку все описание.

    Направьте пожалуйста на путь истинный =)
     
    Последнее редактирование: 14 ноя 2015
  2. J!Life

    J!Life Модератор Команда форума Модератор

    Регистрация:
    6 дек 2013
    Сообщения:
    83
    Фото
    Берем в границу область картинок (начало и конец)
    1. window.runParams.imageBigViewURL=[
    2. ];

    Берем повторяющуюся границу, в которой ставим - брать контент из границы такой то (указываем верхнюю границу)
    В ней ставим 1. " 2. " - кавычки
    В доп. настройках повт. границ ставим разделитель [CSVLB]

    Описание
    Граница
    1. product-params">
    2. </div>{br} </div>
    Вставляем границу в шаблон, обрамляем ее макросом replace - и работаем над удалением или заменой ненужных тегов.
    Это получится блок характеристик, а не описания

    Само же описание находится в блоке с id="custom-description"
    Но для его парсинга скорее всего потребуется включение DOM в настройках

    Все это элементарно! Просто кто-то очень ленивый ;)
     
  3. ПолныйТормоз

    ПолныйТормоз New Member Пользователи

    Регистрация:
    14 ноя 2015
    Сообщения:
    33
    Понятно, что ничего не понятно. Ладно, штудируя ютуб буду по шажкам разбираться =)

    Но, я сейчас столкнулся с другой проблемой. Алии Экспресс для РФ - Ссылки недоступны для гостей ,
    но сканер мне выдает Ссылки недоступны для гостей и aliexpress.com - там все не на русском языке. Как можно настроить фильтр?
     
  4. J!Life

    J!Life Модератор Команда форума Модератор

    Регистрация:
    6 дек 2013
    Сообщения:
    83
    Пройти авторизацию через иконку ключика
    Открывается окно, выбираете нужный язык или страну и нажимаете передать куки.

    В предыдущем сообщении расписан готовый вариант, просто не ленитесь и почитайте Ссылки недоступны для гостей
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    В заголовке ведь написано что "первое знакомство с программой". И тут бамс сразу речь о "повт. границах" в кратком содержании (кстати даже я не сразу понял о чем речь).
    Было бы здорово еслиб писали ответы помогающие новичкам, коим тс является.

    Укажите сканеру чтоб сканил только по ру сегменту, и фильтр ссылок чтоб собирало ру товары. (примеры на скриншоте).

    Материалы по теме:
    Ссылки недоступны для гостей - Как настроить фильтр ссылок (ctrl+3).
    Ссылки недоступны для гостей - Настройка сканера (ctrl+7).
    Ссылки недоступны для гостей - Сбор ссылок во вкладке «ссылки». Рекомендую именно так собирать ссылки товаров из определенного поиска или магазина алиекспресса.
     

    Вложения:

  6. ПолныйТормоз

    ПолныйТормоз New Member Пользователи

    Регистрация:
    14 ноя 2015
    Сообщения:
    33
    Предположим есть 2 страницы которые отчасти непохожи местами и в том самом "непохожем месте" нужная информация (описание). Как тут выделить можно?

    Ссылки недоступны для гостей


    Это не али эксперр, это полегче .
     
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    temprop="description" class="description"> - начало границы
    <div class="buyoneclick-bloc - конец границы

    Далее в дополнительные настройки границ ctrl+4
    выберите настраиваему границу, чуть ниже окно где и используйте замену (подробнее о заменах Ссылки недоступны для гостей )
    Примерно так будет выглядеть:
    {skip}</h2>|
    {skip}</h3>|
     
    Последнее редактирование: 14 ноя 2015
  8. ПолныйТормоз

    ПолныйТормоз New Member Пользователи

    Регистрация:
    14 ноя 2015
    Сообщения:
    33
    Новый вопрос :)
    по "повторяющимся границам парсинга".
    Есть страницы с 1 фото, вроде все хорошо, хватает по 1 и радуюсь, но тут вылезла проблема, что может фото быть больше одной. Познакомился с "повторяющимися границами парсинга" и как то соображалка не соображает.
    Там где должно быть 4 фото, он нашел больше 10 :(
    И можно разделить по отдельным ячейкам каждое фото? ( в CSV)


    Ссылки недоступны для гостей
     
    Последнее редактирование: 15 ноя 2015
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    1) Как сделать поиск элементов нужной повторяющейся границы в тексте обычной границы парсинга, а не в целом коде WEB-документа (Ссылки недоступны для гостей)

    2) Открыть настройку повторяющихся границ парсинга (ctrl+5) и указать разделитель циклов [CSVCS] (правее шаблона соответствующей границы, SEP). Также (правее шаблона повторяющейся границы) рекомендуется установить параметры MIN и MAX, чтобы ячейки не плавали)

    PS: [CSVCS] является служебным оператором программы для обозначения разделения ячеек CSV

    С уважением к вам, Сергей.
     
  10. ПолныйТормоз

    ПолныйТормоз New Member Пользователи

    Регистрация:
    14 ноя 2015
    Сообщения:
    33
    Спасибо =)
     
    Последнее редактирование: 16 ноя 2015

Поделиться этой страницей