ЯМ не все тупо спарсить, а выборочно! _:

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Djahat, 23 фев 2013.

  1. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Есть кто разбираеться в таком типе парсинга ? - не все тупо спарсить, а выборочно! _:

    У меня есть список товаров - Модели и названия.

    Можно как то напарсить к ним картинок и описаний с яндексамаркета ?


    Если можно, то примерно как?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Теоритически возможно, если создать проект со следующими условиями.
    1. во вкладке "ссылки" - Для поиска ямаркета по названию товара - чтоб брало первые 1-2 ссылки от каждого кея.
    2. далее по этим ссылкам парсить по настроенному проекту (где есть указанные границы и т.д.)
    Учтите что название товаров не должно содержать плохих символов (";%*+\/ и т.д.) если передаем запрос по кею к поисковику ямаркета
     
  3. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Не совсем понял - что на во вкладке "ссылки" сделать?
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Настроить сборщик ссылок.

    Проставить диапазон ссылок по списку названий товара в {key}, диапазон 1, шаг 1.
    Вот шаблон ссылок для поиска товара по ключу
    ЯМ/search.xml?text=iPhone%205%2016Gb%20Black&nopreciser=1
    Зеленым выделена часть где ваш товар
     
    Последнее редактирование: 24 фев 2013
  5. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Так вот для чего ключевые слова и тег {key} а испытаю
     
  6. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    А если не секрет - где настраивается "чтоб брало первые 1-2 ссылки от каждого кея." ?
     
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Во вкладке "ссылки" можно выделить часть кода границами где находятся все нужные ссылки - тоесть часть кода чтоб фигурировало первые 1-2 ссылки от выдачи.
     
  8. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Спасибо попробую.
     
  9. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Да несложно.

    А можете посоветовать логику решения -
    Что бы в выдаче CSV - напротив данных по товару появился ключевик - по которому он найден.

    Я вроде вставляю парам для первой ссылки - которая мде дает SERCH - но когда я перехожу с этой ссылки на карточку товара - ПАрам пропадает.

    Как можно в CSV вывести к каждому товару - по какому ключевику я его нашел ?
     
    Последнее редактирование: 27 фев 2013
  10. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Никак не найду - как сохранить [PARAM] для ссылок
    Вот я насерчил таких ссылок -
    market.yandex.ru/search.xml?text=Q7699A&nopreciser=1[PARAM]:Q7699A

    Нажимаю начать продолжить сканирование - и получается вот такая ссылка: Ссылки недоступны для гостей

    Как можно получить такую ссылку кто-нить в курсе?

    Ссылки недоступны для гостей[PARAM]:Q7699A
     

Поделиться этой страницей