Грабинг контента в CSV с определенными условиями

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем koleso62, 24 сен 2014.

  1. koleso62

    koleso62 New Member Пользователи

    Регистрация:
    28 янв 2013
    Сообщения:
    29
    Здравствуйте уважаемые форумчане! При грабинге контента с сайта в csv нужно чтобы парсилось к кажому посту не более 10 изображений и присваивались к каждому посту хэштеги. А теперь поподробнее

    Дано:
    <CD_GRAN_1!> - Заголовок поста
    <CD_GRAN_2!> - Текст поста
    <CD_GRAN_3!> - Изображение(я)

    Задачи:

    1) Как можно для границы <CD_GRAN_3!> сделать условие чтобы парсилось не более 10 изображений?
    2) Как можно реализовать, чтобы в конце каждой границы <CD_GRAN_2!> присваивались хэштеги в зависимости от их частотности в тексте? Например: в посте слово "Петя" встречается - 10 раз, "Ваня" - 3 раза, "Маша" - 7 раз
    нужно чтобы после текста в данном случае было: #Петя #Маша #Ваня
    Спасибо!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    1) Задать повторяющуюся границу парсинга для изображений и в настройке повторяющихся границ парсинга (ctrl+5) выставить максимальное количество циклов для этой повторяющейся границы

    2) Такой функции сейчас нет. Можете подключать PHP-скрипты (мы их не предоставляем) для определения частотности слов текста Ссылки недоступны для гостей

    Пожалуйста.

    С уважением к вам, Сергей.
     

Поделиться этой страницей