Как парсить новые товары в повторяющихся границах парсинга

artproma · 29 июл 2014

Собственно вопрос:
Есть сайт, для него я настроил спарсивание по повторяющимся границам.
Иногда там появляются обновления. Нужно парсить только их.
Как объяснить программе, чтоб она смотрела в какой-то файл и обращала внимание только на новые позиции, а старые не сканировала?
Ну и заодно, как заполнять этот самый файл?

Kreol · 29 июл 2014

Доброй ночи!
В правой части программы есть чудесное меню: найдите пункт отмеченный на картинке.
Как формировать файл: каждый урл с новой строки.

artproma · 29 июл 2014

Таким образом в файл заносится 1-на ссылка - та страница, на которой и есть повторяющиеся границы..
Мне интересно следующее. Сама страница динамическая, на ней идет обновление материала (блог). Нужно парсить именно их.
Как быть с таким вариантом?

Root · 29 июл 2014

У товаров разве нет собственных отдельных страниц? О каком сайте идет речь?

artproma · 29 июл 2014

В данном случае речь идет о ютубе
На странице видео нет картинки и времени ролика
Посмотреть вложение youtube.cdp

Root · 29 июл 2014

Нужно время, спасибо...

artproma · 29 июл 2014

Мне-то за что?
Работку подкинул..
На сколько я понимаю стандартными методами не получится
Тут надо действовать по другому:
Парсить сами страницы и с них брать всю инфу... Но не будет времени ролика и картинки.
Таким образом будет работать файл с обработанными ссылками.

Войти или зарегистрироваться

Как парсить новые товары в повторяющихся границах парсинга

artproma New Member Пользователи

Kreol Модератор Команда форума Модератор

Вложения:

2014-07-29_1-41-55.png

artproma New Member Пользователи

Root Администратор Администратор

artproma New Member Пользователи

Root Администратор Администратор

artproma New Member Пользователи

Вопрос по одной функции в повторяющихся границах (использовать границы парсинга n...)

В повторяющихся границах нужно парсить характеристики

В повторяющихся границах не учитывается номер тега от начала парсинга

Как при повторном парсинге парсить только новые товары?

Как в повторяющихся границах парсинга выбрать только уникальные значения.

Поделиться этой страницей

Войти или зарегистрироваться

Как парсить новые товары в повторяющихся границах парсинга

artproma New Member Пользователи

Kreol Модератор Команда форума Модератор

Вложения:

2014-07-29_1-41-55.png

artproma New Member Пользователи

Root Администратор Администратор

artproma New Member Пользователи

Root Администратор Администратор

artproma New Member Пользователи

Вопрос по одной функции в повторяющихся границах (использовать границы парсинга n...)

В повторяющихся границах нужно парсить характеристики

В повторяющихся границах не учитывается номер тега от начала парсинга

Как при повторном парсинге парсить только новые товары?

Как в повторяющихся границах парсинга выбрать только уникальные значения.

Поделиться этой страницей

Быстрый поиск