Подскажите как сделать так, чтобы парсил данные если есть определенный текст на странице? Например: [HIDDEN CONTENT] нужно спарсить только часы,...
Все получилось, спасибо!
[HIDDEN CONTENT] Но не могу настроить, чтобы отфильтровывал нужные мне ссылки при проходе.
Подскажите как из xml файлов вытаскивать урл? Фалов 2000шт, общий вес 17Гб
На ebay открыт robot.txt, через него нашел архивы с xml в которых ссылки на все товары ( за 2 июня). Так что моя задача существенно облегчилась)))...
Карта сайта у них есть в таком виде: [HIDDEN CONTENT] P.S. Спасибо большое за помощь :)
Все получилось, но проблема с памятью осталась. Памяти хватило на 720к ссылок. Думаю если реализовать парсинг ссылок сразу в файл не добавляя их в...
Ан-нет )) Парсит всех кто расположен в РФ... Не могу сообразить чтобы задать условие: Текст "Российская Федерация" был, а "title="Items for...
Все получилось, спасибо за помощь!
Ок, буду штудировать. Подобрал фильтры, теперь в очередь добавляются только необходимые ссылки. Думаю 8Гб оперативной должно хватить для 40-50млн...
И как это все записать в шаблон вывода? Текст такой: Based in Russian Federation А переменная была написана выше. Надеюсь это последний вопрос))
Спасибо за ответы! При парсенге такого гиганта появилась проблема, не хватает оперативной памяти :) Как это можно обойти? Он ссылки собрать не...
А если текст и переменная? Например в этом куске кода значение должно быть больше 0, в данном примере цифра 55: <span class="sell_count">(<a...
не получилось что хотел :) При переходе на страницу с товаром, ссылка имеет вид: [HIDDEN CONTENT] где 171718845519 номер товара. Из-за чего...
Здравствуйте! Помогите настроить CD на сбор ссылок на товары на сайте ebay.com Пробовал генерировать, но из-за 12 цифр в урл товара комп...
Заменил на запятую :)
Здравствуйте! При парсенге в csv формат, цифры вида 12.89 , 10.99 до точки заменяются названием месяца. Как это исправить? Спасибо
Спасибо
Здравствуйте! Подскажите как вставить в текст метки для WP. Например на сайте доноре есть 2 слова подряд: Комедия, Фантастика Как из них...
Не могу спарсить номера на drom_ru В LiveHTTPHeaders получается такая строчка...
Имена участников (разделяйте запятой).