В точку. есть готовый материал типа: контент запрос контент. где html страницы берутся с локального диска в которые подргужаются картинки с...
Вот и меня эта проблема коснулась вновь, очень жаль что нет решений.
минут пять, обновил версию и заработало. Стояла предпоследняя версия
заработало
Было б неплохо если парсинг картинок с гугла тоже шел через прокси + выбор таймаута ожидания загрузки изображения, которые иногда просто не...
3000-5000 1 поток забанил через несколько часов :( 5000-8000 2 потока работает, странно как то
Спит или нет не имеет значения, парсинг то идет... правда максимум 2 потока с таймаутом 5-8 сек. Быстрее уже бан.
Зачем левые сссылки? Речь идет о парсинге каритинок гугл. В старых версиях картинки парсились через прокси и проблем не возникало, сейчас на 1к...
Ставил 10 потоков с паузой 1000, через 3 часа бан. В логе вижу что парсинг идет через прокси, но картинки не грузятся пока свой ip не сменил....
Просто процесс слишком затяжной. Через прокси было б шустрее, 1к элитных и вперед :)
Не совсем понял по поводу Добавлен макрос шаблона вывода запрос (сделан на основе старого Гугл API, пауза 5 секунд (для избежания бана) Прокси...
Может прикрутить парсер яндекс картинок? В доргенах же работает, только разделить процесс на парсинг превьюшек (мне например бывает и этого...
мож с рамы?
Всем доброе время суток! пару недель не запускал софт, сегодня не могу спарсить ни одной картинки ни макросом...
Всем доброго дня. Сегодня парсил проект с использованием DOCSNAMES_<FILE=D:\name.txt> Примерно в середине парсинга нажал на паузу, после того...
при заполнении поля описание, если в строчке, из которой берется текст, имеются html теги, то они тоже вставляются в описание. надо бы сделать что...
нет, клон мне не нужен. Просто сохраняется структура сайта вместе с именами файлов и перелинковкой страниц, но на своем шаблоне со своим дизайном...
похоже мы друг друга в упор не слышим :) Включаю парсинг сайта, там страницы http://site.ru/donor.html http://site.ru/donor_2.html мне надо что...
Это я знаю, там будет title конвертироваться в транслит, но мне нужно их сохранить как в оригинале на сайте доноре, а не по заголовкам.
Добрый день! Как парсить сайт что бы имена страниц сохранялись как в оригинале, а то получаю на выходе article или в транслите по заголовку
Имена участников (разделяйте запятой).