Парсинг гугл-картинок

Тема в разделе "Разное", создана пользователем moidodyr66, 29 июл 2012.

  1. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    при парсинге гугл картинок можна ли задавать имя файлам, вместо стандартного "images"?
     
  2. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Конечно. Только после скачивания
     
  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Можно и не только после скачивания, CD настолько функционален что и вашей ситуации должно помочь как можно больше "автоматически"
    1. Заходим в "парсер Google картинок" и перед парсингом снемите галочку с "приступать к загрузке картинок"
    2. Жмите "начать парсинг" и заметите как появятся ссылки на картинки - этот большой список копируеете и возвращаетесь в главное окно программы вкадка "контент"
    3. клавиша F8 и добавляете скопированное в появившееся окно
    4. Теперь надо настроить "шаблон вывода" где есть примерно так:
    Краткое описание макрсов
    <CD_DOCURL!> - это адрес загружаемого документа (адрес картинки в нашем случае)
    <NIMG> - обняв адрес картинки тегом скачивания картинок, будет качать на компьютер
    IMAGESNAMES_ - задает имена картинке, где можно в значение написать от руки слово или указать границу или как в нашем случае подключили текстовик со списком ключевиков
    <FILE=C:\kluchevie-slova.txt> - макрос FILE подключает текстовики со списком слов или предложений, содержание дожно быть "построчно"
     
    Последнее редактирование: 29 июл 2012
  4. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    ок. благодарю за ответ!

    хотел бы немного расширить вопрос:
    есть пачка ру-кейвордов по которым парсятся гугл-картинки, в идеале, хочу, чтобы каждой картинке присваивалось название->кейворд латиницей и сохранялось в папку...

    ну и вдогонку еще вопрос, возможно ли такое реализовать, а может какой-нибудь софт это уже умеет:) ... есть 2 папки в одной картинки в другой текстовый контент, в формате картинки->картинка-кейворд и текст->текст-кейворд... в результате нужно, чтобы картинки автоматом заливались в текст соответственно кейворду...
     
  5. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    :)
    Такого в программе нет, но, можно поговорить с автором, посмотреть, что он на это дело скажет.

    Однако, всё это легко реализуемо, буквально за пару секунд в Total Commander-e. Там есть прекрасный инструмент по переименовыванию, причём можно пользоваться большой гаммйо регулярных выражений, задавать специфические варианты переименования

    Это вам нужны такие программы как TextKit или Zebroid. Они специально для этого предназначены,- подготовка контента к публикации. Плюс в Zebroid-е есть ещё и заливка на сервер, плюс ищет сам картинки по кейвордам, плюс видео с Ютуба и ещё пары сервисов.
     
    Последнее редактирование: 30 июл 2012
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    как насчет "Ссылки недоступны для гостей"?
     
  7. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Вопрос кому?
    Если мне, то я остановился только на основном вопросе автора темы "moidodyr66", кроме всего, Гугле с какого-то времени стал выдавать "левые" картинки, для СДЛ использовать GETGOOGLEIMAGE стало сложнее. Но, конечно же, эту возможность не стоит забывать. А я вот забыл второпях. Спасибо за подсказку
     
  8. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Отвечаю новичкам обычно, чтобы помочь)
    А в гоогле выдача более соответствующей картинок по запросу будет если брать номер "2" тоесть среднего размера, картинки неочень конечно и приходиться из сотни 20-10 удалять точно.
     
    Последнее редактирование: 30 июл 2012
  9. Valiks

    Valiks New Member Супер Модератор

    Регистрация:
    18 янв 2012
    Сообщения:
    554
    Адрес:
    Всё время в скэйпе
    Я тоже брал среднюю картинку, но тот факт, что приходится чистить, очень напрягает. Если спарсил 50 или 100 страниц не страшно, но уже при 1000 приходится потеть.
     
  10. Denomega

    Denomega New Member Пользователи

    Регистрация:
    29 авг 2012
    Сообщения:
    7
    подскажите как вообще парсить картинки с гугла, не пойму.
    как пример все картинки, что гугл выдает по словам "рога и копыта"
     
  11. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Вместо <CD_GRAN_1!> можно вписать рога и копыта
     
  12. Denomega

    Denomega New Member Пользователи

    Регистрация:
    29 авг 2012
    Сообщения:
    7
    а, все нашел, иконка такая есть.
     
    Последнее редактирование: 19 сен 2012
  13. Denomega

    Denomega New Member Пользователи

    Регистрация:
    29 авг 2012
    Сообщения:
    7
    так, разобрался, а теперь вопрос на засыпку.
    как заставить его парсить не с рунета, а например с зоны google.com? выдача отличается, я через прокси посмотрел.
     
  14. bork75

    bork75 New Member Пользователи

    Регистрация:
    2 сен 2010
    Сообщения:
    97
    Как можно спарсить картинки из гугла и раскидать их по папкам?

    например у меня есть категории: теннис, футбол, хоккей.

    Что бы при парсинге картинок про футбол, они складывались в папку football и т.д. ?
     

Поделиться этой страницей