Парсинг гугл-картинок

Discussion in 'Разное' started by moidodyr66, Jul 29, 2012.

  1. moidodyr66

    moidodyr66 New Member Пользователи

    Joined:
    Sep 14, 2011
    Messages:
    14
    при парсинге гугл картинок можна ли задавать имя файлам, вместо стандартного "images"?
     
  2. Valiks

    Valiks New Member Супер Модератор

    Joined:
    Jan 18, 2012
    Messages:
    554
    Location:
    Всё время в скэйпе
    Конечно. Только после скачивания
     
  3. kagorec

    kagorec Администратор Staff Member Администратор

    Joined:
    Jan 3, 2011
    Messages:
    4,442
    Location:
    Latvia
    Можно и не только после скачивания, CD настолько функционален что и вашей ситуации должно помочь как можно больше "автоматически"
    1. Заходим в "парсер Google картинок" и перед парсингом снемите галочку с "приступать к загрузке картинок"
    2. Жмите "начать парсинг" и заметите как появятся ссылки на картинки - этот большой список копируеете и возвращаетесь в главное окно программы вкадка "контент"
    3. клавиша F8 и добавляете скопированное в появившееся окно
    4. Теперь надо настроить "шаблон вывода" где есть примерно так:
    Краткое описание макрсов
    <CD_DOCURL!> - это адрес загружаемого документа (адрес картинки в нашем случае)
    <NIMG> - обняв адрес картинки тегом скачивания картинок, будет качать на компьютер
    IMAGESNAMES_ - задает имена картинке, где можно в значение написать от руки слово или указать границу или как в нашем случае подключили текстовик со списком ключевиков
    <FILE=C:\kluchevie-slova.txt> - макрос FILE подключает текстовики со списком слов или предложений, содержание дожно быть "построчно"
     
    Last edited: Jul 29, 2012
  4. moidodyr66

    moidodyr66 New Member Пользователи

    Joined:
    Sep 14, 2011
    Messages:
    14
    ок. благодарю за ответ!

    хотел бы немного расширить вопрос:
    есть пачка ру-кейвордов по которым парсятся гугл-картинки, в идеале, хочу, чтобы каждой картинке присваивалось название->кейворд латиницей и сохранялось в папку...

    ну и вдогонку еще вопрос, возможно ли такое реализовать, а может какой-нибудь софт это уже умеет:) ... есть 2 папки в одной картинки в другой текстовый контент, в формате картинки->картинка-кейворд и текст->текст-кейворд... в результате нужно, чтобы картинки автоматом заливались в текст соответственно кейворду...
     
  5. Valiks

    Valiks New Member Супер Модератор

    Joined:
    Jan 18, 2012
    Messages:
    554
    Location:
    Всё время в скэйпе
    :)
    Такого в программе нет, но, можно поговорить с автором, посмотреть, что он на это дело скажет.

    Однако, всё это легко реализуемо, буквально за пару секунд в Total Commander-e. Там есть прекрасный инструмент по переименовыванию, причём можно пользоваться большой гаммйо регулярных выражений, задавать специфические варианты переименования

    Это вам нужны такие программы как TextKit или Zebroid. Они специально для этого предназначены,- подготовка контента к публикации. Плюс в Zebroid-е есть ещё и заливка на сервер, плюс ищет сам картинки по кейвордам, плюс видео с Ютуба и ещё пары сервисов.
     
    Last edited: Jul 30, 2012
  6. kagorec

    kagorec Администратор Staff Member Администратор

    Joined:
    Jan 3, 2011
    Messages:
    4,442
    Location:
    Latvia
    как насчет "Ссылки недоступны для гостей"?
     
  7. Valiks

    Valiks New Member Супер Модератор

    Joined:
    Jan 18, 2012
    Messages:
    554
    Location:
    Всё время в скэйпе
    Вопрос кому?
    Если мне, то я остановился только на основном вопросе автора темы "moidodyr66", кроме всего, Гугле с какого-то времени стал выдавать "левые" картинки, для СДЛ использовать GETGOOGLEIMAGE стало сложнее. Но, конечно же, эту возможность не стоит забывать. А я вот забыл второпях. Спасибо за подсказку
     
  8. kagorec

    kagorec Администратор Staff Member Администратор

    Joined:
    Jan 3, 2011
    Messages:
    4,442
    Location:
    Latvia
    Отвечаю новичкам обычно, чтобы помочь)
    А в гоогле выдача более соответствующей картинок по запросу будет если брать номер "2" тоесть среднего размера, картинки неочень конечно и приходиться из сотни 20-10 удалять точно.
     
    Last edited: Jul 30, 2012
  9. Valiks

    Valiks New Member Супер Модератор

    Joined:
    Jan 18, 2012
    Messages:
    554
    Location:
    Всё время в скэйпе
    Я тоже брал среднюю картинку, но тот факт, что приходится чистить, очень напрягает. Если спарсил 50 или 100 страниц не страшно, но уже при 1000 приходится потеть.
     
  10. Denomega

    Denomega New Member Пользователи

    Joined:
    Aug 29, 2012
    Messages:
    7
    подскажите как вообще парсить картинки с гугла, не пойму.
    как пример все картинки, что гугл выдает по словам "рога и копыта"
     
  11. kagorec

    kagorec Администратор Staff Member Администратор

    Joined:
    Jan 3, 2011
    Messages:
    4,442
    Location:
    Latvia
    Вместо <CD_GRAN_1!> можно вписать рога и копыта
     
  12. Denomega

    Denomega New Member Пользователи

    Joined:
    Aug 29, 2012
    Messages:
    7
    а, все нашел, иконка такая есть.
     
    Last edited: Sep 19, 2012
  13. Denomega

    Denomega New Member Пользователи

    Joined:
    Aug 29, 2012
    Messages:
    7
    так, разобрался, а теперь вопрос на засыпку.
    как заставить его парсить не с рунета, а например с зоны google.com? выдача отличается, я через прокси посмотрел.
     
  14. bork75

    bork75 New Member Пользователи

    Joined:
    Sep 2, 2010
    Messages:
    97
    Как можно спарсить картинки из гугла и раскидать их по папкам?

    например у меня есть категории: теннис, футбол, хоккей.

    Что бы при парсинге картинок про футбол, они складывались в папку football и т.д. ?
     

Share This Page