Не могу понять почему не парсятся основная часть фоток

Тема в разделе "Решение различных задач по парсингу", создана пользователем mailfix01, 11 окт 2012.

  1. mailfix01

    mailfix01 New Member Пользователи

    Регистрация:
    8 сен 2012
    Сообщения:
    9
    В границе по парсингу фоток, я указал фотки с папки, т.е. границу для начала парсинга сразу обозначил <img src="/i/items/

    Чтобы отсечь не интересующие меня категории я их внес на этапе сбора ссылок, вставил исключения в "не добавлять в очередь ссылки, содержащие". Большая часть исключений сработало, но две категории все равно собираются ссылками. и интересно когда я выбрал "не пополнять очередь", у меня вообще никакие ссылки на напарсились.

    Вот собственно и вопрос, что я не так сделал или чего то я недопонял.
     

    Вложения:

    • klimat.cdp
      Размер файла:
      27,9 КБ
      Просмотров:
      1
  2. mailfix01

    mailfix01 New Member Пользователи

    Регистрация:
    8 сен 2012
    Сообщения:
    9
    И еще вопрос, если я собираю картинки
    Соответственно по полям "<td class="first">" и "</td>", то я получаю ссылки на две картинки. А я хочу результат получить не как две ссылки на картинки пудрят, а так "IT_3688_b.jpg:439.gif", можно так сделать?
     
  3. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    думаю, да. только не одной границей надо сработать, а двумя. а потом слепить их в одно целое в шаблоне вывода.
    тут вам навряд ли кто-то поможет. потому что вопрос сформулирован неадекватно. для того, чтобы попытаться ответить на ваш вопрос, мне (или кому-то другому) надо 1). выпарсить все ссылки с указанного вами сайта 2). провести тотальную сверку полученных ссылок с десятком заданных вами фильтров. ну и на фиг кому это надо, такой головняк? и все это тллько потому, что вы не потрудились написать, какие конкретно категории спарсились в обход фильтров.
     
  4. mailfix01

    mailfix01 New Member Пользователи

    Регистрация:
    8 сен 2012
    Сообщения:
    9
    nikolas1612 спасибо большое. Понял. Сделал вчера скрин и забыл его разместить.
    Исключения вылазиют:
    _rusklimat-ufa.ru/catalog/household-fans-vortice/influx-and-extract-system/
    _rusklimat-ufa.ru/catalog/pumps/automatics/

    А вы не в курсе, почему у меня при таком составленном проекте парсятся картинки в количестве 132шт, при товаре в 1500. Смотрел те у которых не спарсились картинки, фотки есть, поля парсинга находит программа.

    может кто то сталкивался с этим или я не указал какую то стандартную характеристику или не поставил галочку где нибудь.
     

    Вложения:

    • CD.jpg
      CD.jpg
      Размер файла:
      85,9 КБ
      Просмотров:
      21
    Последнее редактирование: 12 окт 2012

Поделиться этой страницей