Вопрос по парсеру - по разделу, парсинга ссылок, опции поиск и замена.

Тема в разделе "Сбор ссылок сканером сайтов", создана пользователем MaiklWizard, 26 мар 2018.

  1. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    Вопрос по парсеру - по разделу, парсинга ссылок, опции поиск и замена.
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! - У данного сайта для товаров в категории, нету DIVa - div они отметили только акциионные предложения товаров, если они встречаются на сайте, и следовательно такая настройка:

    Код:
    <div class="goods_list tiles catScrollImg load-on-scroll" id="goods_list"{AUTO}div|{AUTO}{GETMETHOD}
    Никак не хочет работать. В таком случае при парсинге, со страницы с категорией, он берет вообще все ссылки - чем увеличивает время сканирования, и создает кучу мусора.

    Очень нужна подсказка знающих людей. Каким образом я могу в Поиске и Замене - указать ему брать только товары с той или иной категоии данного сайта:

    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! или Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
  2. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.741
    Город:
    Сочи
    Здравствуйте.

    Не понимаю проблемы.

    Код:
    <div class="goods_list tiles catScrollImg load-on-scroll" id="goods_list">
    Есть на каждой из приведенных вами ссылках
     
  3. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    По этому div - он берет все товары - которые есть в категории, а надо чтоб не брал, которых НЕТ в наличии : Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!

    А также по DIV - данному он берет еще кучу того что нет в категориях: Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
    Последнее редактирование: 26 мар 2018
  4. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    В общем неправильный ДИВ. Все просто - берем этот товыар: 80SY02GLRA
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! - на сайте он, есть. А то что спарсено у меня ) - нету.
     
  5. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.377
    Вы напишите что именно вам нужно сделать в конечном итоге (как должен выглядеть результат?). Не рассписывайте что вы делаете.
     
    MaiklWizard нравится это.
  6. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    Что делается в программе: Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! - парсим отсюда. Проект приложил.

    У меня есть список ссылок на нужные мне категории сайта. Выглядят они так:
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    и т.д.

    Мне нужно чтобы с каждого раздела, ссылки на который я ему даю - он нашел ссылки на товары указанные в этом разделе которые есть в наличии или которые заканчиваются, НО не брал ссылки с значением Нет в наличии, или Архивный.

    П.с. - Играюсь уже дня три, не хотел никого дергать, такими вопросами, изучал мануал, но реально ничего не получается. Даже с тем когда он спарсит с моими настройками в категории только ноутбуков 36000 ссылок, вот этого товара: 80SY02GLRA (Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! ) - все равно в экселе почему то не наблюдается.
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     

    Вложения:

    • 1-MOYO.cdp
      Размер файла:
      50,2 КБ
      Просмотров:
      2
  7. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.377
    Берем весь список ссылок.
    Задаем границу в которой будет количество товара или надписи, есть/нет в наличии, архивный
    Берем макрос
    Код:
    [CHECKENTRY(нет в наличии||архивный)]<CD_GRAN_1!>[THENTEXT][ELSETEXT]выводим нужный код[/CHECKENTRY]
    По поводу ссылок, я сканер не люблю и не использую его. Если не находит данную ссылку, то либо она записана не в href либо фильтра удаляют ее
     
  8. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    ммм. несовсем понял Куда Вы вставляете денный код, в поиск и замену: Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!

    И вот этот момент: где брать только то что на странице с категорей, блок только товара - тоже не совсем получается
     
  9. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.377
    Если я правильно понимаю, то подобную фильтрацию тут нельзя сделать. Сканер сайтов только парсит ссылки
    То что я написал указывается в обычном проеке на вкладке контент.
     
  10. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    Хорошо, а как же тогда задать просто область на этом сайте, как парсить только товары с каждой категории а не все ссылки подряд. Вот сейчас пробую так:

    Код:
    <div class="goods_item newcolors{AUTO}div|{AUTO}{GETMETHOD} 
    - если я правильно понима, то при таком поиске и замене он не учитывает все что есть в диве после: item newcolors и поэтому возмет все товары с категории, в не зависимости с акцией или без). Верно?
     
  11. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! вот почему - если я четко задаю с какой ссылки парсить - он нашел в ноутбуках - гарнитуру - ну как такто ??
     
  12. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.377
    потому что это сканер)
    я бы на вашем месте использовал вкладку ссылки и там бы настраивал
     
  13. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    Тогда последний вопрос. На предыдущие я вроде ответил, ошибка была в запятой - справка вещь сильная.
    Вопрос, в данном скриншоте - почему он эту ссылку не захватил?
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
  14. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.377
    потому что он до нее еще недошел. Или вы уже окончательный парсинг смотрите?
     
  15. MaiklWizard

    MaiklWizard Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    110
    Адрес:
    Odessa
    Спасибо за ответы - все получилось. Буду внимательнее справку читать . . Слона то я и не заметил.
     

Поделиться этой страницей