Сбор относительных ссылок с цифровым началом

Тема в разделе "Фильтры ссылок", создана пользователем Бакытжан, 23 дек 2015.

  1. Бакытжан

    Бакытжан New Member Пользователи

    Регистрация:
    25 окт 2015
    Сообщения:
    13
    Здравствуйте. Подскажите, пжл, есть сайт sima-land, с которго хочу спарсить ссылки на товары. Заведомо известны ссылки на страницы, где хранятся ссылки на товары, но эти ссылки в коде пишутся как относительные, пример /1229382/gorshok-dlya-zapekaniya-povar-0-6l/
    причем выборку по цифрам не моуг сделать, это есть артикул товара, он всегда разный, да и дальше тоже название товара в транслите...
    как получить из этого ссылку типа Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!

    вот пример ссылок

    /1097406/gorshok-dlya-zharkogo-chugun-1-3-l/
    /1229377/gorshok-dlya-zapekaniya-byk-0-6l/
    /1229381/gorshok-dlya-zapekaniya-ornament-0-6l/
    /1229382/gorshok-dlya-zapekaniya-povar-0-6l/
    /309630/kokotnica-faraon-0-2-l/
    /749193/kokotnica-fantaziya-0-2l/
    /1067077/kokotnica-0-2l/
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.044
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    У ссылок один артикул а окончание разное - но введет всеравно на один товар артикула 1229382
    ---
    Если вас стоит задача отсеять дубли товаров, используйте макрос DELDUPE с указание названия товара чтоб записывало в файл отдельный проверочный.
     
  3. Бакытжан

    Бакытжан New Member Пользователи

    Регистрация:
    25 окт 2015
    Сообщения:
    13
    Я наверное немного неправильно поставил вопрос...
    вообщем вот исходная страница, откуда мне надо вытащить ссылки на страницы с товарами Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!

    При парсинге мне нужно поставить каким-то образом фильтр так, чтобы он вытаскивал только ссылки, к примеру:
    /309909/nabor-detskoy-posudy-piramidka-4-predmeta-cveta-miks/
    /811991/nabor-detskoy-posudy-neposeda-2-predmeta-miska-250-ml-lozhka-cveta-miks/
    и т.д.
    и подставлял в начала имя домена, чтобы получить на выходе
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
    Последнее редактирование: 24 дек 2015
  4. Бакытжан

    Бакытжан New Member Пользователи

    Регистрация:
    25 окт 2015
    Сообщения:
    13
    Усе.. кажись разобрался.. сбросил все фильтры, настроил заново - и вуаля, заработало... сори за беспокойство
     
  5. Графиня

    Графиня New Member Пользователи

    Регистрация:
    1 окт 2015
    Сообщения:
    2
    Здравствуйте.
    Напишите пожалуйста какие фильтры вы использовали?
     
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.044
    CTRL+3

    Код:
    https://www.sima-land.ru/
    re:ru/[\d]+/
    поставить галочку на "и/или"
     

Поделиться этой страницей