Дублирование ссылок

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем sanitarn, 16 мар 2013.

  1. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Всем привет, столкнулся с проблемой пытаюсь просканить сайт, нужен только один раздел, но почему то сканер парсит ссылки и лобавляет несуществующие, то есть к примеру keramspb.ru/ispanskaya_plitka/ispanskaya_plitka/atlas_concorde/glamour.html а ссылка само вида keramspb.ru/ispanskaya_plitka/atlas_concorde/glamour.html продублировал ispanskaya_plitka кто сталкивался?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Сканер ссылок -> поиск-замена
    в поле "поиск замена для основного кода......" добавьте
    PHP:
    href="|href="http://www.keramspb.ru/
    href="http://www.keramspb.ru/http://www.keramspb.ru/http://www.keramspb.ru/|href="http://www.keramspb.ru/
    href="http://www.keramspb.ru/http://www.keramspb.ru/|href="http://www.keramspb.ru/
    .ru//|.ru/
    [​IMG]

    п.с. возможно так будет корректно собирать ссылки товаров
     
  3. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Попробую, спасибо за ответ
     
  4. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    А в чем может быть засада, границу на фото ставлю, но фото не загружает, хотя ссылка есть ?
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    ил ссылка не правильная формируется на фото или надо отметить галочку "загружать картинки генерируемые php..." это в "Загрузка картинок"
     
  6. sanitarn

    sanitarn New Member Пользователи

    Регистрация:
    10 фев 2013
    Сообщения:
    34
    Да вроде правильно, визуально вбиваю путь в браузере фото доступно, ставил галку загружать картинки генерируемые php, бесполезно, где-то у меня косяк.
    Может админ поможет?
    Граница парсинга на фото <img - ">
     
    Последнее редактирование: 19 мар 2013
  7. Suburban

    Suburban New Member Пользователи

    Регистрация:
    4 апр 2013
    Сообщения:
    1
    Сканер сайта.

    Здравствуйте)! У меня вот что происходит. Сама программа работает на отлично, но только сканирует она не так как хотелось бы. Дело в том, что при сканировании сайта донора, она делает следующее. Сканирует каталог и подкаталоги, получаются двойники.(из за того, что она с начало собирает ссылки в каталоге т.е весь товар что находится во всех ее подкаталогах, а потом сами подкаталоги.Вот так и получаются двойники). Я убирал двойники с помощью программы excell, но получается что при удалении дублей у меня во многих случаях убираются товары в подкаталогах и остаются только сами каталоги(((. И при загрузке прайса на свой сайт получается что половину подкаталагов пустые (без товара). Можно ли как нибудь убрать эту проблемму?
     

Поделиться этой страницей