Собрать ссылки на товары с китайского сайта (преобразовать ссылки в "процентную" URL-кодировку)

Тема в разделе "Сбор ссылок сканером сайтов", создана пользователем tkm, 1 июл 2017.

  1. tkm

    tkm New Member Пользователи

    Регистрация:
    22 ноя 2011
    Сообщения:
    81
    Сайт Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    При сборе ссылок ссылки собираются в иероглифами.

    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!


    Но при этом не задаются границы парсинга
    Необходимо чтобы ссылки на товары собирались в таком виде

    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!

    Т.е с % и так далее.
     

    Вложения:

  2. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    8.213
    Адрес:
    sbfroot@gmail.com
    Город:
    Краснодар
    Здравствуйте.

    Нужно время (ориентировочно - до недели, обещание НЕ даю!).

    С уважением к вам, Сергей.
     
  3. tkm

    tkm New Member Пользователи

    Регистрация:
    22 ноя 2011
    Сообщения:
    81
    Буду ждать . Спасибо!

    Эту ссылку видно в информации о странице в Мозилле
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
     
    Последнее редактирование: 1 июл 2017
  4. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    8.213
    Адрес:
    sbfroot@gmail.com
    Город:
    Краснодар
    2017-07-01_22-36-29.png
     
  5. tkm

    tkm New Member Пользователи

    Регистрация:
    22 ноя 2011
    Сообщения:
    81
    А в сканере сайтов не работает :(
     

    Вложения:

    • i28_com.cdp
      Размер файла:
      70,9 КБ
      Просмотров:
      0
  6. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    8.213
    Адрес:
    sbfroot@gmail.com
    Город:
    Краснодар
    Про сканер сайтов речи не было. На скриншотах вы парсили во вкладке "Ссылки". Нужно сразу уточнять детали.
     
  7. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    8.213
    Адрес:
    sbfroot@gmail.com
    Город:
    Краснодар
    2017-07-02_01-08-51.png
     
    tkm нравится это.
  8. tkm

    tkm New Member Пользователи

    Регистрация:
    22 ноя 2011
    Сообщения:
    81
    Огромное спасибо! Про сканер сайтов сразу не написал, сорри!
     
    Root нравится это.
  9. emkub

    emkub Member Пользователи

    Регистрация:
    16 мар 2015
    Сообщения:
    67
    Здравствуйте!
    Новую тему по такому мелочному вопросу создавать не стал.
    Сергей, подскажите пожалуйста, как быть с такими ссылками:
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!

    Какие кодировки не пробовал, страница 404.
     
  10. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    8.213
    Адрес:
    sbfroot@gmail.com
    Город:
    Краснодар
    Здравствуйте.

    1) Мне кажется вы сами дописали Product/ (должно быть product/ (маленькая p))
    2) 2017-10-09_21-20-44.png
     
  11. emkub

    emkub Member Пользователи

    Регистрация:
    16 мар 2015
    Сообщения:
    67
    Нет-нет, такие ссылки выдал сам CD. Проблема с символами á, ™, ō. Если не использовать IE для парсинга, они преобразовываются в другие знаки и символы. Через IE парсинг идёт нормально.
    P.S. в URL пробовал переводить.
     
  12. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    8.213
    Адрес:
    sbfroot@gmail.com
    Город:
    Краснодар
    Опустить регистр и преобразовать в URL-кодировку - это решит проблему.
     
    emkub нравится это.
  13. emkub

    emkub Member Пользователи

    Регистрация:
    16 мар 2015
    Сообщения:
    67
    Спаисбо! Попробую.
     

Поделиться этой страницей