Двойная динамическая граница

Тема в разделе "Решение различных задач по парсингу", создана пользователем dexperanto, 22 май 2015.

  1. dexperanto

    dexperanto New Member Пользователи

    Регистрация:
    21 ноя 2014
    Сообщения:
    123
    Добрый вечер.
    Парсю один зарубежный портал.
    Возникла проблемка, что в границе сайт портит ссылку.

    Вот такого вида:
    <dt>VK:</dt>
    <dd><a href="/away/http%3A%2F%2Fvk.com%2Fid83295367" target="_blank">http://vk.com/id83295367</a></dd>

    Мне нужно, чтобы в качестве границы бралось <dt>VK:</dt>, конец границы </a></dd>, а текст в ячейке был
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Реализуемо?

    То есть, задать, что граница с двойным началом.
    Я знаю, что я извращенец. Можно искать просто тупо по
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    , но мне интересно=)
     
    Последнее редактирование модератором: 22 май 2015
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Описанное вами это и есть часть основ указания границ парсинга.
    При задании границы у вас возникли сложности?)
     
  3. dexperanto

    dexperanto New Member Пользователи

    Регистрация:
    21 ноя 2014
    Сообщения:
    123
    "/away/http%3A%2F%2Fvk.com%2Fid83295367"
    непостоянная величина)
    можно задавать непостоянную границу, с меняющимся текстом=) чтобы искала включением?
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Код:
    <a href="/away/http%3A%2F%2Fvk.com%2F{skip}" target="_blank">
    постоянная величина в таком случае со скипом.:)
     
    Последнее редактирование: 23 май 2015
  5. dexperanto

    dexperanto New Member Пользователи

    Регистрация:
    21 ноя 2014
    Сообщения:
    123
    Работает, но...
    В зависимости от профилей меняются названия Веб-сайт и Web-site

    <dt>Веб-сайт:</dt>
    <dd><a href="/away/http%3A%2F%2Fpromodj.com%2Fvetran" target="_blank">http://promodj.com/vetran</a></dd>

    Собственно, при переходе языков перестаёт парсить эту границу.
    Задать от /away нельзя, ибо ссылки на соц.сети тоже имеют такую форму)
    Можно как-нибудь сделать, типа Веб-сайт|Web-site? Чтобы руками не менять
     
  6. dexperanto

    dexperanto New Member Пользователи

    Регистрация:
    21 ноя 2014
    Сообщения:
    123
    Извиняюсь,
    поиск-замена: Website|Веб-сайт
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Пропишите ее в shift+ctrl+r.

    С уважением к вам, Сергей.
     

Поделиться этой страницей