получение контента внутри спарсенного текста

Тема в разделе "Решение различных задач по парсингу", создана пользователем eleon, 6 дек 2014.

  1. eleon

    eleon New Member Пользователи

    Регистрация:
    18 фев 2012
    Сообщения:
    37
    Как получить конечную ссылку в процессе парсинга

    вот текст который парсится с удалением лишнего.

    HTML:
    WOW – бесплатная PSD-концепция пользовательского интерфейса современного мобильного приложения, предназначенного специально для iPhone. К скачиванию предлагаются 5 экранных кадров - авторизации, списка, меню, витрины товаров в продаже и их подробных описаний. Ресурс легко редактируется в Photoshop, а дополнительные кадры на основе той же темы оформления можно сконструировать самим.<br /><br />Ресурс предоставлен <a href="http://www.mysite.ru/engine/go.php?url=aHR0cHM6Ly9kcmliYmJsZS5jb20vR3JhcGhpY3NGdWVs" target="_blank">GraphicsFuel</a><br /><br /><a href="http://www.mysite.ru/engine/go.php?url=aHR0cDovL2JpdC5seS8xdldJelFt" target="_blank">Скачать</a>
    
    go.php?url=aHR0cDovL2JpdC5seS8xdldJelFt

    такого рода ссылкки могут быть в тексте не 1 раз и в разных местах.

    возможноли такое спарсить как я понимаю тут должен работать механизм ГЕТМОРЕКОНТЕНТ. возможноли его туда впихнуть методом поиска и замены.?
     
  2. eleon

    eleon New Member Пользователи

    Регистрация:
    18 фев 2012
    Сообщения:
    37
    ссылка кодированна base64
    aHR0cDovL2JpdC5seS8xdldJelFt

    при декодировании обычным декодером получаем вот что
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    или может обращение к скрипту какому чтоли.
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Макрос [BASE64DECODE] сейчас срабатывает до макроса <GETMORECONTENT>. Если вам нужно использовать их совместно, напишите, поменяю порядок выполнения макросов.

    С уважением к вам, Сергей.
     
  4. eleon

    eleon New Member Пользователи

    Регистрация:
    18 фев 2012
    Сообщения:
    37
    спасибо а я через пхп мост тоже самое прикрутил ) , нет мне порядок не важен, конечный результат тот что я хотел.

    PHP:
    <?php
    $str 
    'VGhpcyBpcyBhbiBlbmNvZGVkIHN0cmluZw==';
    echo 
    base64_decode($str);
    ?>


    This is an encoded string
     
  5. Catmo

    Catmo New Member Пользователи

    Регистрация:
    21 окт 2011
    Сообщения:
    2
    Чтобы темы не плодить, поинтересуюсь тут: возможно ли сохранять в отдельные файлы картинки которые закодированные в base64 и находятся непосредственно в теле html?
    Я имею в виду вот это:
    PHP:
    <img src="data:image/jpeg;base64,/9j/4RVhRXhpZgAATU0AK/............./r3Xvfuvde9+691//2Q==" width="580" height="416">
    --------------------------------
    Проблема решена.
    В работе была использована конструкция типа:

    [SAVETOFILE:<CD_GRAN_1!>.jpg][BASE64DECODE]<CD_GRAN_2!>[/BASE64DECODE][/SAVETOFILE]

    где <CD_GRAN_1!> - значение взятое из тега <h1> и преобразованное в транслит, <CD_GRAN_2!> - данные взяты между src="data:image/jpeg;base64, и "

    + в коде статьи пришлось вставить вот такую строку в поиск/замену:
    <img{skip}src="data:image/jpeg;base64,{skip}>|<img src="<CD_GRAN_1!>.jpg">

    Работает корректно.
     
    Последнее редактирование: 8 апр 2015
  6. Рамиз Велиев

    Рамиз Велиев New Member Пользователи

    Регистрация:
    5 май 2015
    Сообщения:
    7

    Пробую ваш метод, картинка сохраняется но пишет что поврежден(
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Меню - файл - загрузить проект (файлы картинок в папке с контентом будут появляться при парсинге (не при предпросмотре)).

    С уважением к вам, Сергей.
     

    Вложения:

    • myipcam_ru.cdp
      Размер файла:
      26,6 КБ
      Просмотров:
      7

Поделиться этой страницей