вытащить ссылки с повт границы

Тема в разделе "Границы парсинга", создана пользователем Dron25, 18 июл 2014.

  1. Dron25

    Dron25 Well-Known Member Пользователи

    Регистрация:
    17 июн 2014
    Сообщения:
    263
    Здравствуйте мне надо собрать ссылки со страницы, чтоб потом скачать файлы по этим ссылкам

    и надо ка кто почистить от лишних тегов и текста, чтоб остались только ссылки

    сделал повторяющеюся границу 1 там 4 ссылки с лишним мусором

    пробовал чистить так [HTMTOTXT:a] но результат не такой как хотелось

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
    Последнее редактирование: 18 июл 2014
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Начало - a href="
    Конец - "
    + Ссылки недоступны для гостей

    В чем проблема...
     
  3. Dron25

    Dron25 Well-Known Member Пользователи

    Регистрация:
    17 июн 2014
    Сообщения:
    263
    Здравствуйте спасибо за ссылку не раз думал о такой возможности, а оказалось она уже давно есть, чтоб не со всей страницы искать а с нужного куска

    Еще вопрос, как сделать название файла, чтоб он назывался как реальный файл

    все ссылки на файлы отображаются в одной повторяющийся границе
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    это надо создать новую границу, почистить ее чтоб остались названия и вставить сюда вместе 1 ?
    HTML:
    [DFN]<CD_GRAN_1!>/1[/DFN]<DOWNLOADFILE>http://ftp[VALUE]</DOWNLOADFILE>
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Как именно он должен называться, так ajax_register-7.x-4.0-rc15.tar.gz?
    Лучше приложить файл проекта...
     
  5. Dron25

    Dron25 Well-Known Member Пользователи

    Регистрация:
    17 июн 2014
    Сообщения:
    263
    там есть файлы и .tar.gz и .zip

    файл приложил
     

    Вложения:

    • drupal.org.cdp
      Размер файла:
      25,8 КБ
      Просмотров:
      2
  6. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    пожалуйста.
     

    Вложения:

    • drupal.org2.cdp
      Размер файла:
      25,9 КБ
      Просмотров:
      2
  7. Dron25

    Dron25 Well-Known Member Пользователи

    Регистрация:
    17 июн 2014
    Сообщения:
    263
    Спасибо

    а что означает в поиск замене знак вопроса
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
  8. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Код:
    re: (.*?)/
    - если есть абривеатура re: то это действительно регулярное выражение.
    Данное например удалит из ссылки
    Код:
    site.ru/aaa/bbb/ccc/name.txt
    все кроме
    Код:
    name.txt
    Для тестинга используйте сервис Ссылки недоступны для гостей
     
  9. Dron25

    Dron25 Well-Known Member Пользователи

    Регистрация:
    17 июн 2014
    Сообщения:
    263
    Огромное спасибо, открыл для себя новые фишки

    за CD тоже огромное спасибо создателю :yes:
     

Поделиться этой страницей