[DOCNAME] как сделать вместо article_all_1.txt domain.ru.txt?

Тема в разделе "Разное", создана пользователем Danila, 11 июл 2014.

  1. Danila

    Danila New Member Пользователи

    Регистрация:
    11 июл 2014
    Сообщения:
    13
    Вот уже сколько пользуюсь программой, накак не могу въехать, как же мне сделать название файла полученный после парсинга article_all_1.txt в виде domain.ru.txt.
    У меня однотипная задача парсить 100 сайтов. каждый в свой файл, и полученный файл переименовывать вручную в название домена, чтобы было далее понятно откуда я это парсил.
    Попробовал [DOCNAME] , но у меня получается, что создается папка html, в ней папка названия домена, а в ней уже файл текстовый.

    А мне надо просто чтобы вместо article_all_1 было название домена
    Можно так?

    Шаблон вывода у меня такой
    [HTMTOTXT:]<CD_CYCLE_GRAN_1!>[/HTMTOTXT]
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте!

    Где:
    <CD_DOCURL!> - выводит адрес страницы, которую парсите
    [REPLACE] (поиск-замена):
    ://{get}/|{get} - берет из ссылки все, что между :// и /
    Ссылки недоступны для гостей - удаляет www. из ссылки

    Также:
    Парсинг в 1 файл с опцией дозаписи.

    Файл проекта прилагаю...

    С уважением к вам, Сергей.
     

    Вложения:

  3. Danila

    Danila New Member Пользователи

    Регистрация:
    11 июл 2014
    Сообщения:
    13
    Еееееееееесссс!!! :))

    Заработала @"Простоквашино"
     
  4. Danila

    Danila New Member Пользователи

    Регистрация:
    11 июл 2014
    Сообщения:
    13
    Странно, в новой X1 версии этот вариант у меня не срабатывает
    Кстати, а как парсить например описание к чемуто, и чтобы название каждого файла было тоже не article_all, а например брать из какойто границы парсинга, например из h1 ??
    Только вот как вырезать все символы посторонние в тайтле ,./() типа такие
     
    Последнее редактирование: 19 авг 2014
  5. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Напишите пример из чего взять и что нужно получить)
    Так будет куда проще

    Но вообще да.
    Вы границу 1 помещаете title к примеру, а дальше есть множество вариантов как удалить знаки.
    Но самый простой это применить макрос
    Код:
    [DOCNAME][CLEAR][TRANSLITE][NOFOLDER][TOTRANSLITE:regdown,clear,convertspaces]<CD_GRAN_1!>[/TOTRANSLITE][/DOCNAME]
    TOTRANSLITE удалит все лишние знаки и конвертнет пробелы.
    Либо так, если нужно удалить какую-то специфику.
    Код:
    [DOCNAME][CLEAR][TRANSLITE][NOFOLDER][FIRST_REPLACE(_|=)]<CD_GRAN_1!>[/FIRST_REPLACE][/DOCNAME]
     
    Последнее редактирование: 19 авг 2014

Поделиться этой страницей