Файлы в pdf как парсить с указанием имени?

Тема в разделе "Скачивание картинок и файлов", создана пользователем zenit, 24 сен 2013.

  1. zenit

    zenit New Member Пользователи

    Регистрация:
    24 сен 2013
    Сообщения:
    6
    у пациента есть товар с техническим описанием таким, как:
    • паспорт
    • схема подключения
    • инструкция

    границы имеют вид:
    <div class="tab-pane " id="docs"><ul><li><a href="/media/catalog/docs/C/4/C442B56DD2332520E30B716B22C1641A.pdf" target="_blank">Руководство по эксплуатации</a></li></ul></div>

    1 DOWNLOADFILE (http://www.___.ru/<ul><li><a href="/media/catalog/docs/C/4/C442B56DD2332520E30B716B22C1641A.pdf" target="_blank">Руководство по эксплуатации</a></li>):
    C:\Program Files\Smartbyte\Content Downloader 7\preview_files\files\file
    Для включения функции загрузки файла при предпросмотре используйте настройку макроса

    Подскажите как настроить макрос чтобы при парсинге файла он имел название: "Руководство по эксплуатации (название товара)"

    для более глубокого изучения проблемы могу предоставить файл настройки проекта
     
    Последнее редактирование: 24 сен 2013
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Ссылки недоступны для гостей
    [DFN]
     
  3. zenit

    zenit New Member Пользователи

    Регистрация:
    24 сен 2013
    Сообщения:
    6
    Приветствую.
    Если можно на примере показать, так как у самого не выходит каменный цветок.

    Дано:
    <dt>Документация</dt> <dd><div><img border=0 hspace=2 align=left hspace=3 vspace=3 src=images/DOC/pdf.gif title='PDF '><a id=lnk href="images/2013/doc/pvdr-16wds2_e16c496e58fefb2deac467bb3b1f8ebffa41f423858a0bb67b90ba111bbb0db3.pdf">Паспорт PVDR-04WDS2</a> 1.23 Mb <br><br><img border=0 hspace=2 align=left src=images/DOC/pdf.gif title='PDF '> <a id=lnk href='catalogs/catalog_polyvision_2013_web.pdf'>Каталог Polyision 2013 год</a> 8.45 Mb<br><br></div></dd>

    В коде два документа:
    Паспорт PVDR-04WDS2
    Каталог Polyision 2013 год

    Что включить в границы парсинга?
    Как прописать макрос, чтобы конечный файл имел имя файла (по возможности в транслит)

    И еще вариант, дано:
    <div class="tab-pane " id="docs"><ul><li><a href="/media/catalog/docs/7/D/7D0C417D638B18186D1FC3471F0F1F19.pdf" target="_blank">Руководство по эксплуатации</a></li><li><a href="/media/catalog/docs/7/F/7FFB8DEA1DB789C4020325DE998D53D9.pdf" target="_blank">Схема подключения</a></li></ul></div>

    В коде два документа:
    Руководство по эксплуатации
    Схема подключения

    Те же самые вопросы, как и как.....
    Пожалуйста, напишите пример макроса в моем случаи, по двум вариантом.

    Шаблон вывода имеет вид:
    <CD_GRAN_1!>;<CD_GRAN_2!>;<CD_GRAN_3!>;<CD_GRAN_4!>;<CD_GRAN_5!>;<CD_GRAN_6!>;<CD_GRAN_7!>;<CD_GRAN_8!>;<NIMG><CD_GRAN_9!></NIMG>;<CD_GRAN_10!>

    (где <CD_GRAN_1!> название товара)
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    [DFN]папка\имя{ext}расширение[/DFN] (задать имена файлов, которые загружаются макросом DOWNLOADFILE):
    Этот макрос используется для задания имен файлов, которые загружаются на диск макросом шаблона вывода DOWNLOADFILE. Пропишите [DFN]имя[/DFN] в любое место шаблона вывода перед нужным макросом DOWNLOADFILE (можно прописывать перед каждым макросом DOWNLOADFILE несколько раз в документе). При парсинге макрос(ы) [DFN] будет(ут) удалятся из сохраняемых документов.

    Не знаю, что тут непонятного, все расписано, внизу еще и примеры есть!!!

    Если совсем затрудняетесь, то лучше обратитесь в Skype Kagorec за платным решением вашей проблемы, уверен, он справится минут за 10 и возьмет за это символическую плату.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    И по поводу транслита, есть такой макрос в шаблоне вывода [TOTRANSLITE:regdown,clear,convertspaces]текст[/TOTRANSLITE], используйте его.
    Удачного решения проблемы!
     
  6. zenit

    zenit New Member Пользователи

    Регистрация:
    24 сен 2013
    Сообщения:
    6
    Парсит только один документ.
    Шаблон вывода имеет вид:
    <CD_GRAN_1!>;<CD_GRAN_2!>;<CD_GRAN_3!>;<CD_GRAN_4!>;<CD_GRAN_5!>;<CD_GRAN_6!>;<CD_GRAN_7!>;<CD_GRAN_8!>;<NIMG><CD_GRAN_9!></NIMG>;

    [DFN]D:\парсинг\Док актив\<CD_GRAN_20!>{ext}[REWRITE][/DFN]<DOWNLOADFILE><CD_GRAN_10!></DOWNLOADFILE>;

    [DFN]D:\парсинг\Док актив\<CD_GRAN_19!>{ext}[/DFN]<DOWNLOADFILE><CD_GRAN_11!><DOWNLOADFILE>

    Первый файл: D/парсинг/Док актив/Паспорт ML-180K N 023 Mb.pdf(загрузка файлов при предпросмотре отключена)
    второй файл: <DOWNLOADFILE>catalogs/accordtec.pdf<DOWNLOADFILE>

    в чем ошибка?
     
  7. Benjamin Coleman

    Benjamin Coleman New Member Пользователи

    Регистрация:
    23 окт 2010
    Сообщения:
    152
    Приложите проект сюда - посмотрим, разберемся.

    Так ничего не понятно.
     
  8. zenit

    zenit New Member Пользователи

    Регистрация:
    24 сен 2013
    Сообщения:
    6
    Вот. :eek:
     

    Вложения:

    • sb_ru.cdp
      Размер файла:
      312,5 КБ
      Просмотров:
      11
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Для начала хотя бы макрос закройте. У вас: <DOWNLOADFILE><CD_GRAN_11!><DOWNLOADFILE>, а надо: <DOWNLOADFILE><CD_GRAN_11!></DOWNLOADFILE>...
     
  10. zenit

    zenit New Member Пользователи

    Регистрация:
    24 сен 2013
    Сообщения:
    6
    Закрыл, тоже самое

    _ заработало как надо. спасибо
     
    Последнее редактирование: 25 сен 2013
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Рады помочь! Обращайтесь!
     
  12. zenit

    zenit New Member Пользователи

    Регистрация:
    24 сен 2013
    Сообщения:
    6
    Есть еще маленькое, недоразумение....
    сегодня ночью из 7 тыс. стр. спарсил только 40 и полтора файла. Примчался в офис, обновился до версии 7.75.

    Включил жду.... прокси в списке, но ответа от пациента не приходят, возможно что то на стороне больного или чуть перекрутили в новой редакции.
     
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    при парсинге ctrl+l нажмите, будет лог...
     

Поделиться этой страницей