Как сохранить и csv и исходный html одновременно

Тема в разделе "Решение различных задач по парсингу", создана пользователем senya0609, 10 сен 2017.

Статус темы:
Закрыта.
  1. senya0609

    senya0609 New Member Пользователи

    Регистрация:
    12 июн 2017
    Сообщения:
    15
    Город:
    Лисичанск
    Задача: сохранить результат парсинга в csv и html исходной страницы
    Сделал вот так:

    [SAVETOFILE:{path}C:\content\webfiles\{/path}<CD_GRAN_3!>.html{add}{translit}{convertspace}{nodelete}{utf8}][DOCSOURCE][/SAVETOFILE]

    <CD_GRAN_7!><CD_DOCURL!>[CSVCS]<CD_GRAN_7!>[CSVCS]<CD_GRAN_1!>[CSVCS]<CD_DOCURL!>[CSVCS]<CD_GRAN_3!>[CSVCS]<CD_GRAN_5!>[CSVCS]<CD_GRAN_4!>[CSVCS]<CD_GRAN_2!>[CSVCS]<CD_GRAN_6!>

    Html - сохраняется на УРА, но в файлах CSV сначала идет html код, а затем результат парсинга. И так по каждой ссылке.
    Ссылки недоступны для гостей
    А вот результат парсинга
    Ссылки недоступны для гостей
    Что не так делаю?
    [​IMG]
     
    Последнее редактирование: 10 сен 2017
  2. senya0609

    senya0609 New Member Пользователи

    Регистрация:
    12 июн 2017
    Сообщения:
    15
    Город:
    Лисичанск
    Вообщем методом проб и ошибок вот такой получился вариант, но по нему остались вопросы:
    Рабочий вариант:

    [SAVETOFILE:{path}C:\content\webfiles\{/path}<CD_GRAN_3!>.html{add}{translit}{convertspace}{nodelete}{utf8}][DOCSOURCE][/SAVETOFILE]

    [SAVETOFILE:{path}C:\content\{/path}{head}Tech_Key[CSVCS]Comp_URL[CSVCS]Comp[CSVCS]Key_URL[CSVCS]Key_Name[CSVCS]Key_Title[CSVCS]Key_Function[CSVCS]Key_Phone[CSVCS]Key_Email{/head}Rez.csv{add}{translit}{convertspace}{nodelete}{utf8}]<CD_GRAN_7!><CD_DOCURL!>[CSVCS]<CD_GRAN_7!>[CSVCS]<CD_GRAN_1!>[CSVCS]<CD_DOCURL!>[CSVCS]<CD_GRAN_3!>[CSVCS]<CD_GRAN_5!>[CSVCS]<CD_GRAN_4!>[CSVCS]<CD_GRAN_2!>[CSVCS]<CD_GRAN_6!>[/SAVETOFILE]

    А теперь вопросы:
    1. При парсинге открывается окно, хотя оно на результат не влияет но непонятно что от меня хотят этим?
    Ссылки недоступны для гостей
    2 В результате формируются html и csv файлы как хочу, но еще и стандартный файл результата парсинга внутри которого и html и результат прасинга - как отключить его формирование (не принципиально, просто понять хочу)?
    Ссылки недоступны для гостей
    Вот так выглядят html файлы
    Ссылки недоступны для гостей
     
  3. senya0609

    senya0609 New Member Пользователи

    Регистрация:
    12 июн 2017
    Сообщения:
    15
    Город:
    Лисичанск
    В итоге разделил проект на 2
    Для сохранения в html :
    [DOCSOURCE]<br>Source:"<CD_DOCURL!>"
    [DOCNAME][CLEAR][TRANSLITE]<CD_GRAN_1!>.html[/DOCNAME]
    В настройках проекта указываю что файл сохранять в html
    Ссылки недоступны для гостей

    Для для сохранения в csv:
    <CD_CYCLE_GRAN_1!>
    [DOCNAME][CLEAR][TRANSLITE]Base1.csv[/DOCNAME]
    В настройках проекта указываю что файл сохранять в csv
    Ссылки недоступны для гостей

    Может кому полезно будет...
     
    gans нравится это.
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Хотя следовало просто нормально изучить материал по макросу [SAVETOFILE] Ссылки недоступны для гостей
     
  5. senya0609

    senya0609 New Member Пользователи

    Регистрация:
    12 июн 2017
    Сообщения:
    15
    Город:
    Лисичанск
    Изучал, пробовал
    А так как ссылок у меня в обработке очень много, создавать еще и "мусорные" файлы мне ненужно, да и время занимает. Поэтому и разделил создание файлов что бы не тратить место на диске и время на "мусор". Если есть "красивое" решение такой задачи посвятите в сию тайну великую. :)
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Я не знаю как, я не вижу, что вы делаете и откуда он берется.
     
  7. senya0609

    senya0609 New Member Пользователи

    Регистрация:
    12 июн 2017
    Сообщения:
    15
    Город:
    Лисичанск
    Не важно от куда из ссылки или из результата работы wbapp.
    Допустим есть некий [DOCSOURCE] как его сохранить одновременно и в html и csv, то так что бы не создавался третий "мусорный файл" в котором текст и в html и результат парсинга в csv.
    Повторюсь, это не принципиально просто хочу понять и закрепить для себя понимание как это делать.
    Во 2 своем посте я попытался это сделать.
     
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Что мешало сразу все прочитать и понять Ссылки недоступны для гостей :
    Мне неприятно делать одно и то же несколько раз (выдергивать цитаты из своего же текста, тыкать в нужное место текста). Это называется ананизъм.
     
  9. senya0609

    senya0609 New Member Пользователи

    Регистрация:
    12 июн 2017
    Сообщения:
    15
    Город:
    Лисичанск
    То есть, в моем 2 посте достаточно было убрать {nodelete} из [SAVETOFILE] в обоих вызовах макроса?
    Я правильно понял?
     
Статус темы:
Закрыта.

Поделиться этой страницей