<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/">
  <channel>
    <title>Сохранение результата парсинга контента</title>
    <description>Вопросы, связанные с созданием нужного формата результирующего файла (куда парсим контент)</description>
    <pubDate>Fri, 15 May 2026 23:28:29 +0000</pubDate>
    <lastBuildDate>Fri, 15 May 2026 23:28:29 +0000</lastBuildDate>
    <generator>Форум по парсингу сайтов и интернет магазинов</generator>
    <link>https://forum.sbfactory.ru/forums/soxranenie-rezultata-parsinga-kontenta.60/</link>
    <atom:link rel="self" type="application/rss+xml" href="https://forum.sbfactory.ru/forums/soxranenie-rezultata-parsinga-kontenta.60/index.rss"/>
    <item>
      <title>После парсинга сохраняет пустой файл</title>
      <pubDate>Wed, 27 Dec 2023 16:05:36 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/posle-parsinga-soxranjaet-pustoj-fajl.10696/</link>
      <guid>https://forum.sbfactory.ru/threads/posle-parsinga-soxranjaet-pustoj-fajl.10696/</guid>
      <author>invalid@example.com (makar)</author>
      <dc:creator>makar</dc:creator>
      <content:encoded><![CDATA[Добавляю ссылки на то что нужно спарсить, нажимаю парсить, в итоге парсит только половину<br />
Если каждую ссылку парсить отдельно то все ок, если добавлено до 4ех ссылок то тоже норм парсит, если больше 4ех парсить, то часть сохраняемых файлов с данными оказываются пустыми]]></content:encoded>
      <slash:comments>5</slash:comments>
    </item>
    <item>
      <title>Если не нужно сохранять документ</title>
      <pubDate>Sun, 08 Oct 2023 16:40:14 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/esli-ne-nuzhno-soxranjat-dokument.10645/</link>
      <guid>https://forum.sbfactory.ru/threads/esli-ne-nuzhno-soxranjat-dokument.10645/</guid>
      <author>invalid@example.com (keps)</author>
      <dc:creator>keps</dc:creator>
      <content:encoded><![CDATA[Иногда требуется просто запустить страницу без сохранения документа. Как это сделать? В системе помощи не нашел инфы.]]></content:encoded>
    </item>
    <item>
      <title>Удалить дубли</title>
      <pubDate>Sun, 25 Jun 2023 10:05:20 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/udalit-dubli.10582/</link>
      <guid>https://forum.sbfactory.ru/threads/udalit-dubli.10582/</guid>
      <author>invalid@example.com (logindenic)</author>
      <dc:creator>logindenic</dc:creator>
      <content:encoded><![CDATA[Приветствую.<br />
Подскажите, как удалить дубли, после того, когда дозаписывается спарсенный файл?]]></content:encoded>
    </item>
    <item>
      <title>Как вывести csv UTF-8 без BOM</title>
      <pubDate>Sun, 25 Jun 2023 10:03:38 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/kak-vyvesti-csv-utf-8-bez-bom.10581/</link>
      <guid>https://forum.sbfactory.ru/threads/kak-vyvesti-csv-utf-8-bez-bom.10581/</guid>
      <author>invalid@example.com (logindenic)</author>
      <dc:creator>logindenic</dc:creator>
      <content:encoded><![CDATA[Как сохранить csv в UTF-8 без BOM?<br />
В опциях программы поставил дефолтное значения UTF-8 без BOM, создал новый проект и все равно выводит в UTF-8 <b>с</b> BOM.]]></content:encoded>
    </item>
    <item>
      <title>Пустые значения повторяющейся границы парсинга</title>
      <pubDate>Mon, 27 Mar 2023 17:11:16 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/pustye-znachenija-povtorjajuschejsja-granicy-parsinga.10500/</link>
      <guid>https://forum.sbfactory.ru/threads/pustye-znachenija-povtorjajuschejsja-granicy-parsinga.10500/</guid>
      <author>invalid@example.com (strateg2010)</author>
      <dc:creator>strateg2010</dc:creator>
      <content:encoded><![CDATA[Добрый день, есть необходимость парсить конкретные артикулы в блоке рекомендуемых товаров, только того производителя, который в данный момент паршу, к примеру страница товара с производителем GROHE и нужно собрать все артикулы, в блоке рекомендуем этого же производителя. <br />
Тут проблем не возникло и собираются только те артикулы которые нужны, но появляются пустые значения:<br />
в настройке ПГ фильтрую при помощи IF<br />


<div class="bbCodeBlock bbCodeCode">
	<div class="type">Код:</div>
	<pre>[IF1]&lt;CD_GRAN_7!&gt;[TEXTEQUAL][GRAN14][THEN][GRAN15][ELSE][/IF1]</pre>
</div>...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/pustye-znachenija-povtorjajuschejsja-granicy-parsinga.10500/" class="internalLink">Пустые значения повторяющейся границы парсинга</a>]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>После 200 ссылок в результатах парса начинает попадать HTML код страницы</title>
      <pubDate>Mon, 05 Sep 2022 01:41:09 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/posle-200-ssylok-v-rezultatax-parsa-nachinaet-popadat-html-kod-stranicy.10215/</link>
      <guid>https://forum.sbfactory.ru/threads/posle-200-ssylok-v-rezultatax-parsa-nachinaet-popadat-html-kod-stranicy.10215/</guid>
      <author>invalid@example.com (VVV)</author>
      <dc:creator>VVV</dc:creator>
      <content:encoded><![CDATA[В задании стоит 3900 ссылок, запуск задания как с прокси, так и без (даже в один поток) - результат одинаков - где-то после 200го результата начинает сыпаться html код страницы (Описание товара на WB с html, причем в результаты валится всё и коды счетчиков и ссылки на скрипты и прочее.. ) , и так несколько ссылок подряд, потом снова нормально парсится.<br />
<br />
Если запустить отдельно эту ссылку на парсинг - всё ок, это именно в очереди заданий происходит.<br />
Баг именно на описании товара получаем.<br />
На...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/posle-200-ssylok-v-rezultatax-parsa-nachinaet-popadat-html-kod-stranicy.10215/" class="internalLink">После 200 ссылок в результатах парса начинает попадать HTML код страницы</a>]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Как поменять маску имени файла вывода CSV</title>
      <pubDate>Mon, 27 Jun 2022 00:16:38 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/kak-pomenjat-masku-imeni-fajla-vyvoda-csv.5825/</link>
      <guid>https://forum.sbfactory.ru/threads/kak-pomenjat-masku-imeni-fajla-vyvoda-csv.5825/</guid>
      <author>invalid@example.com (CSVCS)</author>
      <dc:creator>CSVCS</dc:creator>
      <content:encoded><![CDATA[Здравствуйте! Не смог найти самостоятельно, ни в разделе помощи, ни на форуме, ни в настройках программы...<br />
Подскажите, пожалуйста, где в настройках программы можно задать маску именам файлов, отличную от  article_all_? Сейчас все результирующие файлы имеют имена article_all_1.csv, article_all_2.csv и т.д., а хотелось бы задать им маску по названию проекта.]]></content:encoded>
      <slash:comments>5</slash:comments>
    </item>
    <item>
      <title>Проблема с кодировкой</title>
      <pubDate>Fri, 21 Jan 2022 03:12:08 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/problema-s-kodirovkoj.9951/</link>
      <guid>https://forum.sbfactory.ru/threads/problema-s-kodirovkoj.9951/</guid>
      <author>invalid@example.com (dimochkaorg)</author>
      <dc:creator>dimochkaorg</dc:creator>
      <content:encoded><![CDATA[Борцы за светлое будущее Земли и борцухи!! )))) Случилось страшное. Парсил я один сайт. Оставив загрузку Web документа в режиме AUTO. И получил на выходе вот такое РїРµСЂРµРґР°С‚РѕС‡РЅРѕРіРѕ РѕС‚РЅРѕС€РµРЅРёСЏ СЂСѓР»СЏ (VGS/VGRS)&quot;;&quot;РРЅРґРёРєР°С‚РѕСЂ РїР°РґРµРЅРёСЏ РґР°РІР»РµРЅРёСЏ . Два дня работы коту Шредингера под хвост или можно как-то декоднуть? Хелп.]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Как сохранить html в txt и задать название из &lt;CD_DOCURL!&gt;</title>
      <pubDate>Thu, 10 Jun 2021 08:08:39 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/kak-soxranit-html-v-txt-i-zadat-nazvanie-iz-cd_docurl.9572/</link>
      <guid>https://forum.sbfactory.ru/threads/kak-soxranit-html-v-txt-i-zadat-nazvanie-iz-cd_docurl.9572/</guid>
      <author>invalid@example.com (timyrbay)</author>
      <dc:creator>timyrbay</dc:creator>
      <content:encoded><![CDATA[Нужно сохранить документы, в csv не получается - они фрагментируются. <br />
Как можно сохранить название текстового документа из ссылки &lt;CD_DOCURL!&gt;? <br />
В ссылках присутствуют невозможные для виндовс знаки типа https:// - их можно как-то исключить из названия?]]></content:encoded>
      <slash:comments>4</slash:comments>
    </item>
    <item>
      <title>Возможность сохранения файлов сразу на внешний сервер</title>
      <pubDate>Fri, 11 Dec 2020 13:08:02 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/vozmozhnost-soxranenija-fajlov-srazu-na-vneshnij-server.9150/</link>
      <guid>https://forum.sbfactory.ru/threads/vozmozhnost-soxranenija-fajlov-srazu-na-vneshnij-server.9150/</guid>
      <author>invalid@example.com (weresa)</author>
      <dc:creator>weresa</dc:creator>
      <content:encoded><![CDATA[Здравствуйте.<br />
Ситуация такая, что нужно выкачать несколько миллионов фото и это, конечно, потребует значительного пространства на диске. И впоследствии возникнет проблема с передачей фото клиенту...<br />
Существует ли возможность, чтобы назначить местом сохранения файлов не свой компьютер, а например Гугл-диск либо другое какое-то &quot;облако&quot;?<br />
Заранее благодарю всех за отклик)]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Оставить пустые контейнеры ячеек после [DYNAMICVALUES]. Возможно?</title>
      <pubDate>Wed, 18 Nov 2020 00:26:47 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/ostavit-pustye-kontejnery-jacheek-posle-dynamicvalues-vozmozhno.9070/</link>
      <guid>https://forum.sbfactory.ru/threads/ostavit-pustye-kontejnery-jacheek-posle-dynamicvalues-vozmozhno.9070/</guid>
      <author>invalid@example.com (Smodey)</author>
      <dc:creator>Smodey</dc:creator>
      <content:encoded><![CDATA[Добрый день. Суть в чём.<br />
Допустим парсим характеристики товара через [DYNAMICVALUES] с разных страниц в разные файлы.<br />
В случае, если значения 4 и 5 нету, то создаётся файл:<br />
&quot;Хар1&quot;;&quot;Знач1&quot;;&quot;Хар2&quot;;&quot;Знач2&quot;;&quot;Хар3&quot;;&quot;Знач3&quot;;&quot;Хар4&quot;;&quot;Знач4&quot;;&quot;Хар5&quot;;&quot;Знач5&quot;<br />
&quot;1&quot;;&quot;1&quot;;&quot;2&quot;;&quot;2&quot;;&quot;3&quot;;&quot;3&quot;<br />
<br />
Возможно ли сделать так, чтобы создавался вот такого формата файл:<br />
&quot;Хар1&quot;;&quot;Знач1&quot;;&quot;Хар2&quot;;&quot;Знач2&quot;;&quot;Хар3&quot;;&quot;Знач3&quot;;&quot;Хар4&quot;;&quot;Знач4&quot;;&quot;Хар5&quot;;&quot;Знач5&quot;<br />
&quot;1&quot;;&quot;1&quot;;&quot;2&quot;;&quot;2&quot;;&quot;3&quot;;&quot;3&quot;;&quot;&quot;;&quot;&quot;;&quot;&quot;;&quot;&quot;<br />
<br />
Т.е. чтобы добавлялись пустые ячейки в конце...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/ostavit-pustye-kontejnery-jacheek-posle-dynamicvalues-vozmozhno.9070/" class="internalLink">Оставить пустые контейнеры ячеек после [DYNAMICVALUES]. Возможно?</a>]]></content:encoded>
      <slash:comments>11</slash:comments>
    </item>
    <item>
      <title>Сохранение в том же файле (с указанным именем)</title>
      <pubDate>Thu, 05 Nov 2020 18:04:46 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/soxranenie-v-tom-zhe-fajle-s-ukazannym-imenem.6322/</link>
      <guid>https://forum.sbfactory.ru/threads/soxranenie-v-tom-zhe-fajle-s-ukazannym-imenem.6322/</guid>
      <author>invalid@example.com (wcw2007)</author>
      <dc:creator>wcw2007</dc:creator>
      <content:encoded><![CDATA[Добрый день!<br />
<br />
Возможно ли, добавить кнопку возле чистка папки перед сохранением или сохранять все в 1 файл, добавить кнопку сохранять в том же файле, т.е. я парсю локальные файлы, и нужны сохранения именно в этом файле с таким же названием, а сейчас в папку content названия статей article1.html вообще не то. Огромное спасибо программа супер.]]></content:encoded>
      <slash:comments>11</slash:comments>
    </item>
    <item>
      <title>Ошибка записи данных в файл</title>
      <pubDate>Thu, 08 Oct 2020 13:10:23 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/oshibka-zapisi-dannyx-v-fajl.8989/</link>
      <guid>https://forum.sbfactory.ru/threads/oshibka-zapisi-dannyx-v-fajl.8989/</guid>
      <author>invalid@example.com (Farid)</author>
      <dc:creator>Farid</dc:creator>
      <content:encoded><![CDATA[Первый раз с таким столкнулся.<br />
<br />


	<a href="https://forum.sbfactory.ru/attachments/8830/" target="_blank">Посмотреть вложение 8830</a>
	
<br />
<br />
Нельзя даже закрыть программу. Только через диспетчер задач.]]></content:encoded>
    </item>
    <item>
      <title>Некоторые символы сохраняются, как знаки вопросов</title>
      <pubDate>Mon, 21 Sep 2020 19:25:14 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/nekotorye-simvoly-soxranjajutsja-kak-znaki-voprosov.8976/</link>
      <guid>https://forum.sbfactory.ru/threads/nekotorye-simvoly-soxranjajutsja-kak-znaki-voprosov.8976/</guid>
      <author>invalid@example.com (ap2205)</author>
      <dc:creator>ap2205</dc:creator>
      <content:encoded><![CDATA[Здравствуйте, скажите пожалуйста, почему при парсинге характеристик в значениях вместо &quot;x&quot; появляются &quot;?&quot;?<br />
Скрин прилагаю...<br />


	<a href="https://forum.sbfactory.ru/attachments/8788/" target="_blank">Посмотреть вложение 8788</a>
	
<br />
Пробовал парсить с разной кодировкой ANSI, UTF-8, UTF-8 без BOOM. При настройках UTF-8, UTF-8 без BOOM вообще все в непонятных символах. А при ANSI появляются знаки вопроса.]]></content:encoded>
      <slash:comments>9</slash:comments>
    </item>
    <item>
      <title>При парсинге в таблицу CSV данные сохраняются в некорректном формате</title>
      <pubDate>Mon, 06 Jul 2020 13:01:22 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/pri-parsinge-v-tablicu-csv-dannye-soxranjajutsja-v-nekorrektnom-formate.8769/</link>
      <guid>https://forum.sbfactory.ru/threads/pri-parsinge-v-tablicu-csv-dannye-soxranjajutsja-v-nekorrektnom-formate.8769/</guid>
      <author>invalid@example.com (jeck2020)</author>
      <dc:creator>jeck2020</dc:creator>
      <content:encoded><![CDATA[Помогите, пожалуйста,  решить задачу.<br />
<br />
Есть такой сайт  (одна из нужных страничек) <a href="http://freshsound.ru/12309-nine-audio-the-code.html" target="_blank" class="externalLink" rel="nofollow">http://freshsound.ru/12309-nine-audio-the-code.html</a><br />
<br />
и такой код<br />
.....<br />


<div class="bbCodeBlock bbCodeCode">
	<div class="type">Код:</div>
	<pre>  &lt;audio id=&quot;audio1&quot; class=&quot;HTML5AudioPlayer&quot; width=&quot;100%&quot;&gt;
  &lt;source src=&quot;https://cdn.slooply.com/public/demo-mp3/5d7b9e7963030.mp3&quot; type=&quot;audio/mpeg&quot; /&gt;
  &lt;source src=&quot;music/song.ogg&quot; type=&quot;audio/ogg&quot; /&gt;
&lt;/audio&gt;
</pre>
</div>.....<br />
<br />
Задаю начало границы (парсю с границами) - CD_GRAN_4<br />
<br />


<div class="bbCodeBlock bbCodeCode">
	<div class="type">Код:</div>
	<pre>&lt;audio id=&quot;audio1&quot;...</pre>
</div><a href="https://forum.sbfactory.ru/threads/pri-parsinge-v-tablicu-csv-dannye-soxranjajutsja-v-nekorrektnom-formate.8769/" class="internalLink">При парсинге в таблицу CSV данные сохраняются в некорректном формате</a>]]></content:encoded>
      <slash:comments>5</slash:comments>
    </item>
    <item>
      <title>Парсинг остатка незагруженных страниц</title>
      <pubDate>Sun, 05 Jul 2020 11:32:43 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-ostatka-nezagruzhennyx-stranic.8776/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-ostatka-nezagruzhennyx-stranic.8776/</guid>
      <author>invalid@example.com (timyrbay)</author>
      <dc:creator>timyrbay</dc:creator>
      <content:encoded><![CDATA[Здравствуйте.<br />
Столкнулся с задачей. Нужен парсинг характеристик сайта. Все парсится, хорошо, но так случается что остаются не спарсенными ссылки (1-5%). <br />
1. Как можно неспарсенные ссылки добавить в список парсинга автоматически?<br />
2. В программе есть инструмент для работы с csv файлами. Есть ли возможность объединить одинаковые столбцы характеристик (при парсинге характеристик) для нескольких файлов csv?]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Парсинг одного WEB документа в разные файлы на диск</title>
      <pubDate>Fri, 26 Jun 2020 20:13:11 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-odnogo-web-dokumenta-v-raznye-fajly-na-disk.8744/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-odnogo-web-dokumenta-v-raznye-fajly-na-disk.8744/</guid>
      <author>invalid@example.com (dimochkaorg)</author>
      <dc:creator>dimochkaorg</dc:creator>
      <content:encoded><![CDATA[Друзьяи мои, есть проект парсится все с одной странице, путем повторяющихся границ, скажите нельзя ли чтобы каждый цикл ложился в отдельный файл? А то все парсится в один. Я уже жал кнопку 1 и отжимал. Как понимаю файл результата создается на один вебдокумент. но что делать, ведь он у меня только один. <img src="styles/default/xenforo/clear.png" class="mceSmilieSprite mceSmilie1" alt=":)" title="Smile    :)" />)))]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Unicode</title>
      <pubDate>Thu, 23 Apr 2020 11:39:38 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/unicode.8548/</link>
      <guid>https://forum.sbfactory.ru/threads/unicode.8548/</guid>
      <author>invalid@example.com (baracuda)</author>
      <dc:creator>baracuda</dc:creator>
      <content:encoded><![CDATA[Не совсем понимаю как решить вопрос...<br />
при парсинге &quot;границы парсинга&quot; в дополнительных настройка ставим галочку html в txt и символы<br />
&amp;#x41D;&amp;#x430; &amp;#x441;&amp;#x432;&amp;#x435;&amp;#x436;&amp;#x435;&amp;#x43C; &amp;#x432;&amp;#x43E;&amp;#x437;&amp;#x434;&amp;#x443;&amp;#x445;&amp;#x435;<br />
превращаются в нормальные буквы..<br />
<br />
Задача превратить тоже самое но при &quot;повторяющихся границах&quot;<br />
<br />
Заранее спасибо..<br />
<br />
Спасибо.. вопрос решён [HTMLDECODE]]]></content:encoded>
    </item>
    <item>
      <title>Ограничение на длину пути к файлу</title>
      <pubDate>Fri, 31 Jan 2020 18:54:02 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/ogranichenie-na-dlinu-puti-k-fajlu.8288/</link>
      <guid>https://forum.sbfactory.ru/threads/ogranichenie-na-dlinu-puti-k-fajlu.8288/</guid>
      <author>invalid@example.com (weresa)</author>
      <dc:creator>weresa</dc:creator>
      <content:encoded><![CDATA[Здравствуйте, уважаемые.<br />
Столкнулась с такой проблемой - сохраняю фото с указанием иерархии папок его размещения.<br />
А поскольку там вложенность в 5 уровней и название папок иногда длинное, то последняя папка сохраняется в обрезанном виде. Из-за этого неверно происходит сохранение фото.<br />
Не подскажете ли, можно ли это ограничение снять или изменить?<br />
Вопрос очень важный. Очень надеюсь на вашу помощь..]]></content:encoded>
      <slash:comments>5</slash:comments>
    </item>
    <item>
      <title>Сортировка результатов парсинга</title>
      <pubDate>Sun, 10 Nov 2019 12:45:25 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/sortirovka-rezultatov-parsinga.8061/</link>
      <guid>https://forum.sbfactory.ru/threads/sortirovka-rezultatov-parsinga.8061/</guid>
      <author>invalid@example.com (hair_fly)</author>
      <dc:creator>hair_fly</dc:creator>
      <content:encoded><![CDATA[Подскажите, можно ли как-то после окончания парсинга сделать сортировку полученного csv по определенному столбцу?]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
  </channel>
</rss>
