<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/">
  <channel>
    <title>Парсинг ссылок из XML-карт сайтов</title>
    <description>Парсинг ссылок из XML-карт сайтов</description>
    <pubDate>Sat, 11 Apr 2026 07:19:26 +0000</pubDate>
    <lastBuildDate>Sat, 11 Apr 2026 07:19:26 +0000</lastBuildDate>
    <generator>Форум по парсингу сайтов и интернет магазинов</generator>
    <link>https://forum.sbfactory.ru/forums/parsing-ssylok-iz-xml-kart-sajtov.47/</link>
    <atom:link rel="self" type="application/rss+xml" href="https://forum.sbfactory.ru/forums/parsing-ssylok-iz-xml-kart-sajtov.47/index.rss"/>
    <item>
      <title>НЕ парсит карту сайта</title>
      <pubDate>Wed, 04 May 2022 17:46:59 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/ne-parsit-kartu-sajta.10076/</link>
      <guid>https://forum.sbfactory.ru/threads/ne-parsit-kartu-sajta.10076/</guid>
      <author>invalid@example.com (Kol57)</author>
      <dc:creator>Kol57</dc:creator>
      <content:encoded><![CDATA[Вечер добрый !!!<br />
Подскажите пожалуйста, как спарсить карту сайта: <a href="https://ru.iherb.com/sitemap_index.xml" target="_blank" class="externalLink" rel="nofollow">https://ru.iherb.com/sitemap_index.xml</a><br />
Все &quot;пережмякал&quot;, а оне не парсится (((<br />
<br />
<br />
<br />
С уважением, Николай.]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Парсинг составной карты сайты (с вложенными подкартами)</title>
      <pubDate>Thu, 13 May 2021 16:08:05 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-sostavnoj-karty-sajty-s-vlozhennymi-podkartami.6269/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-sostavnoj-karty-sajty-s-vlozhennymi-podkartami.6269/</guid>
      <author>invalid@example.com (trans5)</author>
      <dc:creator>trans5</dc:creator>
      <content:encoded><![CDATA[Здравствуйте,<br />
<br />
есть вот такая карта сайта <a href="https://366.ru/sitemap.xml" target="_blank" class="externalLink" rel="nofollow">https://366.ru/sitemap.xml</a> видимо что то у нее с синтаксисом т.к. при открытии в браузере выглядит как текстовый документ. <br />
Вложенные карты сайта динамические  т.е. адрес после  -ru-RUB- каждый день меняется.<br />
<br />
Хотел воспользоваться  парсингом составных xml-карт , все настроил по инструкции, запустив сканер ссылок он находит вложенные xml-карты но ссылки во вложенных не находит. Фильтр ссылок пробовал по разному настраивать и даже полностью...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/parsing-sostavnoj-karty-sajty-s-vlozhennymi-podkartami.6269/" class="internalLink">Парсинг составной карты сайты (с вложенными подкартами)</a>]]></content:encoded>
      <slash:comments>20</slash:comments>
    </item>
    <item>
      <title>Внутри сайтмапа - доп карты, как их парсить?</title>
      <pubDate>Sat, 24 Apr 2021 04:16:46 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/vnutri-sajtmapa-dop-karty-kak-ix-parsit.9493/</link>
      <guid>https://forum.sbfactory.ru/threads/vnutri-sajtmapa-dop-karty-kak-ix-parsit.9493/</guid>
      <author>invalid@example.com (MaiklWizard)</author>
      <dc:creator>MaiklWizard</dc:creator>
      <content:encoded><![CDATA[Добрый день, прошу подсказать - как парсить ссылки с сайтмапа - если там внутри много доп сайтмапов: <a href="https://sp-climate.com/sitemap.xml" target="_blank" class="externalLink" rel="nofollow">ссылка</a>]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>XML карту не грузит</title>
      <pubDate>Thu, 11 Feb 2021 04:13:52 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/xml-kartu-ne-gruzit.9304/</link>
      <guid>https://forum.sbfactory.ru/threads/xml-kartu-ne-gruzit.9304/</guid>
      <author>invalid@example.com (Stan)</author>
      <dc:creator>Stan</dc:creator>
      <content:encoded><![CDATA[Здравствуйте. <br />
Отсюда не загружает ссылки из &quot;загрузить карту сайта&quot;<br />
https://santehnika-online.ru/sitemapcatalogproducts1.xml]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Не собирает ссылки с карты сайта</title>
      <pubDate>Mon, 09 Nov 2020 17:50:10 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/ne-sobiraet-ssylki-s-karty-sajta.9055/</link>
      <guid>https://forum.sbfactory.ru/threads/ne-sobiraet-ssylki-s-karty-sajta.9055/</guid>
      <author>invalid@example.com (Maxxx)</author>
      <dc:creator>Maxxx</dc:creator>
      <content:encoded><![CDATA[Здравствуйте. Пытаюсь собрать  ссылки с sitemap , галочку про &quot;вложенные карты&quot; ставил, фильтр настраивал-разному, менял разные настройки, user agents, CIS, win - не собирает ссылки совсем.<br />
<br />
Ссылка на карту:<br />
<br />
https://www.carbosynth.com/carbosynth/website.nsf/sitemap]]></content:encoded>
      <slash:comments>3</slash:comments>
    </item>
    <item>
      <title>В XML карте сайта нет всех ссылок</title>
      <pubDate>Sun, 01 Nov 2020 05:52:30 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/v-xml-karte-sajta-net-vsex-ssylok.9041/</link>
      <guid>https://forum.sbfactory.ru/threads/v-xml-karte-sajta-net-vsex-ssylok.9041/</guid>
      <author>invalid@example.com (MaiklWizard)</author>
      <dc:creator>MaiklWizard</dc:creator>
      <content:encoded><![CDATA[<b>Донор</b> optcond.com.ua<br />
<br />
Не могу понять, почему с сайтмапа донора не все ссылки присутствуют. Например, этой:<br />
<a href="https://optcond.com.ua/st-09hh-elite/" target="_blank" class="externalLink" rel="nofollow">optcond.com.ua/st-09hh-elite/</a><br />
<a href="https://optcond.com.ua/osaka-st-12hh-elite/" target="_blank" class="externalLink" rel="nofollow">optcond.com.ua/osaka-st-12hh-elite/</a><br />
<br />
и других подобных там нет((<br />
<br />
В тоже время - сканер ссылок - вообще не хочет находить ссылки на товары на сайте - пробовал собрать вручную. <b>Проект приложил.</b> Прошу помощи в исправлении]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Спарсить карту сайта XML</title>
      <pubDate>Thu, 20 Aug 2020 10:20:16 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/sparsit-kartu-sajta-xml.8896/</link>
      <guid>https://forum.sbfactory.ru/threads/sparsit-kartu-sajta-xml.8896/</guid>
      <author>invalid@example.com (nikoshot)</author>
      <dc:creator>nikoshot</dc:creator>
      <content:encoded><![CDATA[Помогите спарсить карту сайта<br />
Вот <a href="https://m-fashion.com.ua/site_map.xml" target="_blank" class="externalLink" rel="nofollow">карта</a><br />
В настроках программы пробовал и так<br />
<a href="http://joxi.ru/vAWMgv1TO1K8xm" target="_blank" class="externalLink" rel="nofollow">http://joxi.ru/vAWMgv1TO1K8xm</a><br />
и так<br />
<a href="http://joxi.ru/LmG4ZGQcleba42" target="_blank" class="externalLink" rel="nofollow">http://joxi.ru/LmG4ZGQcleba42</a><br />
и ничего не находит..<br />
Помогите плиз..]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Парсинг ссылок с определенным &lt;priority&gt;</title>
      <pubDate>Fri, 10 Jul 2020 18:50:11 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-ssylok-s-opredelennym-priority.8691/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-ssylok-s-opredelennym-priority.8691/</guid>
      <author>invalid@example.com (Maxxx)</author>
      <dc:creator>Maxxx</dc:creator>
      <content:encoded><![CDATA[Весь форум обыскал и справки ,не нашел такого (хотя казалось бы, такой функционал точно должен быть).<br />
Можно ли вычленить из XML-карты только ссылки с &lt;<b>priority</b>&gt;<b>0.5</b>&lt;/<b>priority</b>&gt;? <br />
Именно они ведут на карточки товаров, а те, которые 0.6 и выше - это рубрики, главная итп.]]></content:encoded>
      <slash:comments>4</slash:comments>
    </item>
    <item>
      <title>Парсинг составных XML карт сайтов.</title>
      <pubDate>Fri, 03 Jul 2020 11:22:14 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-sostavnyx-xml-kart-sajtov.8764/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-sostavnyx-xml-kart-sajtov.8764/</guid>
      <author>invalid@example.com (MaiklWizard)</author>
      <dc:creator>MaiklWizard</dc:creator>
      <content:encoded><![CDATA[Не могу понять как вставить две ссылки  - чтобы спарсить все товары, если тут:<br />
<br />


	<a href="https://forum.sbfactory.ru/attachments/8421/" target="_blank">Посмотреть вложение 8421</a>
	
<br />
<br />
а у меня две последовательные ссылки((<br />
<br />
<a href="https://client.work-zilla.com/away?url=https%3A%2F%2Farnage.com.ua%2Fcontent%2Fexport%2Farnage.com.ua%2Fcatalog-sitemap-01.xml" target="_blank" class="externalLink" rel="nofollow">https://arnage.com.ua/content/export/arnage.com.ua/catalog-sitemap-01.xml</a>...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/parsing-sostavnyx-xml-kart-sajtov.8764/" class="internalLink">Парсинг составных XML карт сайтов.</a>]]></content:encoded>
      <slash:comments>8</slash:comments>
    </item>
    <item>
      <title>Парсинг ссылок из XML карты сайта</title>
      <pubDate>Tue, 21 Jan 2020 19:36:49 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-ssylok-iz-xml-karty-sajta.8257/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-ssylok-iz-xml-karty-sajta.8257/</guid>
      <author>invalid@example.com (MaiklWizard)</author>
      <dc:creator>MaiklWizard</dc:creator>
      <content:encoded><![CDATA[Добрый день. Я дико прошу прощения. Я неуч. Хотя и стараюсь понять как и что. Прошу падсказку.<br />
Сайт донор: <a href="https://arnage.com.ua/" target="_blank" class="externalLink" rel="nofollow">https://arnage.com.ua/</a><br />
<br />
У него есть сайтмап: <a href="https://arnage.com.ua/content/export/arnage.com.ua/catalog-sitemap.xml" target="_blank" class="externalLink" rel="nofollow">https://arnage.com.ua/content/export/arnage.com.ua/catalog-sitemap.xml</a><br />
<br />
Вопрос - как получить все ссылки на товары - дабы не парсить сканером ссылок?]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Xml и макрос рандом вывода текста</title>
      <pubDate>Tue, 03 Dec 2019 18:40:06 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/xml-i-makros-random-vyvoda-teksta.8142/</link>
      <guid>https://forum.sbfactory.ru/threads/xml-i-makros-random-vyvoda-teksta.8142/</guid>
      <author>invalid@example.com (PeterPen)</author>
      <dc:creator>PeterPen</dc:creator>
      <content:encoded><![CDATA[Добрый день, при парсинге xml с 5000 повторяющихся границ у одной  внутри повторяющейся включил макрос случайного вывода текста и вот уже 1.5  часа нет результа парсинга. Это уже 7 я попытка. Не подскажете в чем может быть дело ? Пробывал другие ссылки с 4000 повторов и выкл макросом. Все работает.]]></content:encoded>
      <slash:comments>6</slash:comments>
    </item>
    <item>
      <title>Перестал работать парсинг XML карт сайта</title>
      <pubDate>Thu, 07 Nov 2019 17:34:28 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/perestal-rabotat-parsing-xml-kart-sajta.6668/</link>
      <guid>https://forum.sbfactory.ru/threads/perestal-rabotat-parsing-xml-kart-sajta.6668/</guid>
      <author>invalid@example.com (talerbiz)</author>
      <dc:creator>talerbiz</dc:creator>
      <content:encoded><![CDATA[Попробовал спарсить несколько карт с разных сайтов, в том числе и с тех которые раньше загружались без проблем. Ничего не работает, вообще ничего не происходит. Что могло случится, кто-то с таким сталкивался ? Версия программы - последняя. С настройками поигрался, результата нет. Помогите, пжл кто сможет.]]></content:encoded>
      <slash:comments>6</slash:comments>
    </item>
    <item>
      <title>Загрузка sitemap.xml через прокси</title>
      <pubDate>Tue, 03 Jul 2018 17:13:22 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/zagruzka-sitemap-xml-cherez-proksi.6653/</link>
      <guid>https://forum.sbfactory.ru/threads/zagruzka-sitemap-xml-cherez-proksi.6653/</guid>
      <author>invalid@example.com (TIIIMOXAN)</author>
      <dc:creator>TIIIMOXAN</dc:creator>
      <content:encoded><![CDATA[Здравствуйте! <br />
<br />
Подскажите, каким образом можно загрузить sitemap.xml сайта используя прокси? Данное действие мне необходимо, так как мой ip забанен.<br />
<br />
При просмотре контента и при парсинге через прокси программа работает, а вот загружать sitemap.xml не хочет.]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Парсинг ссылкок из из несколько тысяч sitemap</title>
      <pubDate>Fri, 08 Dec 2017 16:57:21 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-ssylkok-iz-iz-neskolko-tysjach-sitemap.5858/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-ssylkok-iz-iz-neskolko-tysjach-sitemap.5858/</guid>
      <author>invalid@example.com (nekit44)</author>
      <dc:creator>nekit44</dc:creator>
      <content:encoded><![CDATA[Подскажите как быть если &quot;родительских&quot; несколько тысяч (7 тыс)<br />
<br />
Каждая карта это карта сайта на поддомене, поддомен это город. <br />
<a href="https://saratov.gorko.ru/sitemap.xml" target="_blank" class="externalLink" rel="nofollow">https://saratov.gorko.ru/sitemap.xml</a><br />
Она является родительской дочерних карт.<br />
<br />
<br />
Как бы мне все эти карты загрузить хотя бы по частям по 100-200 шт за раз]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Парсинг новых ссылок</title>
      <pubDate>Sun, 20 Aug 2017 11:03:34 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-novyx-ssylok.5304/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-novyx-ssylok.5304/</guid>
      <author>invalid@example.com (georg)</author>
      <dc:creator>georg</dc:creator>
      <content:encoded><![CDATA[Добрый день!<br />
<br />
когда в sitemap.xml ссылки типа<br />
&lt;url&gt;&lt;loc&gt;ссылка&lt;/loc&gt;&lt;lastmod&gt;2017-04-13T16:31:13+03:00&lt;/lastmod&gt;<br />
возникает желание парсить по карте сайта с учетом тега &lt;lastmod&gt; только обновленные страницы<br />
(проверять lastmod отпарсенных раннее страниц и отбрасывать фильтром ссылку если ее дата не поменялась)<br />
<br />
можете помочь советом или поделится проектом, где так реализовано? (для примера)]]></content:encoded>
      <slash:comments>9</slash:comments>
    </item>
  </channel>
</rss>
