<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/">
  <channel>
    <title>Сбор ссылок сканером сайтов</title>
    <description>Сбор ссылок сканером сайтов</description>
    <pubDate>Sun, 07 Jun 2026 02:28:37 +0000</pubDate>
    <lastBuildDate>Sun, 07 Jun 2026 02:28:37 +0000</lastBuildDate>
    <generator>Форум по парсингу сайтов и интернет магазинов</generator>
    <link>https://forum.sbfactory.ru/forums/sbor-ssylok-skanerom-sajtov.45/</link>
    <atom:link rel="self" type="application/rss+xml" href="https://forum.sbfactory.ru/forums/sbor-ssylok-skanerom-sajtov.45/index.rss"/>
    <item>
      <title>Сканер сайтов со списка урлов</title>
      <pubDate>Thu, 26 Jun 2025 11:03:15 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/skaner-sajtov-so-spiska-urlov.10929/</link>
      <guid>https://forum.sbfactory.ru/threads/skaner-sajtov-so-spiska-urlov.10929/</guid>
      <author>invalid@example.com (rasta)</author>
      <dc:creator>rasta</dc:creator>
      <content:encoded><![CDATA[Всем привет! Подскажите, можно ли настроить сканер страниц сайтов не по одному вручную, а загрузив список? Мне нужно просканировать много сайтов на предмет количества страниц на каждом из них]]></content:encoded>
    </item>
    <item>
      <title>Как парсить ссылки на сабдомены?</title>
      <pubDate>Mon, 06 Nov 2023 17:51:45 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/kak-parsit-ssylki-na-sabdomeny.10664/</link>
      <guid>https://forum.sbfactory.ru/threads/kak-parsit-ssylki-na-sabdomeny.10664/</guid>
      <author>invalid@example.com (GAGAn)</author>
      <dc:creator>GAGAn</dc:creator>
      <content:encoded><![CDATA[К примеру начинаем парсить с site.com, на странице ссылки asdf.site.com f1123.site.com ssss.site.com 54321.site.com <br />
Как вот эти ссылки на сабы автоматический загрузить в очередь и по ним пройтись? На сабах тоже сть ссылки на сабы в пределах 1 домена.]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Сборка ссылок сканером с динамическим контекстом</title>
      <pubDate>Tue, 04 Apr 2023 09:45:48 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/sborka-ssylok-skanerom-s-dinamicheskim-kontekstom.10508/</link>
      <guid>https://forum.sbfactory.ru/threads/sborka-ssylok-skanerom-s-dinamicheskim-kontekstom.10508/</guid>
      <author>invalid@example.com (ChipFord)</author>
      <dc:creator>ChipFord</dc:creator>
      <content:encoded><![CDATA[Здравствуйте!<br />
Есть к примеру сайт: <a href="https://www.teknorot.com/en/catalog/" target="_blank" class="externalLink" rel="nofollow">https://www.teknorot.com/en/catalog/</a><br />
необходимо собрать ссылки такого типа из каталога: <a href="https://www.teknorot.com/en/product/ac-217/" target="_blank" class="externalLink" rel="nofollow">https://www.teknorot.com/en/product/ac-217/</a><br />
<br />
в настройках проекта:<br />
<br />
[MAXIMIZEWINDOW]<br />
[WAIT]:10000<br />
[REPEAT]<br />
[WAIT]:3000<br />
[GETHTML]<br />
[MOUSECLICK]:1485|544<br />
[/REPEAT]<br />
<br />
вопрос в том, как сделать так, чтобы автоматически добавлялись найденные ссылки после каждого клика мыши в окно выдачи ссылок]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Со временем зависают поттоки сканнера сайтов</title>
      <pubDate>Sun, 19 Feb 2023 01:23:00 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/so-vremenem-zavisajut-pottoki-skannera-sajtov.10445/</link>
      <guid>https://forum.sbfactory.ru/threads/so-vremenem-zavisajut-pottoki-skannera-sajtov.10445/</guid>
      <author>invalid@example.com (seodamage)</author>
      <dc:creator>seodamage</dc:creator>
      <content:encoded><![CDATA[привет, столкнулся с такой проблемой:<br />
<br />
1) гружу в сканнер по 1кк ссылок, в настройках стоит <b>не пополнять очередь</b> то есть паршу только морды.<br />
<br />
2) выставляю 100 потоков без пауз. в CTRL + R, добавлены 3 сокс прокси которые я сам поднимал и их качество я отношу к разряду очень хорошие. мне приходят алерты если что то падает, за всю историю приходило только 1-2 раза и то это было связано с техническими работами хостера. так же я регулярно мониторю загрузку прокси и самих серверов -...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/so-vremenem-zavisajut-pottoki-skannera-sajtov.10445/" class="internalLink">Со временем зависают поттоки сканнера сайтов</a>]]></content:encoded>
      <slash:comments>6</slash:comments>
    </item>
    <item>
      <title>Автоматический бекап при сканировании ссылок с сайта</title>
      <pubDate>Thu, 09 Feb 2023 13:38:50 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/avtomaticheskij-bekap-pri-skanirovanii-ssylok-s-sajta.9664/</link>
      <guid>https://forum.sbfactory.ru/threads/avtomaticheskij-bekap-pri-skanirovanii-ssylok-s-sajta.9664/</guid>
      <author>invalid@example.com (pablo)</author>
      <dc:creator>pablo</dc:creator>
      <content:encoded><![CDATA[Здравствуйте.<br />
<br />
Парсил большой сайт, собирал ссылки 10 часов неспешно. Комп завис из-за другой программы, пришлось перезагружать. Можно ли как-то восстановить списки уже обработанных урлов + список на обход, чтобы заново не тратить 10 часов?<br />
<br />
Списки найденных урлов в SCANNER_RES_LINKS есть, но хочется восстановить все )<br />
<br />
<br />
ps если бы была возможность автоматически бекапить результаты каждые N минут - было бы здорово.]]></content:encoded>
      <slash:comments>8</slash:comments>
    </item>
    <item>
      <title>Не все ссылки собираются с ebay</title>
      <pubDate>Sat, 14 May 2022 15:18:29 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/ne-vse-ssylki-sobirajutsja-s-ebay.10085/</link>
      <guid>https://forum.sbfactory.ru/threads/ne-vse-ssylki-sobirajutsja-s-ebay.10085/</guid>
      <author>invalid@example.com (soltecsdev)</author>
      <dc:creator>soltecsdev</dc:creator>
      <content:encoded><![CDATA[Здравствуйте, перед тем как создавать тему прошелся поиском по форуму, почитал аналогичные темы, но ответа не нашел.<br />
Заранее прошу прощения, за то, что могу спрашивать банальные вещи, которые описаны в документации, программой пользуюсь всего два дня, а сроки сдачи работы поджимают.<br />
<br />
Собираю ссылки сканером сайта через библиотеку Clever Internet Sute.<br />
Собираю ссылки из этой категории...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/ne-vse-ssylki-sobirajutsja-s-ebay.10085/" class="internalLink">Не все ссылки собираются с ebay</a>]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Вопрос по парсеру - по разделу, парсинга ссылок, опции поиск и замена.</title>
      <pubDate>Sat, 08 Jan 2022 18:11:28 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/vopros-po-parseru-po-razdelu-parsinga-ssylok-opcii-poisk-i-zamena.6297/</link>
      <guid>https://forum.sbfactory.ru/threads/vopros-po-parseru-po-razdelu-parsinga-ssylok-opcii-poisk-i-zamena.6297/</guid>
      <author>invalid@example.com (MaiklWizard)</author>
      <dc:creator>MaiklWizard</dc:creator>
      <content:encoded><![CDATA[Вопрос по парсеру - по разделу, парсинга ссылок, опции поиск и замена.<br />
<a href="https://www.moyo.ua/comp-and-periphery/periphery-and-compon/kuleri-i-radiatory/" target="_blank" class="externalLink" rel="nofollow"><span style="text-decoration: underline">ссылка</span></a> - У данного сайта для товаров в категории, нету DIVa - div они отметили только акциионные предложения товаров, если они встречаются на сайте, и следовательно такая настройка: <br />
<br />


<div class="bbCodeBlock bbCodeCode">
	<div class="type">Код:</div>
	<pre>&lt;div class=&quot;goods_list tiles catScrollImg load-on-scroll&quot; id=&quot;goods_list&quot;{AUTO}div|{AUTO}{GETMETHOD}</pre>
</div>Никак не хочет работать. В...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/vopros-po-parseru-po-razdelu-parsinga-ssylok-opcii-poisk-i-zamena.6297/" class="internalLink">Вопрос по парсеру - по разделу, парсинга ссылок, опции поиск и замена.</a>]]></content:encoded>
      <slash:comments>16</slash:comments>
    </item>
    <item>
      <title>сбор ссылок из категории</title>
      <pubDate>Wed, 08 Dec 2021 08:17:11 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/sbor-ssylok-iz-kategorii.9899/</link>
      <guid>https://forum.sbfactory.ru/threads/sbor-ssylok-iz-kategorii.9899/</guid>
      <author>invalid@example.com (Magsim)</author>
      <dc:creator>Magsim</dc:creator>
      <content:encoded><![CDATA[Здравия всем<br />
Пожалуйста направьте в нужном направлении<br />
Имею категории<br />
<a href="https://newdoors82.ru/product-category/mezhkomnatnye-dveri/" target="_blank" class="externalLink" rel="nofollow">https://newdoors82.ru/product-category/mezhkomnatnye-dveri/</a><br />
ДОбавляю в очередь нужные категории<br />
Но  в выдаче выходят аксесуары, которых не должно быть, сами товары не парсятся.<br />
Направьте пожалуйста.]]></content:encoded>
      <slash:comments>5</slash:comments>
    </item>
    <item>
      <title>Парсинг товаров с сайта</title>
      <pubDate>Fri, 29 Oct 2021 18:21:17 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/parsing-tovarov-s-sajta.9827/</link>
      <guid>https://forum.sbfactory.ru/threads/parsing-tovarov-s-sajta.9827/</guid>
      <author>invalid@example.com (Aleksey746)</author>
      <dc:creator>Aleksey746</dc:creator>
      <content:encoded><![CDATA[https://www.grohe.ua/uk_ua/<br />
Нужно спарсить все товары с сайта<br />
Но даже задания задание фильтр ссылок скрин <a href="https://imgur.com/XBJgKo0" target="_blank" class="externalLink" rel="nofollow">https://imgur.com/XBJgKo0</a><br />
То выводиться только 90 товаров и всё]]></content:encoded>
      <slash:comments>2</slash:comments>
    </item>
    <item>
      <title>Сообщение об ошибке Out of memory</title>
      <pubDate>Wed, 22 Sep 2021 13:31:20 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/soobschenie-ob-oshibke-out-of-memory.9755/</link>
      <guid>https://forum.sbfactory.ru/threads/soobschenie-ob-oshibke-out-of-memory.9755/</guid>
      <author>invalid@example.com (linker_studio)</author>
      <dc:creator>linker_studio</dc:creator>
      <content:encoded><![CDATA[Как обойти ошибку - Сообщение об ошибке Out of memory<br />
<br />
<img src="https://i.ibb.co/dg9Zs9R/2021-09-21-225247.jpg" class="bbCodeImage LbImage" alt="[&#x200B;IMG]" data-url="https://i.ibb.co/dg9Zs9R/2021-09-21-225247.jpg" />]]></content:encoded>
      <slash:comments>6</slash:comments>
    </item>
    <item>
      <title>Кнопка "Load More"</title>
      <pubDate>Fri, 10 Sep 2021 08:22:45 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/knopka-load-more.9721/</link>
      <guid>https://forum.sbfactory.ru/threads/knopka-load-more.9721/</guid>
      <author>invalid@example.com (Leonkrmv)</author>
      <dc:creator>Leonkrmv</dc:creator>
      <content:encoded><![CDATA[Я не могу понять как собрать линк с этого сайта: <a href="https://www.allrecipes.com/recipes/88/bbq-grilling/" target="_blank" class="externalLink" rel="nofollow">https://www.allrecipes.com/recipes/88/bbq-grilling/</a>. в самом внизу есто кнопка лоад море]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Проблема с парсингом ссылок на страницы</title>
      <pubDate>Wed, 08 Sep 2021 19:07:13 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/problema-s-parsingom-ssylok-na-stranicy.9722/</link>
      <guid>https://forum.sbfactory.ru/threads/problema-s-parsingom-ssylok-na-stranicy.9722/</guid>
      <author>invalid@example.com (denniseds)</author>
      <dc:creator>denniseds</dc:creator>
      <content:encoded><![CDATA[Приветствую.<br />
Сканер ссылок не получает ссылки на страницы каталога для дальнейшего сбора ссылок на страницы товаров.<br />
Ссылка на след. страницу каталога генерируется скриптом при клике на нее:<br />
<br />
&lt;a href=&quot;#&quot; aria-label=&quot;Page 4&quot; onclick=&quot;javascript:fetchDifferentPage(4)&quot;&gt;4&lt;/a&gt;<br />
<br />
Подскажите, как обойти эту проблему?]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Потоки сканера</title>
      <pubDate>Mon, 06 Sep 2021 17:17:15 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/potoki-skanera.9718/</link>
      <guid>https://forum.sbfactory.ru/threads/potoki-skanera.9718/</guid>
      <author>invalid@example.com (keps)</author>
      <dc:creator>keps</dc:creator>
      <content:encoded><![CDATA[Если, например, в сканере сайтов включено 10 потоков, то должно из списка очереди загружаться сразу 10 ссылок, но у меня они идут по одной с указанным интервалом в секундах. Так и должно быть?<br />
<br />
А вот сейчас вижу что потоки пошли... Только почему-то не сразу, а через некоторое время. Это может быть из-за использования впн?]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Как применяются фильтры ссылок?</title>
      <pubDate>Tue, 17 Aug 2021 09:51:50 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/kak-primenjajutsja-filtry-ssylok.9685/</link>
      <guid>https://forum.sbfactory.ru/threads/kak-primenjajutsja-filtry-ssylok.9685/</guid>
      <author>invalid@example.com (pablo)</author>
      <dc:creator>pablo</dc:creator>
      <content:encoded><![CDATA[Подскажите общий принцип работы с фильтрами (поиск-замена).<br />
Я начинаю парсить сайт, вижу, что в списке очереди появляются ссылки-дубли, типа таких<br />
<a href="http://site.ru/page.aspx" target="_blank" class="externalLink" rel="nofollow">http://site.ru/page.aspx</a><br />
<a href="http://site.ru/Login.aspx?Referrer=text1/text2/text3/page.aspx" target="_blank" class="externalLink" rel="nofollow">http://site.ru/Login.aspx?Referrer=text1/text2/text3/page.aspx</a><br />
<a href="http://site.ru/Login.aspx?Referrer=text1/text2/page.aspx" target="_blank" class="externalLink" rel="nofollow">http://site.ru/Login.aspx?Referrer=text1/text2/page.aspx</a><br />
<a href="http://site.ru/Login.aspx?Referrer=text1/page.aspx" target="_blank" class="externalLink" rel="nofollow">http://site.ru/Login.aspx?Referrer=text1/page.aspx</a><br />
<br />
Делаю фильтр, для удаления страницы <a href="http://site.ru/Login.aspx" target="_blank" class="externalLink" rel="nofollow">http://site.ru/Login.aspx</a> с любыми параметрами.<br />
Очередь...<br />
<br />
<a href="https://forum.sbfactory.ru/threads/kak-primenjajutsja-filtry-ssylok.9685/" class="internalLink">Как применяются фильтры ссылок?</a>]]></content:encoded>
      <slash:comments>3</slash:comments>
    </item>
    <item>
      <title>Как отключить удаление дублей в сканере сайтов</title>
      <pubDate>Tue, 13 Jul 2021 11:56:42 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/kak-otkljuchit-udalenie-dublej-v-skanere-sajtov.9632/</link>
      <guid>https://forum.sbfactory.ru/threads/kak-otkljuchit-udalenie-dublej-v-skanere-sajtov.9632/</guid>
      <author>invalid@example.com (webstep)</author>
      <dc:creator>webstep</dc:creator>
      <content:encoded><![CDATA[Всем привет.<br />
<br />
Есть продуктовый сайт. На странице продукта не указаны много фильтров. Решил пойти следующим образом: генерирую ссылку с включенным фильтром, затем собираю все товары с этого фильтра. И так прохожу по всех фильтрах и записываю значения фильтра в PARAM. Но вот незадача. сканер сайтов автоматически не добавляет в результат парсинга дубли. А мне как раз дубли нужны, так как один товар ( ссылка ) может иметь несколько PARAM <br />


	<a href="https://forum.sbfactory.ru/attachments/9932/" target="_blank">Посмотреть вложение 9932</a>]]></content:encoded>
      <slash:comments>11</slash:comments>
    </item>
    <item>
      <title>Как узнать количество спарсенных ссылок в сканере</title>
      <pubDate>Sun, 04 Apr 2021 00:43:43 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/kak-uznat-kolichestvo-sparsennyx-ssylok-v-skanere.9431/</link>
      <guid>https://forum.sbfactory.ru/threads/kak-uznat-kolichestvo-sparsennyx-ssylok-v-skanere.9431/</guid>
      <author>invalid@example.com (sotex2)</author>
      <dc:creator>sotex2</dc:creator>
      <content:encoded><![CDATA[Доброго времени суток.<br />
Делаю сбор ссылок в сканере сайтов, через wba, как узнать какое количество спарсено в реальном времени. При включеном wba, еще можно посмотреть, что сам процесс сбора идет, но нет информации сколько ссылок спарсено, а если отключить показ wba, то вообще неизвестно идет сбор или нет, в логах тоже не отображается процесс. Есть ли возможность узнать это?]]></content:encoded>
      <slash:comments>5</slash:comments>
    </item>
    <item>
      <title>Сканер не собирает ссылки</title>
      <pubDate>Sat, 09 Jan 2021 02:37:27 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/skaner-ne-sobiraet-ssylki.9227/</link>
      <guid>https://forum.sbfactory.ru/threads/skaner-ne-sobiraet-ssylki.9227/</guid>
      <author>invalid@example.com (webbb)</author>
      <dc:creator>webbb</dc:creator>
      <content:encoded><![CDATA[Пациент<br />
my-shop.ru/shop/catalogue/12988/sort/a/page/1.html<br />
<br />
Урлы внутренние.<br />
Функция поиска по ссылкам поставил<br />
 href=&quot;{get}&quot;<br />
<br />
Не находит нижние каталоги и товары.<br />
Проблема в сканере, не пойму в чём...]]></content:encoded>
      <slash:comments>1</slash:comments>
    </item>
    <item>
      <title>Не парсятся ссылки</title>
      <pubDate>Fri, 18 Dec 2020 10:30:15 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/ne-parsjatsja-ssylki.9182/</link>
      <guid>https://forum.sbfactory.ru/threads/ne-parsjatsja-ssylki.9182/</guid>
      <author>invalid@example.com (Jack_Sparrow)</author>
      <dc:creator>Jack_Sparrow</dc:creator>
      <content:encoded><![CDATA[Здравствуйте <br />
<br />
<a href="https://www.oboilux.ru/lepnina/" target="_blank" class="externalLink" rel="nofollow">https://www.oboilux.ru/lepnina/</a>]]></content:encoded>
      <slash:comments>3</slash:comments>
    </item>
    <item>
      <title>Не работает фильтрация в сканере ссылок</title>
      <pubDate>Sat, 12 Dec 2020 08:22:25 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/ne-rabotaet-filtracija-v-skanere-ssylok.9146/</link>
      <guid>https://forum.sbfactory.ru/threads/ne-rabotaet-filtracija-v-skanere-ssylok.9146/</guid>
      <author>invalid@example.com (Jamil)</author>
      <dc:creator>Jamil</dc:creator>
      <content:encoded><![CDATA[Коллеги, подскажите что делаю не так, вот видео <a href="https://yadi.sk/i/UewnEjbWvvKLdg" target="_blank" class="externalLink" rel="nofollow">https://yadi.sk/i/UewnEjbWvvKLdg</a>]]></content:encoded>
      <slash:comments>4</slash:comments>
    </item>
    <item>
      <title>Сканер не собирает ссылки с сайта с использованием прокси</title>
      <pubDate>Fri, 04 Dec 2020 11:14:44 +0000</pubDate>
      <link>https://forum.sbfactory.ru/threads/skaner-ne-sobiraet-ssylki-s-sajta-s-ispolzovaniem-proksi.8811/</link>
      <guid>https://forum.sbfactory.ru/threads/skaner-ne-sobiraet-ssylki-s-sajta-s-ispolzovaniem-proksi.8811/</guid>
      <author>invalid@example.com (sten30)</author>
      <dc:creator>sten30</dc:creator>
      <content:encoded><![CDATA[Не собирает ссылки Сканер сайтов в режиме MemSave с прокси<br />
Без MemSave все собирал<br />
Проект прилагаю]]></content:encoded>
      <slash:comments>4</slash:comments>
    </item>
  </channel>
</rss>
