htm2txt мне не нравиться, тем что он удаляет переносы, маркировки списков, заголовки и т.д. Лучше тогда получается автозаменой удалять DIV и мусор...
nikolas1612, спасибо помогло. А как удалить вот такой мусор " " и аналогичный, а также всякие DIV'ы? Только поиском и заменой или еще как то...
Парсишь текст, но проблема в том, что там есть внутренние и внешние ссылки. Я бы хотел их удалить. Можно конечно использовать html->test тогда...
nikolas1612 спасибо большое. Понял. Сделал вчера скрин и забыл его разместить. Исключения вылазиют:...
И еще вопрос, если я собираю картинки Соответственно по полям "<td class="first">" и "</td>", то я получаю ссылки на две картинки. А я хочу...
В границе по парсингу фоток, я указал фотки с папки, т.е. границу для начала парсинга сразу обозначил <img src="/i/items/ Чтобы отсечь не...
При парсинге сайта, там есть ссылки через переход по внешней ссылке. Как можно в автомате расшифровать эти ссылки? Ссылка типа:...
Прии выводе в CSV он все в один столбец, макрос вывода <CD_CYCLE_GRAN_ALL!>
Есть сайт, на котором по пять продуктов на одной строке представлены, но как с них парсить не могу разобраться. Как я понял можно с помощью...
Имена участников (разделяйте запятой).