Проверь кодировку полученного файла после перевода, должна быть utf-8, если с кодировкой все нормально, то уменьш размер файла.
А как на счет границ парсинга? У всех урлов один и тот же движок? С границами может быть косяк.
Это архив сайтов http://www.archive.org/web/web.php или http://web.archive.org/web/*/где надо указать желаемый сайт для скачивания, есть скрипты...
Выложите проект, посмотрю что не так.
Запустил ваш проект спарсилось 320 файлов. Видно у вас проблема в соединении интернет.
Где ж вы там статьи нашли, сплошное НЮ.
Картинки не подхватил, ссылки из статей не удалил. Проект во вложении.
Имена участников (разделяйте запятой).