Послано - 18 Дек 2011 : 15:30:23
Доброго времени суток уважаемые. Иногда на авторы выкладывают свои произведения на форумах, типа http://forum.amahrov.ru Читать с форума не слишком удобно. Возникает вопрос существует ли более-менее универсальный инструмент изъятия контента с форума в единый HTML? Я понимаю, что проблему можно решить одним небольшим скриптом, используя регулярные выражения или парой UNIX команд. Но изобретать велосипед не охота. Возможно кто-то из Вас уже пользуется чем-то для этих целей. Подскажите варианты.
Послано - 18 Дек 2011 : 18:21:30
Что хочется получить на выходе? Если просто скачать html страничку на диск, берёшь wget или curl и скачиваешь, сборки для win существуют. Если собрать из разбросанных по темам и сообщениям огрызков целую книгу - я универсального решения не видел. С точки зрения простого пользователя, не желающего учить какой-нибудь скриптовый язык и XML\XSLT, возможно проще будет натренировать IMacros на копипаст определённого форума.
Послано - 18 Дек 2011 : 20:53:26
На выходе хотелось бы единую html страничку собранную из значимых постов автора с определенной ветки форума. Я вижу это так: скрипт скачивает целиком ветку форума, далее из набора получившихся файлов грабит посты автора по условию. Например текст между
...>Автор:span>a href="http://...../profile.php?id=...">Автор В.Я./a> div id="p8...-content" class="post-content"> p>.....' p>..... /div>
Я знаю как это сделать, но не охота возиться. :) Поэтому и спрашиваю про готовые решения.