Послано - 28 Фвр 2006 : 16:56:03
Скрипты для работы с произведениями СИ. -------------------------------------------- Все скрипты работают из командной строки. Нужен перл. У меня стоит версия 5.8.4, но будет работать и более ранняя (наверное).
Get_chaptersauthor_dir match Скачивает главы произведения со страницы автора http://zhurnal.lib.ru/первая буква в author_dir/author_dir/index.shtml, названия страниц которых совпадает с параметром match. В параметре могут использоваться регулярные выражения (regexprs). Примеры: get_chapters shumilowa_o_a pol скачает со странички solali произведение "Монеты в ладони" (pol1.shtml...pol27.shtml) - обратите внимание - во всех страничках есть слово pol - это и есть параметр match! get_chapters stoltidis_s_a nachaloputi скачает со странички Столтидиса С.А. произведение "Снова в пути".
make_txt сформирует из скачанных глав единый файл в формате txt, название файла является единственным параметром, главы должны быть в той же директории, что и make_txt. Тут имеется подводный камень: главы объединяются в том порядке, в каком они находятся в файлменеджере при включенной сортировке по именам (т.е. у solali после главы 1 идет глава 10!!! Поэтому главы с 1 по 9 нужно переименовать с 01 по 09).
Если же все главы на страничке автора (index.shtml! не indexdate.shtml!!!) находятся в необходимом порядке, можно пользоваться объединенным скриптом GET_COMPLETE. С его помощью можно скачивать НЕСКОЛЬКО произведений со странички автора, например get_complete nikolaj_c abstract silver winter скачают со странички Николая Чугунова все выложенные произведения (обе части Стажеров и фанфик на Громыко) и СФОРМИРУЕТ ИЗ НИХ 3 txt файла!
P.S. Также в скриптах закачки можно использовать не только директорию автора, но и страничку-"поддиректорию", например у fieryrat "Черный замок" находится в "поддиректории" (но это уже неактуально, т.к. она объединила свое произведение в 1 файл). -------------------------------------------- Скрипты выложу в следующих сообщениях в таком порядке: get_chapters, make_txt, get_complete
-------------- Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.
Послано - 28 Фвр 2006 : 17:21:52
К сожалению, ввиду частичной неработоспособности тега code на форуме, выложить скрипты так, чтобы они не побились, я не могу... :( Ждем исправления?
-------------- Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.
Послано - 02 Марта 2006 : 11:13:49
2 AVE - спасибо PS Perl у меня есть - я пользуюсь watznew для сбора новостей - а в ней как раз один из вариантов - обработка используя perl. (Только я прихо разбираюсь в деталях этого языка) Нельзя ли получить текст "Фильтр новостей СИ жанра фантастики/фэнтези" ?
Цитата:Нельзя ли получить текст "Фильтр новостей СИ жанра фантастики/фэнтези" ?
Можно, отчего же нет? Вот только такую базу, как у меня, вы будете набирать примерно столько же времени (это относится к разделению на Новинки и Обновления). Там еще нужен не включенный в стандартную поставку модуль DBM::Deep, но его можно взять с CPAN. Есть и облегченная версия, без базы и разделения. Вам какую?
Послано - 02 Марта 2006 : 15:52:57
Наверно, полную версию - по крайней мере, можно будет напустить программу на список произведений по фантастике и по фентези ( например http://zhurnal.lib.ru/janr/index_janr_time1-1.shtml )
Послано - 03 Марта 2006 : 10:21:10
К сожалению, на этот список ее "напустить" нельзя. Она предназначена для работы именно с новостями СИ (30 и 7 дней соответсвенно), и для этого списка не предназначена (внутреннее форматирование html не совпадает). Плюс еще и то, что выходной формат оптимизирован для постинга на форум Кубикуса (теги форума присутствуют в изобилии - ссылки, список и т.д.). Поэтому ее надо будет переделать под этот список. Сможете?
-------------- Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.
Послано - 03 Марта 2006 : 11:03:51
Попробовать можно - простенькие выражения на perl я писал (как упоминал для программы watznew). Я совсем не знаю библиотек перла , но если будет пример программы - смогу разобраться (надеюсь) PS Хотя у этого урла один минус - там нет времени обновления.
Цитата: Прошел 21 день. А теперь статистика с сайта rapidshare: Скрипты были скачаны 3 раза. Фильтр - 1 раз.
Никому не надо, похоже...
Надо всем. Но только у единиц есть Perl. И, например, для меня проще сделать самодельный фильтр на чем-нибудь другом. Понимаю, что через задницу получится, но ломы изучать Perl, скачивать, настраивать и разбираться...
Послано - 17 Янв 2008 : 17:56:44
В связи с поднявшимся интересом к скриптам - перевыложил. Курьер (обе формы, малая и большая) Необходимо установить DBM::Deep с CPAN