Перейти на главную страницу форума
Логин:
Пароль:
Запомнить  
Забыли пароль?
Регистрация »
 
Пользователям СИ, не любящим качать поглавно

Пользователям СИ, не любящим качать поглавно

   Версия для печати
 
Автор Предыдущая тема Темы Следующая тема  
AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 28 Фвр 2006 :  16:56:03  Показать инфо об авторе  Ответить с цитатой
Скрипты для работы с произведениями СИ.
--------------------------------------------
Все скрипты работают из командной строки. Нужен перл. У меня стоит
версия 5.8.4, но будет работать и более ранняя (наверное).

Get_chapters author_dir match
Скачивает главы произведения со страницы автора
http://zhurnal.lib.ru/первая буква в author_dir/author_dir/index.shtml,
названия страниц которых совпадает с параметром match. В
параметре могут использоваться регулярные выражения (regexprs).
Примеры:
get_chapters shumilowa_o_a pol
скачает со странички solali произведение "Монеты в ладони" (pol1.shtml...pol27.shtml) - обратите внимание - во всех страничках есть слово pol - это и есть параметр match!
get_chapters stoltidis_s_a nachaloputi
скачает со странички Столтидиса С.А. произведение "Снова в пути".

make_txt сформирует из скачанных глав единый файл в формате txt,
название файла является единственным параметром, главы должны быть в
той же директории, что и make_txt. Тут имеется подводный камень: главы
объединяются в том порядке, в каком они находятся в файлменеджере при
включенной сортировке по именам (т.е. у solali после главы 1 идет
глава 10!!! Поэтому главы с 1 по 9 нужно переименовать с 01 по 09).

Если же все главы на страничке автора (index.shtml! не
indexdate.shtml!!!) находятся в необходимом порядке, можно
пользоваться объединенным скриптом
GET_COMPLETE. С его помощью можно
скачивать НЕСКОЛЬКО произведений со странички автора, например
get_complete nikolaj_c abstract silver winter
скачают со странички Николая Чугунова все выложенные произведения (обе
части Стажеров и фанфик на Громыко) и СФОРМИРУЕТ ИЗ НИХ 3 txt файла!

P.S. Также в скриптах закачки можно использовать не только
директорию автора, но и страничку-"поддиректорию", например у fieryrat
"Черный замок" находится в "поддиректории" (но это уже неактуально,
т.к. она объединила свое произведение в 1 файл).
--------------------------------------------
Скрипты выложу в следующих сообщениях в таком порядке: get_chapters, make_txt, get_complete

--------------
Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.


Отредактировано - Andrew on 11 Apr 2006 18:34:11

Отредактировано - НикитА on 05 Apr 2007 17:48:30

AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 28 Фвр 2006 :  17:21:52  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
К сожалению, ввиду частичной неработоспособности тега code на форуме, выложить скрипты так, чтобы они не побились, я не могу... :(
Ждем исправления?

--------------
Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.

lapshinalex
Наблюдатель



6 сообщений
Послано - 01 Марта 2006 :  11:23:28  Посмотреть инфо об авторе Посмотреть читательский профиль  Получить ссылку на сообщение  Ответить с цитатой
Выложи на http://rapidshare.de

Отредактировано - lapshinalex on 01 Mar 2006 12:11:58

UGIN
Хранитель



520 сообщений
Послано - 01 Марта 2006 :  16:06:37  Посмотреть инфо об авторе Посмотреть читательский профиль  Получить ссылку на сообщение  Ответить с цитатой
Не знаю, не знаю..
Лично я предпочитаю вручную все собирать, хоть и лень-матушка намного позже меня родилась


AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 02 Марта 2006 :  08:35:31  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
Цитата:
Выложи на http://rapidshare.de

Без проблем...
Скрипты
Многих еще может отпугивать то, что для работы скриптов нужен язык Perl - а это еще 30Мб скачивать с интернета...

Отредактировано - AVE on 02 Mar 2006 08:38:14

lapshinalex
Наблюдатель



6 сообщений
Послано - 02 Марта 2006 :  11:13:49  Посмотреть инфо об авторе Посмотреть читательский профиль  Получить ссылку на сообщение  Ответить с цитатой
2 AVE - спасибо
PS Perl у меня есть - я пользуюсь watznew для сбора новостей - а в ней как раз один из вариантов - обработка используя perl.
(Только я прихо разбираюсь в деталях этого языка)
Нельзя ли получить текст "Фильтр новостей СИ жанра фантастики/фэнтези" ?

AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 02 Марта 2006 :  15:45:57  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
Цитата:
Нельзя ли получить текст "Фильтр новостей СИ жанра фантастики/фэнтези" ?

Можно, отчего же нет? Вот только такую базу, как у меня, вы будете набирать примерно столько же времени (это относится к разделению на Новинки и Обновления). Там еще нужен не включенный в стандартную поставку модуль DBM::Deep, но его можно взять с CPAN. Есть и облегченная версия, без базы и разделения.
Вам какую?

Отредактировано - AVE on 02 Mar 2006 15:47:34

lapshinalex
Наблюдатель



6 сообщений
Послано - 02 Марта 2006 :  15:52:57  Посмотреть инфо об авторе Посмотреть читательский профиль  Получить ссылку на сообщение  Ответить с цитатой
Наверно, полную версию - по крайней мере, можно будет напустить программу на список произведений по фантастике и по фентези ( например http://zhurnal.lib.ru/janr/index_janr_time1-1.shtml )
AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 03 Марта 2006 :  10:21:10  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
К сожалению, на этот список ее "напустить" нельзя. Она предназначена для работы именно с новостями СИ (30 и 7 дней соответсвенно), и для этого списка не предназначена (внутреннее форматирование html не совпадает). Плюс еще и то, что выходной формат оптимизирован для постинга на форум Кубикуса (теги форума присутствуют в изобилии - ссылки, список и т.д.).
Поэтому ее надо будет переделать под этот список. Сможете?

--------------
Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.

lapshinalex
Наблюдатель



6 сообщений
Послано - 03 Марта 2006 :  11:03:51  Посмотреть инфо об авторе Посмотреть читательский профиль  Получить ссылку на сообщение  Ответить с цитатой
Попробовать можно - простенькие выражения на perl я писал (как упоминал для программы watznew). Я совсем не знаю библиотек перла , но если будет пример программы - смогу разобраться (надеюсь)
PS Хотя у этого урла один минус - там нет времени обновления.

Отредактировано - Andrew on 11 Apr 2006 18:35:45

AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 03 Марта 2006 :  13:54:32  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
ОК, выложил.
Фильтр новостей СИ

--------------
Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.

AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 24 Марта 2006 :  11:09:52  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
Прошел 21 день.
А теперь статистика с сайта rapidshare:
Скрипты были скачаны 3 раза.
Фильтр - 1 раз.

Никому не надо, похоже...

Anton_Nikolaev
Хранитель


Russia
579 сообщений
Послано - 01 Апр 2006 :  21:08:29  Посмотреть инфо об авторе Посмотреть читательский профиль  Получить ссылку на сообщение  Ответить с цитатой
Цитата:

Прошел 21 день.
А теперь статистика с сайта rapidshare:
Скрипты были скачаны 3 раза.
Фильтр - 1 раз.

Никому не надо, похоже...



Надо всем. Но только у единиц есть Perl.
И, например, для меня проще сделать самодельный фильтр на чем-нибудь другом.
Понимаю, что через задницу получится, но ломы изучать Perl, скачивать, настраивать и разбираться...
AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 15 Янв 2007 :  09:05:18  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
Перевыложил скрипты:
Скрипты
Фильтр новостей СИ

--------------
Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.

AVE
Хранитель года - 2008


Russia
8720 сообщений
Послано - 17 Янв 2008 :  17:56:44  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
В связи с поднявшимся интересом к скриптам - перевыложил.
Курьер (обе формы, малая и большая)
Необходимо установить DBM::Deep с CPAN

IrWert
Магистр



145 сообщений
Послано - 06 Июля 2008 :  11:59:26  Посмотреть инфо об авторе  Получить ссылку на сообщение  Ответить с цитатой
Эх, сохранял бы скрипт из первого поста в FB2...

   
Перейти к:

Ответить на тему "Пользователям СИ, не любящим качать поглавно"

Экран:   
Логин:  
Пароль:  
Авторизовать на форуме:  
Форматирование:   Жирный Курсив Подчеркнуть Зачеркнуть Вставить кавычки Выравнивание по левому краю Центрировать Выравнивание по правому краю Горизонтальная линия Вставить ссылку Вставить E-mail Вставить картинку Вставить цитату Спойлер Вставить список
   
Сообщение:  
* HTML разрешен
* Внутренний язык включен


радость [:)]
радость!!! [:D]
стыд [:I]
язык [:P]
злость [}:)]
подмигивание [;)]
шутка [:o)]
черный глаз [B)]
грусть [:(]
скромность [8)]
шок [:O]
гнев [:(!]
смерть [xx(]
поцелуй [:X]
одобрение [^]
несогласие [V]

  Отметьте для добавления собственной подписи из вашего профайла.
Отметьте для получения ответов по e-mail.
     

Последние 10 сообщений | Активные форумы | Тематические разделы | Хранители | Инквизиторы | Поиск | Вопросы и ответы
© Wilmark Design Пользовательское соглашение
Политика конфиденциальности
Snitz Forums 2001
Русификация: Wilmark Design