Загрузить весь веб сайт

Sergey___K
Уже с Приветом
Posts: 13014
Joined: 10 Jul 2001 09:01
Location: VA

Загрузить весь веб сайт

Post by Sergey___K »

Какие есть умные, удобные и "просто хорошие во всех отношениях" программы для закачки веб сайта целиком с целью его неспешного оффлайнового чтения?
Слiн
Уже с Приветом
Posts: 1407
Joined: 07 Jan 2003 19:51
Location: НорКа

Post by Слiн »

Teleport Pro
User avatar
JustMax
Уже с Приветом
Posts: 1476
Joined: 05 Dec 2000 10:01
Location: Vilnius -> Bonn

Post by JustMax »

wget :pain1:
blanko27
Уже с Приветом
Posts: 2264
Joined: 17 Jun 2003 04:41
Location: Just like US

Post by blanko27 »

Я раньше пользовался Offline Explorer, теперь - нет.
...а мы такой компанией, возьмем, да и припремся к Элис!
User avatar
Andrewsha
Новичок
Posts: 75
Joined: 24 Aug 2000 09:01
Location: Ufa->Moscow

Post by Andrewsha »

WebCopier
Sergey___K
Уже с Приветом
Posts: 13014
Joined: 10 Jul 2001 09:01
Location: VA

Post by Sergey___K »

Попробовал, все, кроме WebCopier. Хотел закачать lib.ru. Пока, что вышел большой облом. Этот сайт периодически "уходит в себя", сводя на нет все мои "нечеловеческие" усилия. У них есть ftp? Кто-нибудь занималься этим?
User avatar
A. Fig Lee
Уже с Приветом
Posts: 12072
Joined: 17 Nov 2002 03:41
Location: английская колония

Post by A. Fig Lee »

Sergey___K wrote:Попробовал, все, кроме WebCopier. Хотел закачать lib.ru. Пока, что вышел большой облом. Этот сайт периодически "уходит в себя", сводя на нет все мои "нечеловеческие" усилия. У них есть ftp? Кто-нибудь занималься этим?

Может, паук неправильный? Почитайте рекомендации к роботам.
Должны быть перерывы между запросами, а не качать весь сайт сразу.
Верить нельзя никому - даже себе. Мне - можно!
User avatar
katit
Уже с Приветом
Posts: 23804
Joined: 05 Jul 2003 22:34
Location: Брест -> St. Louis, MO

Post by katit »

Sergey___K wrote:Этот сайт периодически "уходит в себя"


Думаю т.к.они как раз и не хотят чтобы вы все скачивали. Как правило это напрасно потраченный трафик и вы все это не будете читать.
Sergey___K
Уже с Приветом
Posts: 13014
Joined: 10 Jul 2001 09:01
Location: VA

Post by Sergey___K »

Да они вроде особо не против. Я бы так не нахальничал.
http://www.lib.ru/WEBMASTER/LIB/faq.txt #6 или #7

И еще, как понять вот это
" Все файлы библиотеки лежат на anonymous ftp в
/pub/moshkow/.library/ в заархивированном виде" ?
(та часть, где про "заархивированном виде" мне понятна. :) )
User avatar
f_evgeny
Уже с Приветом
Posts: 10367
Joined: 12 Apr 2001 09:01
Location: Lithuania/UK

Post by f_evgeny »

Sergey___K wrote:Да они вроде особо не против. Я бы так не нахальничал.
http://www.lib.ru/WEBMASTER/LIB/faq.txt #6 или #7

И еще, как понять вот это
" Все файлы библиотеки лежат на anonymous ftp в
/pub/moshkow/.library/ в заархивированном виде" ?
(та часть, где про "заархивированном виде" мне понятна. :) )

Наверное так:

ftp://lib.ru/pub/moshkow/.library/
Дальше, все будет только хуже. Оптимист.
Sergey___K
Уже с Приветом
Posts: 13014
Joined: 10 Jul 2001 09:01
Location: VA

Post by Sergey___K »

О, блин, а я ftp.lib.ru ... пробовал.
Спасибо!
Sergey___K
Уже с Приветом
Posts: 13014
Joined: 10 Jul 2001 09:01
Location: VA

Post by Sergey___K »

Опять о вечном.

Скачал я файл на пробу, развернул архив в еще один файл и что мне дальше с ним делать?
Неужили мне придется вникать во все в это

Чтобы раскрутить все это безобразие - иметь Unix-машину в
любым httpd сервером и программами perl, gzip, glimpse,
лежащими в каталоге /usr/bin или /usr/local/bin
Патч для кирилизации glimpse лежит в
http://lib.ru/WEBMASTER/locale.c
(иметь отпатченный под KOI8 glimpse необязательно -
просто без него не будет работать search. )

Инсталляция библиотеки

1. Создать usera

moshkow UID=555 HOME=/home/moshkow

2. Вскрыть в его HOME архив

cd ~moshkow
cat li20040123.cgz | gunzip | cpio -idmv
cat li??????.r?? li??????.r??? | gunzip | cpio -idmv

все содержимое библиотеки должно упасть в каталог
~moshkow/public_html/
все тексты лежат в ~moshkow/public_html/book/
суммарный "тоннаж" (на январь 2004-го) примерно 4700 Mb

3. Встать в каталог, где у сервера лежат cgi-bin скрипты, и
закинуть в него CGI скрипт html-KOI


http://www.lib.ru/DOWNLOAD/mirroring.txt
Sergey___K
Уже с Приветом
Posts: 13014
Joined: 10 Jul 2001 09:01
Location: VA

Post by Sergey___K »

Пришлось разбираться. Блин, ну почему нельзя просто, взять и распаковать, нет, нужно сразу и cat и cpio и gzip ...

Return to “Вопросы и новости IT”