Все об Ubuntu
Все об Ubuntu
Наверх

Меню сайта


sam-linux.ucoz.net

Ubuntu 16.04 LTS
 

  
Форма входа


Категории раздела
Ubuntu [3]
Программы для Ubuntu [18]
Командная строка Linux [13]


Поиск


Календарь


Help Ubuntu
help.ubuntu.ru



The Internet Defense
                 League

Member of The Internet Defense League


Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0

      
Приветствую Вас, Гость · RSS 24-Ноября-2024, 07:15
Главная » Статьи » Командная строка Linux

Скачиваем сайты целиком
Скачиваем сайты целиком - утилита wget

Скачиваем сайты целиком - утилита wget
wget — это утилита, которая предназначена для загрузки файлов по сети (из интернета). Я расскажу, как использовать wget, чтобы скачивать сайты из интернета целиком и затем просматривать их в автономном режиме.

С помощью wget можно скачивать сайты, включая картинки, всего лишь указав адрес сайта и определенные параметры. wget будет автоматически переходить по ссылкам на сайте и скачивать страницу за страницей.

Чтобы скачать сайт целиком с помощью wget нужно выполнить команду в терминале:

wget -r -k -l 7 -p -E -nc http://site.com/

После выполнения данной команды в директорию site.com будет загружена локальная копия сайта http://site.com. Чтобы открыть главную страницу сайта нужно открыть файл index.html.

Рассмотрим используемые параметры:
-r    —    указывает на то, что нужно рекурсивно переходить по ссылкам на сайте, чтобы скачивать страницы.
-k    —    используется для того, чтобы wget преобразовал все ссылки в скаченных файлах таким образом, чтобы по ним можно было переходить на локальном компьютере (в автономном режиме).
-p    —    указывает на то, что нужно загрузить все файлы, которые требуются для отображения страниц (изображения, css и т.д.).
-l    —    определяет максимальную глубину вложенности страниц, которые wget должен скачать (по умолчанию значение равно 5, в примере я установил 7). В большинстве случаев сайты имеют страницы с большой степенью вложенности и wget может просто «закопаться», скачивая новые страницы. Чтобы этого не произошло можно использовать параметр -l.
-E    —    добавлять к загруженным файлам расширение .html.
-nc    —    при использовании данного параметра существующие файлы не будут перезаписаны. Это удобно, когда нужно продолжить загрузку сайта, прерванную в предыдущий раз.

Это лишь одно из возможных применений утилиты wget. На самом деле область применения wget значительно шире и wget обладает большим числом дополнительных параметров. За более подробной информацией обращайтесь к руководству, выполнив в командной строке: man wget.
Категория: Командная строка Linux | Добавил: sam (09-Мая-2012)
Просмотров: 5163 | Рейтинг: 5.0/3
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]