[Wget - насос для Интернета]
Wget 1.5.3. Руководство пользователя
VAP home logo

Обзор

GNU Wget - это свободно распространяемая утилита для выгрузки файлов из World Wide Web с использованием протоколов HTTP (протокол передачи гипертекста) и FTP (протокол передачи файлов), являющихся двумя наиболее широко используемыми в Интернете протоколами. Wget имеет много полезных возможностей способствующих облегчению процесса выгрузки, к которым относятся:

  • Wget не интерактивен, а это значит, что он может работать в фоне даже в то время, когда пользователь не находится в системе. Это позволяет вам запустить процесс выборки данных и отключится от системы, позволив Wget довершить остальное. В противоположность этому, большинство WWW броузеров требуют от пользователя постоянного присутствия, что представляет большие затруднения при перекачке значительных размеров данных.
  • Wget способен рекурсивно спускаться по структуре HTML документов и деревьям каталогов FTP, создавая локальную копию идентичную иерархии удаленного сервера. Эта возможность применима для создания зеркальных копий архивов и домашних страниц или для прочесывания вэб пространства в поисках данных подобно WWW роботу. В этом обличии Wget понимает соглашение "norobots".
  • При выгрузке данных через FTP доступны обработка имен файлов по шаблону и рекурсивное зеркалирование каталогов. Wget умеет считывать информацию о времени создания (модификации) файла, предоставляемую HTTP и FTP серверами, и сохранять ее локально. Поэтому Wget может может распознавать какие файлы изменились с момента последнего доступа и автоматически выполнять их выгрузку. Это делает Wget применимым для зеркалирования FTP сайтов и домашних страниц.
  • Wget исключительно хорошо работает на медленных или неустойчивых соединениях повторя попытки выгрузки документа до тех пор пока он не будет получен или не будет исчерпано, определяемое пользователем, максимальное количество попыток. В случаях разрыва соединения до момента полного получения файла, Wget будет пытаться продолжить передачу с момента обрыва, используя методы "REST" для FTP и "Range" для HTTP, если удаленный сервер их поддерживает.
  • Wget по умолчанию поддерживает использование прокси серверов, которые позволяют снизить загрузку сети, повысить скорость выборки данных и предоставляют доступ из-за брандмауэров. Однако, если вы находитесь за брандмауэром, то это может потребовать использования шлюза класса socks. С этой целью вам буден необходимо взять библиотеку поддержки socks и пересобрать с ней Wget. Кроме этого, Wget так же, как опцию, поддерживает FTP выгрузку в пассивном режиме.
  • Имеется встроенный механизм позволяющий осуществлять точную подстройку типов ссылок, которым Wget должен следовать.
  • Процесс выгрузки динамически отображается выводом точек, где каждая точка представляет фиксированный объем полученных данных (по умолчанию 1 Кбайт). Это представление может быть изменено по вашему предпочтению.
  • Большинство возможностей полностью настраиваемые либо через аргументы командной строки, либо через инициализационный файл ".wgetrc". Wget позволяет вам использовать глобальный конфигурационный файл (по умолчанию /usr/local/etc/wgetrc) для определения общих для всей системы установок.
  • И наконец, GNU Wget - свободно распространяемое программное обеспечение. Это значит, что каждый может использовать его, распространять и/или модифицировать в соответствии с лицензией "GNU General Public License" опубликованной "Free Software Foundation".



ФОБОС: погода в г.Тольятти