Como Instalar e Usar wget no Mac

Um botão de download.

Existem várias maneiras de baixar recursos da web. Além do seu navegador, você também pode usar uma ferramenta como wget para baixar recursos da Web enquanto faz outra coisa. Neste artigo, mostramos como baixar e usar wget no Mac.

Leia também: Como Usar Wget para Baixar Websites para o Seu PC

O que é wget (E Para Que É Usado)?

Para quem não sabe, wget é uma ferramenta de linha de comando não interativa de código aberto para ajudar você a baixar recursos de uma URL especificada. Como é não interativa, wget pode funcionar em segundo plano ou antes mesmo de você fazer login.

É um projeto da equipe GNU e é ótimo se você tem uma conexão de Internet ruim. Isso significa que é robusto em condições não ideais.

Uma vez que você instala wget, você executará comandos e especificará um destino para seus arquivos. Mostramos como fazer isso a seguir.

Como Instalar wget no Mac

Antes de instalar wget, você precisa de um gerenciador de pacotes. Embora wget não venha com o macOS, você pode baixá-lo e instalá-lo usando o Homebrew – o melhor gerenciador de pacotes para Mac disponível.

1. Baixar e Instalar o Homebrew

Para instalar o Homebrew, primeiro abra uma janela do Terminal e execute o seguinte comando:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

Isso usa o comando curl para baixar arquivos que vêm com a instalação pré-instalada do Ruby no macOS.

Leia também: Como Usar cURL para Transferência de Dados na Linha de Comando e Mais

Uma vez que você pressione Enter para executar o comando, o instalador lhe dará detalhes explícitos sobre o que acontecerá.

Instalando o Homebrew.

Depois de confirmar, o instalador será executado.

2. Instalar wget a Partir da Linha de Comando

Em seguida, queremos usar o Homebrew para instalar wget. Novamente no Terminal, execute:

brew install wget

Instalando wget.

O instalador lhe dará atualizações de progresso ao vivo, e há pouco que você precisa fazer aqui. O processo é simples e automatizado. No entanto, se você já tiver o Homebrew instalado, certifique-se de executar brew update para obter as cópias mais recentes de todas as suas fórmulas.

Uma vez que você veja um novo prompt dentro do seu Terminal, você está pronto para usar wget no Mac para baixar recursos.

Leia também: Como Executar um Script Python no Mac

Como Usar wget para Baixar Recursos da Web

Para baixar um recurso remoto de uma URL usando wget, você vai querer usar a seguinte estrutura:

wget -O caminho/para/local.copia http://example.com/url/para/download.html

Isso salvará o arquivo especificado na URL para o local especificado em sua máquina.

Usando wget para baixar um arquivo.

Se você excluir a “flag” -O, seu local de download será o diretório de trabalho atual.

Baixando um arquivo para o diretório de trabalho atual.

Por exemplo, queremos baixar uma página da web para a pasta Downloads:

wget -O /Users/[seu-nome-de-usuário]/Downloads/status.html https://www.w3.org/Status.html

Embora, para fazer o mesmo sem a flag -O, precisaríamos mudar o diretório ( cd downloads) antes de executarmos wget:

wget /Users/[seu-nome-de-usuário]/Downloads/status.html https://www.w3.org/Status.html

Você receberá todos os detalhes sobre o progresso do download, embora, com a rapidez do wget, essa informação seja mais um resumo do download do que atualizações em tempo real.

Como Baixar um Diretório Recursivo

Para baixar uma árvore de diretórios inteira com wget, você precisa usar as flags -r / --recursive e -np / --no-parent:

wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/

Isso fará com que wget siga quaisquer links encontrados nos documentos dentro do diretório especificado. A partir daí, ele realizará um download recursivo de todo o caminho da URL especificado.

Além disso, note o comando -e robots=off. Isso ignora restrições no arquivo robots.txt. Em geral, é uma boa ideia desativar o robots.txt para evitar downloads abreviados.

Usando Flags Adicionais com wget

Você descobrirá que wget é uma ferramenta flexível, pois usa várias outras flags adicionais. Isso é ótimo se você tiver requisitos específicos para seu download.

Vamos dar uma olhada em duas áreas em nosso foco no controle do processo de download e na criação de logs.

Controlar Como wget Baixará Recursos

Existem muitas flags para ajudá-lo a configurar o processo de download. Aqui estão apenas algumas das mais úteis:

  • wget -X /caminho/absoluto/para/diretório excluirá um diretório específico no servidor remoto.
  • wget -nH remove os diretórios de “hostname”. Em outras palavras, ele ignora o nome de domínio principal. Por exemplo, wget pularia a pasta www.w3.org no exemplo anterior e começaria com o diretório History em vez disso.
  • wget --cut-dirs=# pula o número especificado de diretórios na URL antes de começar a baixar arquivos. Por exemplo, -nH --cut-dirs=1 mudaria o caminho especificado de “ftp.xemacs.org/pub/xemacs/“ para simplesmente “/xemacs/“ e reduziria o número de diretórios pai vazios no download local.
  • wget -R index.html / wget --reject index.html pulará quaisquer arquivos que correspondam ao nome de arquivo especificado. Neste caso, ele excluirá todos os arquivos index. O asterisco () é um curinga, como “.png”. Isso pularia todos os arquivos com a extensão PNG.
  • wget -i arquivo especifica URLs de destino a partir de um arquivo de entrada. Este arquivo de entrada deve estar no formato HTML, ou você precisará usar a flag --force-html para analisar o HTML.
  • wget -nc / wget --no-clobber não sobrescreverá arquivos que já existem no destino.
  • wget -c / wget --continue continuará downloads de arquivos parcialmente baixados.
  • wget -t 10 tentará baixar o recurso até 10 vezes antes de falhar.

wget pode fazer mais do que controlar o processo de download, pois você também pode criar logs para referência futura.

Ajustar o Nível de Registro

Você também pode considerar as seguintes flags como uma forma parcial de controlar a saída que você recebe ao usar wget.

  • wget -d habilita a saída de depuração.
  • wget -o caminho/para/log.txt habilita a saída de registro para o diretório especificado em vez de exibir o log na saída padrão.
  • wget -q desativa toda a saída do wget, incluindo mensagens de erro.
  • wget -v habilita explicitamente a saída detalhada padrão do wget.
  • wget --no-verbose desativa mensagens de log, mas exibe mensagens de erro.

Você geralmente gostaria de saber o que está acontecendo durante um download, então pode não usar essas flags tanto quanto outras. Ainda assim, se você tiver um grande lote de downloads e quiser ter certeza de que pode corrigir quaisquer problemas, ter um log ou a falta de saída é uma abordagem válida.

Leia também: Como Adicionar e Remover Kexts do macOS

Conclusão

Embora você possa usar seu navegador ou outra GUI para baixar páginas da web e outros recursos, você pode economizar tempo com a linha de comando. Uma ferramenta como wget é poderosa – mais do que seu navegador – e também é rápida. Para uma descrição completa das capacidades do wget, você pode revisar a página de manual do GNU do wget.

Se você descobrir que wget não está funcionando para você, pode ser hora de diagnosticar um problema com sua conexão Wi-Fi. Você usará wget no Mac para baixar recursos da web? Compartilhe suas opiniões na seção de comentários abaixo!