Comment installer et utiliser wget sur Mac

Un bouton de téléchargement.

Il existe de nombreuses façons de télécharger des ressources depuis le web. En plus de votre navigateur, vous pouvez également utiliser un outil comme wget pour télécharger des ressources du Web tout en faisant autre chose. Dans cet article, nous vous montrons comment télécharger et utiliser wget sur Mac.

Lisez aussi : Comment utiliser Wget pour télécharger des sites Web sur votre PC

Qu’est-ce que wget (et à quoi ça sert) ?

Pour ceux qui ne le savent pas, wget est un utilitaire en ligne de commande non interactif et open-source qui vous aide à télécharger des ressources depuis une URL spécifiée. Étant donné qu’il est non interactif, wget peut fonctionner en arrière-plan ou même avant que vous ne vous connectiez.

C’est un projet de l’équipe GNU, et c’est génial si vous avez une mauvaise connexion Internet. Cela signifie qu’il est robuste dans des conditions autrement non optimales.

Une fois que vous avez installé wget, vous exécuterez des commandes et spécifierez une destination pour vos fichiers. Nous vous montrons comment faire cela ci-dessous.

Comment installer wget sur Mac

Avant d’installer wget, vous avez besoin d’un gestionnaire de paquets. Bien que wget ne soit pas livré avec macOS, vous pouvez le télécharger et l’installer en utilisant Homebrew – le meilleur gestionnaire de paquets Mac disponible.

1. Télécharger et installer Homebrew

Pour installer Homebrew, ouvrez d’abord une fenêtre de Terminal et exécutez la commande suivante :

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

Cela utilise la commande curl pour télécharger des fichiers qui sont livrés avec l’installation Ruby pré-installée sur macOS.

Lisez aussi : Comment utiliser cURL pour le transfert de données en ligne de commande et plus

Une fois que vous appuyez sur Entrée pour exécuter la commande, l’installateur vous donnera des détails explicites sur ce qui va se passer.

Installation de Homebrew.

Après avoir confirmé, l’installateur s’exécutera.

2. Installer wget depuis la ligne de commande

Ensuite, nous voulons utiliser Homebrew pour installer wget. Depuis le Terminal à nouveau, exécutez :

brew install wget

Installation de wget.

L’installateur vous donnera des mises à jour de progression en direct, et il y a peu de choses que vous devez faire ici. Le processus est simple et automatisé. Cependant, si vous avez déjà Homebrew installé, assurez-vous d’exécuter brew update pour obtenir les dernières copies de toutes vos formules.

Une fois que vous voyez un nouvel invite dans votre Terminal, vous êtes prêt à utiliser wget sur Mac pour télécharger des ressources.

Lisez aussi : Comment exécuter un script Python sur Mac

Comment utiliser wget pour télécharger des ressources Web

Pour télécharger une ressource distante depuis une URL en utilisant wget, vous voudrez utiliser la structure suivante :

wget -O path/to/local.copy http://example.com/url/to/download.html

Cela enregistrera le fichier spécifié dans l’URL à l’emplacement spécifié sur votre machine.

Utilisation de wget pour télécharger un fichier.

Si vous excluez le “flag” -O, votre emplacement de téléchargement sera le répertoire de travail actuel.

Téléchargement d'un fichier dans le répertoire de travail actuel.

Par exemple, nous voulons télécharger une page Web dans le dossier Téléchargements :

wget -O /Users/[votre-nom-utilisateur]/Downloads/status.html https://www.w3.org/Status.html

Cependant, pour faire la même chose sans le flag -O, nous devrions changer de répertoire (cd downloads) avant d’exécuter wget :

wget /Users/[votre-nom-utilisateur]/Downloads/status.html https://www.w3.org/Status.html

Vous obtiendrez tous les détails sur la progression du téléchargement, bien que, étant donné la rapidité de wget, ces informations ressemblent plus à un résumé du téléchargement qu’à des mises à jour en temps réel.

Comment télécharger un répertoire récursif

Pour télécharger un arbre de répertoire entier avec wget, vous devez utiliser les flags -r / --recursive et -np / --no-parent :

wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/

Cela fera en sorte que wget suive tous les liens trouvés dans les documents du répertoire spécifié. À partir de là, il effectuera un téléchargement récursif de l’ensemble du chemin URL spécifié.

Notez également la commande -e robots=off. Cela ignore les restrictions dans le fichier robots.txt. En général, il est bon de désactiver robots.txt pour éviter des téléchargements abrégés.

Utilisation de flags supplémentaires avec wget

Vous constaterez que wget est un outil flexible, car il utilise un certain nombre d’autres flags supplémentaires. C’est génial si vous avez des exigences spécifiques pour votre téléchargement.

Jetons un coup d’œil à deux domaines dans notre focus sur le contrôle du processus de téléchargement et la création de journaux.

Contrôler comment wget téléchargera des ressources

Il existe de nombreux flags pour vous aider à configurer le processus de téléchargement. Voici juste quelques-uns des plus utiles :

  • wget -X /absolute/path/to/directory exclura un répertoire spécifique sur le serveur distant.
  • wget -nH supprime les répertoires “hostname”. En d’autres termes, il ignore le nom de domaine principal. Par exemple, wget ignorerait le dossier www.w3.org dans l’exemple précédent et commencerait par le répertoire History à la place.
  • wget --cut-dirs=# ignore le nombre spécifié de répertoires dans l’URL avant de commencer à télécharger des fichiers. Par exemple, -nH --cut-dirs=1 changerait le chemin spécifié de “ftp.xemacs.org/pub/xemacs/“ en simplement “/xemacs/“ et réduirait le nombre de répertoires parents vides dans le téléchargement local.
  • wget -R index.html / wget --reject index.html ignorera tous les fichiers correspondant au nom de fichier spécifié. Dans ce cas, cela exclura tous les fichiers index. L’astérisque () est un caractère générique, comme “.png”. Cela ignorerait tous les fichiers avec l’extension PNG.
  • wget -i file spécifie les URL cibles à partir d’un fichier d’entrée. Ce fichier d’entrée doit être au format HTML, ou vous devrez utiliser le flag --force-html pour analyser le HTML.
  • wget -nc / wget --no-clobber ne remplacera pas les fichiers qui existent déjà à la destination.
  • wget -c / wget --continue continuera les téléchargements de fichiers partiellement téléchargés.
  • wget -t 10 essaiera de télécharger la ressource jusqu’à 10 fois avant d’échouer.

wget peut faire plus que contrôler le processus de téléchargement, car vous pouvez également créer des journaux pour référence future.

Ajuster le niveau de journalisation

Vous pouvez également envisager les flags suivants comme un moyen partiel de contrôler la sortie que vous recevez lors de l’utilisation de wget.

  • wget -d active la sortie de débogage.
  • wget -o path/to/log.txt active la sortie de journalisation vers le répertoire spécifié au lieu d’afficher le journal dans la sortie standard.
  • wget -q désactive toute sortie de wget, y compris les messages d’erreur.
  • wget -v active explicitement la sortie par défaut de wget en mode verbeux.
  • wget --no-verbose désactive les messages de journal mais affiche les messages d’erreur.

Vous voudrez souvent savoir ce qui se passe pendant un téléchargement, donc vous n’utiliserez peut-être pas ces flags autant que d’autres. Cependant, si vous avez un grand lot de téléchargements et que vous voulez vous assurer que vous pouvez résoudre tout problème, avoir un journal ou un manque de sortie est une approche valide.

Lisez aussi : Comment ajouter et supprimer des Kexts de macOS

Conclusion

Bien que vous puissiez utiliser votre navigateur ou un autre GUI pour télécharger des pages Web et d’autres ressources, vous pouvez gagner du temps avec la ligne de commande. Un outil tel que wget est puissant – plus que votre navigateur – et est rapide aussi. Pour une description complète des capacités de wget, vous pouvez consulter la page de manuel GNU de wget.

Si vous constatez que wget ne fonctionne pas pour vous, il est peut-être temps de diagnostiquer un problème avec votre connexion Wi-Fi. Allez-vous utiliser wget sur Mac pour télécharger des ressources Web ? Partagez vos réflexions dans la section des commentaires ci-dessous !