Comment installer et utiliser wget sur Mac

Il existe de nombreuses façons de télécharger des ressources depuis le web. En plus de votre navigateur, vous pouvez également utiliser un outil comme wget pour télécharger des ressources du Web tout en faisant autre chose. Dans cet article, nous vous montrons comment télécharger et utiliser wget sur Mac.
Lisez aussi : Comment utiliser Wget pour télécharger des sites Web sur votre PC
Qu’est-ce que wget (et à quoi ça sert) ?
Pour ceux qui ne le savent pas, wget est un utilitaire en ligne de commande non interactif et open-source qui vous aide à télécharger des ressources depuis une URL spécifiée. Étant donné qu’il est non interactif, wget peut fonctionner en arrière-plan ou même avant que vous ne vous connectiez.
C’est un projet de l’équipe GNU, et c’est génial si vous avez une mauvaise connexion Internet. Cela signifie qu’il est robuste dans des conditions autrement non optimales.
Une fois que vous avez installé wget, vous exécuterez des commandes et spécifierez une destination pour vos fichiers. Nous vous montrons comment faire cela ci-dessous.
Comment installer wget sur Mac
Avant d’installer wget, vous avez besoin d’un gestionnaire de paquets. Bien que wget ne soit pas livré avec macOS, vous pouvez le télécharger et l’installer en utilisant Homebrew – le meilleur gestionnaire de paquets Mac disponible.
1. Télécharger et installer Homebrew
Pour installer Homebrew, ouvrez d’abord une fenêtre de Terminal et exécutez la commande suivante :
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"Cela utilise la commande curl pour télécharger des fichiers qui sont livrés avec l’installation Ruby pré-installée sur macOS.
Lisez aussi : Comment utiliser cURL pour le transfert de données en ligne de commande et plus
Une fois que vous appuyez sur Entrée pour exécuter la commande, l’installateur vous donnera des détails explicites sur ce qui va se passer.

Après avoir confirmé, l’installateur s’exécutera.
2. Installer wget depuis la ligne de commande
Ensuite, nous voulons utiliser Homebrew pour installer wget. Depuis le Terminal à nouveau, exécutez :
brew install wget
L’installateur vous donnera des mises à jour de progression en direct, et il y a peu de choses que vous devez faire ici. Le processus est simple et automatisé. Cependant, si vous avez déjà Homebrew installé, assurez-vous d’exécuter brew update pour obtenir les dernières copies de toutes vos formules.
Une fois que vous voyez un nouvel invite dans votre Terminal, vous êtes prêt à utiliser wget sur Mac pour télécharger des ressources.
Lisez aussi : Comment exécuter un script Python sur Mac
Comment utiliser wget pour télécharger des ressources Web
Pour télécharger une ressource distante depuis une URL en utilisant wget, vous voudrez utiliser la structure suivante :
wget -O path/to/local.copy http://example.com/url/to/download.htmlCela enregistrera le fichier spécifié dans l’URL à l’emplacement spécifié sur votre machine.

Si vous excluez le “flag” -O, votre emplacement de téléchargement sera le répertoire de travail actuel.

Par exemple, nous voulons télécharger une page Web dans le dossier Téléchargements :
wget -O /Users/[votre-nom-utilisateur]/Downloads/status.html https://www.w3.org/Status.htmlCependant, pour faire la même chose sans le flag -O, nous devrions changer de répertoire (cd downloads) avant d’exécuter wget :
wget /Users/[votre-nom-utilisateur]/Downloads/status.html https://www.w3.org/Status.htmlVous obtiendrez tous les détails sur la progression du téléchargement, bien que, étant donné la rapidité de wget, ces informations ressemblent plus à un résumé du téléchargement qu’à des mises à jour en temps réel.
Comment télécharger un répertoire récursif
Pour télécharger un arbre de répertoire entier avec wget, vous devez utiliser les flags -r / --recursive et -np / --no-parent :
wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/Cela fera en sorte que wget suive tous les liens trouvés dans les documents du répertoire spécifié. À partir de là, il effectuera un téléchargement récursif de l’ensemble du chemin URL spécifié.
Notez également la commande -e robots=off. Cela ignore les restrictions dans le fichier robots.txt. En général, il est bon de désactiver robots.txt pour éviter des téléchargements abrégés.
Utilisation de flags supplémentaires avec wget
Vous constaterez que wget est un outil flexible, car il utilise un certain nombre d’autres flags supplémentaires. C’est génial si vous avez des exigences spécifiques pour votre téléchargement.
Jetons un coup d’œil à deux domaines dans notre focus sur le contrôle du processus de téléchargement et la création de journaux.
Contrôler comment wget téléchargera des ressources
Il existe de nombreux flags pour vous aider à configurer le processus de téléchargement. Voici juste quelques-uns des plus utiles :
wget -X /absolute/path/to/directoryexclura un répertoire spécifique sur le serveur distant.wget -nHsupprime les répertoires “hostname”. En d’autres termes, il ignore le nom de domaine principal. Par exemple, wget ignorerait le dossierwww.w3.orgdans l’exemple précédent et commencerait par le répertoireHistoryà la place.wget --cut-dirs=#ignore le nombre spécifié de répertoires dans l’URL avant de commencer à télécharger des fichiers. Par exemple,-nH --cut-dirs=1changerait le chemin spécifié de “ftp.xemacs.org/pub/xemacs/“ en simplement “/xemacs/“ et réduirait le nombre de répertoires parents vides dans le téléchargement local.wget -R index.html/wget --reject index.htmlignorera tous les fichiers correspondant au nom de fichier spécifié. Dans ce cas, cela exclura tous les fichiers index. L’astérisque () est un caractère générique, comme “.png”. Cela ignorerait tous les fichiers avec l’extension PNG.wget -i filespécifie les URL cibles à partir d’un fichier d’entrée. Ce fichier d’entrée doit être au format HTML, ou vous devrez utiliser le flag--force-htmlpour analyser le HTML.wget -nc/wget --no-clobberne remplacera pas les fichiers qui existent déjà à la destination.wget -c/wget --continuecontinuera les téléchargements de fichiers partiellement téléchargés.wget -t 10essaiera de télécharger la ressource jusqu’à 10 fois avant d’échouer.
wget peut faire plus que contrôler le processus de téléchargement, car vous pouvez également créer des journaux pour référence future.
Ajuster le niveau de journalisation
Vous pouvez également envisager les flags suivants comme un moyen partiel de contrôler la sortie que vous recevez lors de l’utilisation de wget.
wget -dactive la sortie de débogage.wget -o path/to/log.txtactive la sortie de journalisation vers le répertoire spécifié au lieu d’afficher le journal dans la sortie standard.wget -qdésactive toute sortie de wget, y compris les messages d’erreur.wget -vactive explicitement la sortie par défaut de wget en mode verbeux.wget --no-verbosedésactive les messages de journal mais affiche les messages d’erreur.
Vous voudrez souvent savoir ce qui se passe pendant un téléchargement, donc vous n’utiliserez peut-être pas ces flags autant que d’autres. Cependant, si vous avez un grand lot de téléchargements et que vous voulez vous assurer que vous pouvez résoudre tout problème, avoir un journal ou un manque de sortie est une approche valide.
Lisez aussi : Comment ajouter et supprimer des Kexts de macOS
Conclusion
Bien que vous puissiez utiliser votre navigateur ou un autre GUI pour télécharger des pages Web et d’autres ressources, vous pouvez gagner du temps avec la ligne de commande. Un outil tel que wget est puissant – plus que votre navigateur – et est rapide aussi. Pour une description complète des capacités de wget, vous pouvez consulter la page de manuel GNU de wget.
Si vous constatez que wget ne fonctionne pas pour vous, il est peut-être temps de diagnostiquer un problème avec votre connexion Wi-Fi. Allez-vous utiliser wget sur Mac pour télécharger des ressources Web ? Partagez vos réflexions dans la section des commentaires ci-dessous !