Macにwgetをインストールして使用する方法

ダウンロードボタン.

ウェブからリソースをダウンロードする方法はたくさんあります。ブラウザの他に、wgetのようなツールを使用して、他の作業をしながらウェブからリソースをダウンロードすることもできます。この記事では、Macにwgetをダウンロードして使用する方法を説明します。

関連記事: PCにウェブサイトをダウンロードするためのwgetの使い方

wgetとは(およびその用途)

知らない方のために、wgetは指定されたURLからリソースをダウンロードするためのオープンソースの非対話型コマンドラインユーティリティです。非対話型であるため、wgetはバックグラウンドで動作したり、ログインする前に動作したりできます。

これはGNUチームのプロジェクトであり、インターネット接続が不安定な場合に最適です。つまり、最適でない条件でも堅牢です。

wgetをインストールすると、コマンドを実行し、ファイルの保存先を指定します。次に、その方法を説明します。

Macにwgetをインストールする方法

wgetをインストールする前に、パッケージマネージャが必要です。wgetはmacOSに付属していませんが、Homebrewを使用してダウンロードしてインストールできます。Homebrewは、利用可能な最良のMacパッケージマネージャです。

1. Homebrewをダウンロードしてインストールする

Homebrewをインストールするには、まずターミナルウィンドウを開き、次のコマンドを実行します:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

これは、macOSにプリインストールされているRubyインストール内のファイルをダウンロードするためにcurlコマンドを使用します。

関連記事: コマンドラインデータ転送やその他のためのcURLの使い方

コマンドを実行するためにEnterを押すと、インストーラーは何が起こるかの明確な詳細を提供します。

Homebrewをインストール中.

確認すると、インストーラーが実行されます。

2. コマンドラインからwgetをインストールする

次に、Homebrewを使用してwgetをインストールします。再度ターミナルから、次のコマンドを実行します:

brew install wget

wgetをインストール中.

インストーラーはライブの進捗状況を提供し、ここで行う必要があることはほとんどありません。プロセスは簡単で自動化されています。ただし、すでにHomebrewがインストールされている場合は、最新のフォーミュラのコピーを取得するためにbrew updateを実行してください。

ターミナル内に新しいプロンプトが表示されると、Macでwgetを使用してリソースをダウンロードする準備が整います。

関連記事: MacでPythonスクリプトを実行する方法

wgetを使用してウェブリソースをダウンロードする方法

wgetを使用してURLからリモートリソースをダウンロードするには、次の構造を使用します:

wget -O path/to/local.copy http://example.com/url/to/download.html

これにより、指定されたURLのファイルがマシン上の指定された場所に保存されます。

wgetを使用してファイルをダウンロード中.

-Oフラグを除外すると、ダウンロード先は現在の作業ディレクトリになります。

現在の作業ディレクトリにファイルをダウンロード中.

例えば、ウェブページをダウンロードフォルダにダウンロードしたい場合:

wget -O /Users/[your-username]/Downloads/status.html https://www.w3.org/Status.html

ただし、-Oフラグなしで同じことを行うには、wgetを実行する前にディレクトリを変更する必要があります(cd downloads):

wget /Users/[your-username]/Downloads/status.html https://www.w3.org/Status.html

ダウンロード進捗の詳細が表示されますが、wgetの速度が速いため、この情報はリアルタイムの更新ではなく、ダウンロードの概要に近いものです。

再帰的なディレクトリをダウンロードする方法

wgetを使用してディレクトリツリー全体をダウンロードするには、-r / --recursiveおよび-np / --no-parentフラグを使用する必要があります:

wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/

これにより、wgetは指定されたディレクトリ内の文書に見つかったリンクをたどります。そこから、指定されたURLパス全体を再帰的にダウンロードします。

また、-e robots=offコマンドに注意してください。これはrobots.txtファイルの制限を無視します。一般的に、abridgedダウンロードを防ぐためにrobots.txtを無効にすることは良い考えです。

wgetで追加のフラグを使用する

wgetは柔軟なツールであり、他の多くの追加フラグを使用します。これは、ダウンロードに特定の要件がある場合に便利です。

ダウンロードプロセスを制御し、ログを作成することに焦点を当てて、2つの領域を見てみましょう。

wgetがリソースをダウンロードする方法を制御する

ダウンロードプロセスを設定するのに役立つ多くのフラグがあります。ここでは、最も便利なもののいくつかを示します:

  • wget -X /absolute/path/to/directoryは、リモートサーバー上の特定のディレクトリを除外します。
  • wget -nHは「ホスト名」ディレクトリを削除します。言い換えれば、主要なドメイン名をスキップします。例えば、wgetは前の例でwww.w3.orgフォルダをスキップし、代わりにHistoryディレクトリから始めます。
  • wget --cut-dirs=#は、ファイルのダウンロードを開始する前にURLの指定された数のディレクトリをスキップします。例えば、-nH --cut-dirs=1は「ftp.xemacs.org/pub/xemacs/」の指定されたパスを単に「/xemacs/」に変更し、ローカルダウンロード内の空の親ディレクトリの数を減らします。
  • wget -R index.html / wget --reject index.htmlは、指定されたファイル名に一致するファイルをスキップします。この場合、すべてのインデックスファイルを除外します。アスタリスク()はワイルドカードであり、「.png」のように、PNG拡張子を持つすべてのファイルをスキップします。
  • wget -i fileは、入力ファイルからターゲットURLを指定します。この入力ファイルはHTML形式でなければならず、HTMLを解析するために--force-htmlフラグを使用する必要があります。
  • wget -nc / wget --no-clobberは、宛先にすでに存在するファイルを上書きしません。
  • wget -c / wget --continueは、部分的にダウンロードされたファイルのダウンロードを続行します。
  • wget -t 10は、失敗する前にリソースを最大10回ダウンロードしようとします。

wgetはダウンロードプロセスを制御するだけでなく、将来の参照のためにログを作成することもできます。

ログのレベルを調整する

wgetを使用する際に受け取る出力を制御するための部分的な方法として、次のフラグを考慮することもできます。

  • wget -dはデバッグ出力を有効にします。
  • wget -o path/to/log.txtは、標準出力にログを表示するのではなく、指定されたディレクトリにログ出力を有効にします。
  • wget -qは、エラーメッセージを含むすべてのwgetの出力をオフにします。
  • wget -vは、wgetのデフォルトの詳細出力を明示的に有効にします。
  • wget --no-verboseは、ログメッセージをオフにしますが、エラーメッセージは表示します。

ダウンロード中に何が起こっているかを知りたいことが多いため、これらのフラグを他のものほど頻繁には使用しないかもしれません。それでも、大量のダウンロードがあり、問題を修正できることを確認したい場合は、ログや出力の欠如は有効なアプローチです。

関連記事: macOSからKextを追加および削除する方法

結論

ブラウザや他のGUIを使用してウェブページやその他のリソースをダウンロードすることもできますが、コマンドラインを使用することで時間を節約できます。wgetのようなツールは強力で、ブラウザよりも優れており、スナッピーでもあります。wgetの機能の完全な説明については、wgetのGNUマニュアルページを確認できます。

wgetが機能しない場合は、Wi-Fi接続の問題を診断する時期かもしれません。Macでウェブリソースをダウンロードするためにwgetを使用しますか?以下のコメントセクションであなたの考えを共有してください!