Come ho trasformato il mio Raspberry Pi in un archivio privato di Internet

Un Raspberry Pi e un vecchio hard disk stavano accumulando polvere nel mio cassetto fino a quando l’hackeraggio dell’Internet Archive ha fatto notizia. Ora sono il cuore del mio sistema di archiviazione web locale, preservando tutto, dai post dei blog preferiti ai progetti open-source. In questo articolo, ti mostrerò il mio viaggio passo-passo per creare un archivio privato di Internet e l’indipendenza nella conservazione digitale utilizzando ArchiveBox.
Perché ho scelto di ospitare autonomamente un archivio privato di Internet
La recente violazione della sicurezza dell’Internet Archive ha colpito la comunità di conservazione digitale e tutti coloro che beneficiano del suo lavoro come un fulmine. Il 9 ottobre, gli hacker hanno compromesso il sito e rubato un’enorme base di dati di autenticazione degli utenti contenente 31 milioni di record.
A rendere le cose ancora più complicate è stato il fatto che questa non fosse la fine dei guai per l’Archive. Proprio quando erano riusciti a ripristinare alcuni servizi entro il 21 ottobre, gli hacker hanno ottenuto accesso al loro sistema di supporto Zendesk, dimostrando che la vulnerabilità era più profonda del previsto.

Sebbene l’Archive abbia ripreso le operazioni, il suo futuro rimane incerto perché le violazioni della sicurezza non sono l’unica minaccia alla conservazione digitale. Una recente sentenza della corte d’appello federale ha inflitto un ulteriore duro colpo all’Internet Archive, stabilendo che la loro biblioteca di prestiti digitali non era protetta dal principio dell’uso leale e potrebbe quindi essere costretta a rimuovere un’importante parte del suo contenuto.
Le implicazioni sono chiare: la necessità di un controllo personale sulla conservazione digitale non è mai stata così evidente. La buona notizia è che chiunque può impostare un archivio di internet privato utilizzando un Raspberry Pi e ArchiveBox con facilità.
La mia configurazione hardware consigliata per l’archivio Raspberry Pi
Se sei pronto per creare il tuo archivio privato di internet, avrai bisogno di un po’ di hardware.
Prima di tutto, avrai bisogno di un Raspberry Pi. Per la migliore esperienza, consiglio vivamente il Raspberry Pi 5 perché le sue prestazioni significativamente migliorate fanno sì che i compiti di archiviazione siano più fluidi e veloci, e avrai anche ampio spazio per l’espansione futura del tuo archivio.

Detto ciò, non sentirti sotto pressione se possiedi già un Raspberry Pi 4B con 4GB o 8GB di RAM. Questi modelli sono perfettamente in grado di gestire un archivio personale e hanno in effetti un vantaggio interessante rispetto al Pi 5: l’encoding video hardware H.264. Questo diventa particolarmente utile se prevedi di trasmettere video archiviati sulla tua TV o su altri dispositivi a casa.
Insieme al tuo Pi, ecco di cosa avrai bisogno:
- Scheda microSD: Una scheda microSD da 32GB è sufficiente per far funzionare ArchiveBox. Questa scheda microSD servirà come l’unità di avvio principale del Pi, quindi assicurati di scegliere una di buona qualità e affidabile per prevenire problemi di corruzione dei dati in futuro.
- Hard disk esterno: Per l’archiviazione effettiva, avrai bisogno di un hard disk esterno da 3,5” con la propria alimentazione. Perché? Perché i dischi da 3,5” offrono una maggiore affidabilità nel tempo rispetto agli SSD più moderni, e l’affidabilità è ciò che conta di più quando si tratta di archiviazione.
- Monitor, mouse e tastiera: Questi sono tecnicamente opzionali ma possono rendere più facile la configurazione, specialmente se stai configurando il Pi per la prima volta. In alternativa, puoi controllarlo interamente da remoto utilizzando strumenti come SSH (Secure Shell Protocol), VNC (Virtual Network Computing) o RDP (Remote Desktop Protocol).
Una volta che hai tutti questi elementi a disposizione, sei pronto per iniziare a configurare il tuo archivio internet ospitato autonomamente!
Preparazione di un ambiente software per l’archiviazione
Il primo passo è installare un sistema operativo sul tuo Raspberry Pi. Personalmente raccomando il Raspberry Pi OS perché, essendo il sistema operativo ufficiale per i dispositivi Raspberry Pi, è di gran lunga l’opzione più popolare e supportata disponibile. Puoi seguire la nostra guida all’installazione di Raspberry Pi OS se non sai come metterlo sulla tua scheda microSD.

E se ti senti avventuroso, potresti voler esplorare alcuni degli altri sistemi operativi alternativi disponibili per il Raspberry Pi.
Una volta installato il sistema operativo, accendi il tuo Pi e collegalo a internet (non importa se usi una connessione cablata o wireless). Quindi avvia il Terminale e esegui un aggiornamento del sistema con il comando:
sudo apt update && sudo apt full-upgrade
Per installare ArchiveBox, hai tre opzioni: Docker, uno script di installazione automatico o utilizzare il gestore di pacchetti del tuo sistema. Ti consiglio vivamente di usare Docker. Non solo offre l’esperienza di installazione e aggiornamento più fluida, ma ti fornisce anche la migliore isolamento di sicurezza e include tutte le dipendenze già pronte all’uso.
Purtroppo, Docker non è pre-installato su Raspberry Pi OS, quindi dovremo configurarlo prima (non dimenticare di eseguire anche i passaggi di post-installazione).
Con Docker installato correttamente, siamo pronti a passare all’installazione di ArchiveBox stesso, che sarà molto più semplice grazie a tutto il lavoro preliminare che abbiamo svolto.
Installazione e avvio di ArchiveBox
Per installare ArchiveBox usando Docker, crea prima una directory dove verrà memorizzato tutto il tuo contenuto archiviato. Questa sarà la tua cartella di archivio sul Raspberry Pi, quindi scegli una posizione con ampio spazio di archiviazione, come il tuo hard disk esterno (puoi navigarci utilizzando il comando cd):
mkdir -p archivebox/data && cd archiveboxSuccessivamente, scarica il file di configurazione ufficiale di Docker Compose che definisce come ArchiveBox dovrebbe funzionare:
curl -fsSL 'https://docker-compose.archivebox.io' > docker-compose.ymlQuesto file di configurazione è importante perché imposta tutti i componenti necessari, incluso il server web e le attività programmate. Se desideri memorizzare il tuo archivio su un’unità esterna invece che sulla scheda SD del Pi (il che è consigliato), dovrai modificare il file “docker-compose.yml” per puntare alla posizione dell’unità montata.
Per farlo, apri il file di configurazione usando un editor di testo qualsiasi, come nano:
nano docker-compose.ymlCerca la sezione volumes sotto il servizio archivebox. Per impostazione predefinita, appare così:
services:
archivebox:
...
volumes:
- ./data:/dataDobbiamo cambiare ./data per riflettere il percorso completo della directory dei dati del nostro disco esterno. Ad esempio, se il tuo disco è montato su /mnt/external_drive, modifica la riga in questo modo:
services:
archivebox:
...
volumes:
- /mnt/external_drive/archivebox/data:/dataQuesto dice a Docker di memorizzare tutti i dati di ArchiveBox nella directory “archivebox/data” sul tuo disco esterno invece di utilizzare un percorso relativo. Utilizzare il percorso assoluto è importante perché garantisce che Docker possa sempre trovare i tuoi dati di archivio, anche se esegui comandi da directory diverse.
Mentre ci sei, puoi anche aggiungere le variabili ambiente PUID e PGID per corrispondere all’account utente del tuo Pi. Trova il tuo ID utente e il tuo ID di gruppo eseguendo id -u e id -g, quindi aggiungili alla sezione ambiente:
services:
archivebox:
...
environment:
- PUID=1000 # sostituisci con il tuo ID utente
- PGID=1000 # sostituisci con il tuo ID gruppoInfine, commenta o rimuovi i servizi sonic (cercare più velocemente e meglio collezioni di grandi dimensioni) e novnc (ti consente di impostare un profilo con accessi ai siti che desideri archiviare). La configurazione di questi servizi opzionali è al di fuori dell’ambito di questa guida, quindi ti consiglio di seguire la documentazione ufficiale se sei interessato a essi.
La configurazione minima funzionante dovrebbe apparire così:

Salva il file ed esci dall’editor. Ora inizializza il tuo archivio e crea un utente admin per accedere all’interfaccia web:
docker compose run archivebox init
docker compose run archivebox manage createsuperuserUna volta completata l’inizializzazione, puoi avviare il server di ArchiveBox:
docker compose up -d
Ora puoi accedere alla tua istanza di ArchiveBox aprendo un browser web e navigando su http://localhost:8000. Provalo adesso. Questo è ciò che dovresti vedere:
Configurazione e utilizzo di ArchiveBox
Per personalizzare il comportamento di ArchiveBox, non è necessario modificare direttamente i file di configurazione. Invece, usa il comando config per modificare le impostazioni. Ad esempio, io regolo sempre i timeout e i limiti delle risorse per ottenere migliori prestazioni sul Raspberry Pi:
docker compose run archivebox config --set MEDIA_TIMEOUT=3600
docker compose run archivebox config --set TIMEOUT=60
docker compose run archivebox config --set MEDIA_MAX_SIZE=750mbPuoi anche disabilitare l’invio a archive.org per accelerare l’archiviazione:
docker compose run archivebox config --set SAVE_ARCHIVE_DOT_ORG=FalseTutte le impostazioni vengono salvate automaticamente nel file ArchiveBox.conf nella tua directory di dati, e puoi visualizzare le impostazioni correnti in qualsiasi momento eseguendo:
docker compose run archivebox config list
Con la configurazione di base completata, puoi iniziare ad aggiungere contenuto al tuo archivio. ArchiveBox supporta diversi modi per aggiungere URL. Il più semplice è l’interfaccia web. Devi solo cliccare sul pulsante Aggiungi, incollare i tuoi URL e cliccare sul pulsante Aggiungi URL e archivia.

In alcune situazioni, può essere più conveniente archiviare tramite linea di comando. Ad esempio, per archiviare una singola pagina web, puoi eseguire:
docker compose run archivebox add 'https://example.com'Oppure per archiviare un intero elenco di URL da un file di testo:
docker compose run -T archivebox add < urls.txtInfine, puoi importare da diversi servizi di segnalibri, tra cui Pocket, Pinboard o Instapaper. Si prega di controllare il wiki ufficiale per istruzioni dettagliate.
Ricorda che il tuo archivio è tanto sicuro quanto i backup che mantieni. Per proteggere tutto il contenuto che stai cercando di preservare, ti consiglio vivamente di implementare una strategia di backup affidabile con l’aiuto del miglior software di backup per Linux per proteggersi da perdite di dati, interruzioni di corrente o cancellazioni accidentali.
Immagine di copertura e screenshot di David Morelo.