Cómo Convertí Mi Raspberry Pi en un Archivo de Internet Privado

Una Raspberry Pi y un viejo disco duro estaban recogiendo polvo en mi cajón hasta que el hack del Archivo de Internet hizo titulares. Ahora son el corazón de mi sistema local de archivo web, preservando todo, desde las publicaciones de blogs favoritas hasta proyectos de código abierto. En este artículo, te mostraré mi viaje paso a paso para crear un archivo privado de Internet y la independencia en la preservación digital usando ArchiveBox.
Por Qué Elegí Alojar un Archivo de Internet Privado
La reciente violación de seguridad del Archivo de Internet golpeó a la comunidad de preservación digital y a todos los que se benefician de su trabajo como un rayo. El 9 de octubre, los hackers comprometieron el sitio y robaron una enorme base de datos de autenticación de usuarios que contenía 31 millones de registros.
Lo que empeoró las cosas fue que este no fue el final de los problemas del Archivo. Justo cuando lograron restaurar algunos servicios para el 21 de octubre, los hackers obtuvieron acceso a su sistema de soporte de Zendesk, demostrando que la vulnerabilidad era más profunda de lo que se pensaba inicialmente.

Aunque el Archivo ha reanudado sus operaciones, su futuro sigue siendo incierto porque las violaciones de seguridad no son la única amenaza para la preservación digital. Un reciente fallo de la corte federal de apelaciones infligió otro golpe significativo al Archivo de Internet, encontrando que su biblioteca de préstamos digitales no estaba protegida por la doctrina de uso justo y, por lo tanto, podría verse obligada a eliminar una parte significativa de su contenido.
Las implicaciones son claras: la necesidad de control personal sobre la preservación digital nunca ha sido más evidente. La buena noticia es que cualquiera puede configurar un archivo privado de internet utilizando una Raspberry Pi y ArchiveBox con facilidad.
Mi Configuración Recomendada de Hardware para el Archivo de Raspberry Pi
Si estás listo para crear tu propio archivo privado de internet, entonces necesitarás algo de hardware.
Primero y ante todo, necesitarás una Raspberry Pi. Para la mejor experiencia, recomiendo encarecidamente la última Raspberry Pi 5 porque su rendimiento mejorado significa que tus tareas de archivo funcionarán más suave y rápido, y tendrás suficiente margen para futuras expansiones de tu archivo.

Dicho esto, no te sientas presionado si ya posees una Raspberry Pi 4B con 4GB u 8GB de RAM. Estos modelos son perfectamente capaces de ejecutar un archivo personal, y en realidad tienen una ventaja interesante sobre la Pi 5: codificación de video H.264 por hardware. Esto se vuelve particularmente valioso si planeas transmitir videos archivados a tu televisión u otros dispositivos en tu hogar.
Además de tu Pi, aquí tienes lo que necesitarás:
- Tarjeta microSD: Una tarjeta microSD de 32GB es suficiente para poner ArchiveBox en funcionamiento. Esta tarjeta microSD servirá como la unidad de arranque principal de la Pi, así que asegúrate de elegir una de calidad, confiable, para prevenir problemas de corrupción de datos en el futuro.
- Disco duro externo: Para el almacenamiento real del archivo, querrás un disco duro externo de 3.5″ con su propia fuente de alimentación. ¿Por qué? Porque los discos de 3.5″ ofrecen una mejor confiabilidad a lo largo del tiempo en comparación con los SSDs más modernos, y la confiabilidad es lo que más importa cuando se trata de archivar.
- Monitor, mouse y teclado: Estos son técnicamente opcionales, pero pueden facilitar la configuración, especialmente si estás configurando la Pi por primera vez. Alternativamente, puedes controlarla totalmente de manera remota usando herramientas como SSH (Protocolo de Shell Seguro), VNC (Computación de Red Virtual) o RDP (Protocolo de Escritorio Remoto).
Una vez que tengas todos estos artículos a mano, ¡estás listo para comenzar a configurar tu archivo de internet alojado por ti mismo!
Preparando un Entorno de Software para Archivar
El primer paso es obtener un sistema operativo en funcionamiento en tu Raspberry Pi. Personalmente, recomiendo Raspberry Pi OS porque, como el sistema operativo oficial para dispositivos Raspberry Pi, es con diferencia la opción más popular y soportada disponible. Puedes seguir nuestra guía de instalación de Raspberry Pi OS si no sabes cómo ponerlo en tu tarjeta microSD.

Y si te sientes aventurero, tal vez quieras explorar algunos de los sistemas operativos alternativos disponibles para la Raspberry Pi.
Una vez que tengas el sistema operativo instalado, enciende tu Pi y conéctala a internet (no importa si usas una conexión por cable o inalámbrica). Luego lanza Terminal y realiza una actualización del sistema con el comando:
sudo apt update && sudo apt full-upgrade
En cuanto a la instalación de ArchiveBox, tienes tres opciones: Docker, un script de configuración automática o usar el gestor de paquetes de tu sistema. Recomiendo encarecidamente optar por Docker. No solo proporciona la instalación y experiencia de actualización más fluida, sino que también te brinda la mejor aislamiento de seguridad e incluye todas las dependencias directamente.
Desafortunadamente, Docker no viene preinstalado en Raspberry Pi OS, así que primero necesitaremos configurarlo (no olvides también realizar los pasos posteriores a la instalación).
Con Docker instalado correctamente, estamos listos para proceder a instalar ArchiveBox en sí, lo cual será mucho más simple gracias a todo el trabajo previo que hemos realizado.
Instalando y Ejecutando ArchiveBox
Para instalar ArchiveBox usando Docker, primero crea un directorio donde se almacenará todo tu contenido archivado. Esta será tu carpeta de archivo en la Raspberry Pi, así que elige una ubicación con amplio almacenamiento, como tu disco duro externo (puedes navegar hasta él usando el comando cd):
mkdir -p archivebox/data && cd archiveboxA continuación, descarga el archivo de configuración oficial de Docker Compose que define cómo debería ejecutarse ArchiveBox:
curl -fsSL 'https://docker-compose.archivebox.io' > docker-compose.ymlEste archivo de configuración es importante porque establece todos los componentes necesarios, incluido el servidor web y las tareas programadas. Si deseas almacenar tu archivo en un disco externo en lugar de la tarjeta SD de la Pi (lo cual se recomienda), necesitarás editar el archivo “docker-compose.yml” para apuntar a la ubicación de tu unidad montada.
Para hacerlo, abre el archivo de configuración usando cualquier editor de texto, como nano:
nano docker-compose.ymlBusca la sección volumes bajo el servicio archiverbox. Por defecto, se ve algo así:
services:
archivebox:
...
volumes:
- ./data:/dataNecesitamos cambiar ./data para reflejar la ruta completa al directorio de datos de tu disco externo. Por ejemplo, si tu disco está montado en /mnt/external_drive, modifica la línea para que se vea así:
services:
archivebox:
...
volumes:
- /mnt/external_drive/archivebox/data:/dataEsto le dice a Docker que almacene todos los datos de ArchiveBox en el directorio “archivebox/data” de tu disco externo en lugar de usar una ruta relativa. Usar la ruta absoluta es importante porque garantiza que Docker siempre pueda encontrar los datos de tu archivo, incluso si ejecutas comandos desde diferentes directorios.
Mientras lo haces, también puedes agregar las variables de entorno PUID y PGID para que coincidan con la cuenta de usuario de tu Pi. Encuentra tu ID de usuario y ID de grupo ejecutando id -u y id -g, luego agrégalas a la sección de ambiente:
services:
archivebox:
...
environment:
- PUID=1000 # reemplaza con tu ID de usuario
- PGID=1000 # reemplaza con tu ID de grupoFinalmente, comenta o elimina los servicios sonic (más rápido y mejor búsqueda para colecciones grandes) y novnc (te permite configurar un perfil con inicios de sesión en los sitios que deseas archivar). La configuración de estos servicios opcionales está más allá del alcance de esta guía, por lo que te recomiendo que sigas la documentación oficial si te interesan.
La configuración mínima funcional debería verse algo así:

Guarda el archivo y sal del editor. Ahora inicializa tu archivo y crea un usuario administrador para acceder a la interfaz web:
docker compose run archivebox init
docker compose run archivebox manage createsuperuserUna vez completada la inicialización, puedes iniciar el servidor ArchiveBox:
docker compose up -d
Ahora puedes acceder a tu instancia de ArchiveBox abriendo un navegador web y navegando a http://localhost:8000. Inténtalo ahora. Esto es lo que deberías ver:
Configurando y Usando ArchiveBox
Para personalizar el comportamiento de ArchiveBox, no necesitas editar directamente los archivos de configuración. En su lugar, utiliza el comando config para modificar la configuración. Por ejemplo, siempre ajusto los tiempos de espera y los límites de recursos para un mejor rendimiento en la Raspberry Pi:
docker compose run archivebox config --set MEDIA_TIMEOUT=3600
docker compose run archivebox config --set TIMEOUT=60
docker compose run archivebox config --set MEDIA_MAX_SIZE=750mbTambién puedes desactivar el envío a archive.org para acelerar el archivado:
docker compose run archivebox config --set SAVE_ARCHIVE_DOT_ORG=FalseTodas las configuraciones se guardan automáticamente en el archivo ArchiveBox.conf en tu directorio de datos, y puedes ver las configuraciones actuales en cualquier momento ejecutando:
docker compose run archivebox config list
Con la configuración básica completa, puedes comenzar a agregar contenido a tu archivo. ArchiveBox soporta múltiples formas de agregar URL. La más sencilla es a través de la interfaz web. Simplemente haz clic en el botón Agregar, pega tus URL y haz clic en el botón Agregar URL y archivar.

En algunas situaciones, puede ser más conveniente archivar a través de la línea de comandos. Por ejemplo, para archivar una sola página web, puedes ejecutar:
docker compose run archivebox add 'https://example.com'O para archivar una lista completa de URL desde un archivo de texto:
docker compose run -T archivebox add < urls.txtFinalmente, puedes importar de varios servicios de marcadores, incluyendo Pocket, Pinboard o Instapaper. Por favor, consulta la wiki oficial para obtener instrucciones detalladas.
Recuerda que tu archivo es tan seguro como las copias de seguridad que mantienes. Para proteger todo el contenido que estás tratando de preservar, te recomiendo encarecidamente implementar una estrategia de copias de seguridad confiable con la ayuda del mejor software de copias de seguridad de Linux para protegerte contra la pérdida de datos, fallos de energía o eliminaciones accidentales.
Imagen de portada y capturas de pantalla por David Morelo.