Come clonare un sito web con httrack
Il Gennaio 15, 2022 da adminSe sei uno sviluppatore di siti web, un imprenditore o uno studente nel campo dell’IT, probabilmente ti sei imbattuto in un caso in cui avevi bisogno di clonare rapidamente un sito web. Diciamo, per esempio, che avete un sito che amministrate che sta avendo problemi; potreste voler clonare quel sito e poi iniziare il debugging del clone. Lavorare con il clone certamente batte la possibilità di rompere ulteriormente il tuo sito originale.
Ci sono molti modi per clonare un sito. Una soluzione che ho usato offre sia la linea di comando che le opzioni GUI, e si chiama httrack. L’applicazione può essere utilizzata su Linux, Windows, macOS e Android, e fa una copia completa di un sito web per la navigazione locale. Lo strumento a riga di comando è, come ci si aspetta, chiamato httrack. C’è anche una versione GUI per Linux chiamata webhttrack. Dimostrerò come usare sia la linea di comando che gli strumenti GUI, in modo che tu possa fare cloni veloci dei tuoi siti web. Dimostrerò entrambe le versioni da Ubuntu Linux.
Installazione
Entrambi gli strumenti per la linea di comando e la GUI possono essere trovati nei repository standard. Per installarli, aprite una finestra di terminale ed eseguite il comando:
sudo apt install httrack webhttrack
Quando vi viene richiesto, digitate la vostra password sudo, accettate l’installazione e lasciatela completare. Questo è tutto quello che c’è da fare per installare gli strumenti.
Uso della linea di comando
Prima copieremo un sito usando lo strumento della linea di comando. Questo può richiedere un po’ di tempo, a seconda di quanto è grande il tuo sito. Il comando per fare la copia è:
httrack http://SITE_URL -O LOCALDIRECTORY
dove SITE_URL è l’URL attuale del sito che vuoi copiare e LOCALDIRECTORY è la directory sul tuo disco locale per memorizzare la copia. Una volta completato il comando, vedrai il clone appena creato in LOCALDIRECTORY. Potete quindi iniziare a lavorare con quel clone senza influenzare il vostro sito di produzione.
Il più grande avvertimento all’uso di questo strumento è che, a seconda di come il sito è stato scritto e di come è ospitato, i risultati possono variare. Se trovate che httrack scarica poco più di un file indice, è probabile che non funzioni sul vostro sito. Ho trovato, finora, che i siti WordPress, specialmente quelli ospitati su host di terze parti, sono quasi impossibili da clonare usando questo strumento.
Uso della GUI
Lo strumento GUI ti dà un po’ più di potenza user-friendly. Per avviare la GUI, aprite una finestra di terminale e date il comando webhttrack. Questo aprirà una finestra del browser con la GUI pronta. Nella prima schermata, seleziona la tua lingua e clicca su Next >>. Nella finestra successiva (Figura A), inserisci un nuovo nome per il progetto e seleziona una delle categorie predefinite. Digita un percorso di base per ospitare i file scaricati e clicca su Next >>.
Figura A
Nella finestra successiva (Figura B), seleziona l’azione da utilizzare (dato che questo è un primo download, l’impostazione predefinita andrà bene) e digita l’URL per il sito di destinazione nella casella dell’indirizzo.
Figura B
Clicca sul pulsante Set Options e puoi configurare opzioni come ID del browser, regole di scansione, regole del robot, numero di connessioni, proxy, limiti e altro (Figura C).
Figura C
Se esegui un clone e scopri che non funziona, è probabile che tu debba rivisitare la sezione Opzioni e fare delle modifiche. Questo, naturalmente, dipenderà dal tipo di sito che si sta tentando di clonare. Una volta che hai impostato le opzioni esattamente come ti serve, clicca su OK, poi su Next >> e poi sul pulsante Start>>. A questo punto (Figura D), il sito inizierà la clonazione (salvandolo nella directory locale configurata).
Figura D
Quando il download è completato, puoi iniziare a lavorare con il tuo clone.
Non perfetto, ma utile
Finché non stai cercando di scaricare un sito WordPress, sia httrack che webhttrack faranno un ottimo lavoro per scaricare un clone del tuo sito, in modo da poter eseguire il debug, il backup, o qualsiasi altra cosa di cui hai bisogno. Come ho detto, a seconda del tipo di sito con cui stai cercando di lavorare, dovrai giocare con le impostazioni per farlo funzionare. Date una prova a questo pratico strumento e vedete se non diventa il vostro strumento di clonazione del sito.
Vedi anche
- Come connettersi ad una condivisione SMB dal tuo dispositivo Android (TechRepublic)
- Come usare Antsle per distribuire rapidamente una macchina virtuale (TechRepublic)
- 3 passi veloci per ottimizzare le prestazioni del tuo server NGINX (TechRepublic)
- Come connettersi a un database MySQL remoto con DBeaver (TechRepublic)
- Come aggiungere facilmente un’impronta digitale SSH al tuo file known_hosts in Linux (TechRepublic)
- Puoi usare una VPN per combattere gli abusi sulla neutralità della rete degli ISP (ZDNet)
Lascia un commento