Comment cloner un site web avec httrack
On janvier 15, 2022 by adminSi vous êtes un développeur de site web, un propriétaire d’entreprise ou un étudiant dans le domaine de l’informatique, vous avez probablement rencontré un cas où vous aviez besoin de cloner rapidement un site web. Par exemple, si vous administrez un site qui a des problèmes, vous pouvez cloner ce site et commencer à le déboguer. Travailler avec le clone bat certainement la possibilité de casser davantage votre site original.
Il y a beaucoup de façons de cloner un site. Une solution que j’ai utilisée offre à la fois des options de ligne de commande et d’interface graphique, et s’appelle httrack. L’application peut être utilisée sur Linux, Windows, macOS et Android, et fait une copie complète d’un site Web pour la navigation locale. L’outil en ligne de commande s’appelle, comme vous vous en doutez, httrack. Il existe également une version GUI pour Linux appelée webhttrack. Je vais vous montrer comment utiliser les outils de la ligne de commande et de l’interface graphique, afin que vous puissiez faire des clones rapides de vos sites Web. Je vais faire la démonstration des deux versions à partir d’Ubuntu Linux.
Installation
Les deux outils de ligne de commande et d’interface graphique peuvent être trouvés dans les dépôts standards. Pour les installer, ouvrez une fenêtre de terminal et lancez la commande :
sudo apt install httrack webhttrack
Lorsque vous y êtes invité, tapez votre mot de passe sudo, acceptez l’installation et laissez-la se terminer. C’est tout ce qu’il y a à faire pour installer les outils.
Utilisation de la ligne de commande
Pour commencer, nous allons copier un site en utilisant l’outil de ligne de commande. Cela peut prendre un certain temps, en fonction de la taille de votre site. La commande pour faire la copie est :
httrack http://SITE_URL -O LOCALDIRECTORY
où SITE_URL est l’URL réelle du site que vous voulez copier et LOCALDIRECTORY est le répertoire sur votre disque local pour stocker la copie. Une fois la commande terminée, vous verrez le clone nouvellement créé dans LOCALDIRECTORY. Vous pouvez alors commencer à travailler avec ce clone sans affecter votre site de production.
La plus grande mise en garde concernant l’utilisation de cet outil est que, selon la façon dont le site a été écrit et comment il est hébergé, vos résultats peuvent varier. Si vous trouvez que httrack ne télécharge guère plus qu’un fichier d’index, il y a de fortes chances pour qu’il ne fonctionne pas sur votre site. J’ai constaté, jusqu’à présent, que les sites WordPress, en particulier ceux hébergés sur des hôtes tiers, sont pratiquement impossibles à cloner à l’aide de cet outil.
Utilisation de l’interface graphique
L’outil GUI vous donne un pouvoir un peu plus convivial. Pour démarrer l’interface graphique, ouvrez une fenêtre de terminal et lancez la commande webhttrack. Cela ouvrira une fenêtre de navigateur avec l’interface graphique à portée de main. Dans le premier écran, sélectionnez votre langue, et cliquez sur Next >>. Dans la fenêtre suivante (Figure A), entrez un nouveau nom de projet, et sélectionnez une des catégories prédéfinies. Tapez un chemin de base pour héberger les fichiers téléchargés, et cliquez sur Suivant >>.
Figure A
Dans la fenêtre suivante (figure B), sélectionnez l’action à utiliser (comme il s’agit d’un premier téléchargement, la valeur par défaut conviendra) et tapez l’URL du site cible dans la zone d’adresse.
Figure B
Cliquez sur le bouton Définir les options et vous pourrez configurer des options telles que l’ID du navigateur, les règles d’analyse, les règles du robot, le nombre de connexions, le proxy, les limites, et plus encore (Figure C).
Figure C
Si vous exécutez un clone, et constatez qu’il échoue, il y a de fortes chances que vous deviez revisiter la section Options et faire des ajustements. Cela dépendra, bien sûr, du type de site que vous tentez de cloner. Une fois que vous avez défini les options exactement comme vous en avez besoin, cliquez sur OK puis sur Suivant >> puis sur le bouton Démarrer>>. A ce stade (Figure D), le site commencera à se cloner (en l’enregistrant dans le répertoire local configuré).
Figure D
Lorsque le téléchargement est terminé, vous pouvez commencer à travailler avec votre clone.
Pas parfait, mais utile
Si vous n’essayez pas de télécharger un site WordPress, soit httrack ou webhttrack fera un excellent travail de téléchargement d’un clone de votre site, afin que vous puissiez déboguer, sauvegarder, ou quels que soient vos besoins. Comme je l’ai dit, selon le type de site avec lequel vous souhaitez travailler, vous devrez jouer avec les paramètres pour que cela fonctionne. Donnez un essai à cet outil pratique et voyez s’il ne finit pas par devenir votre outil de clonage de site de référence.
Aussi vu
- Comment se connecter à un partage SMB depuis votre appareil Android (TechRepublic)
- Comment utiliser Antsle pour déployer rapidement une machine virtuelle (TechRepublic)
- 3 étapes rapides pour optimiser les performances de votre serveur NGINX. (TechRepublic)
- Comment se connecter à une base de données MySQL distante avec DBeaver (TechRepublic)
- Comment ajouter facilement une empreinte SSH à votre fichier known_hosts sous Linux (TechRepublic)
- Vous pouvez utiliser un VPN pour lutter contre les abus de neutralité du net des FAI (ZDNet)
.
Laisser un commentaire