Een website klonen met httrack
On januari 15, 2022 by adminAls je een website-ontwikkelaar, een bedrijfseigenaar of een student op het gebied van IT bent, heb je waarschijnlijk wel eens meegemaakt dat je snel een website moest klonen. Stel, bijvoorbeeld, je hebt een site die je beheert en die problemen heeft; misschien wil je die site klonen en vervolgens beginnen met het debuggen van de kloon. Werken met de kloon is zeker beter dan het verder kapotmaken van je originele site.
Er zijn genoeg manieren om een site te klonen. Een oplossing die ik heb gebruikt biedt zowel command line als GUI opties, en heet httrack. De applicatie kan worden gebruikt op Linux, Windows, macOS, en Android, en maakt een volledige kopie van een website voor lokaal browsen. De command line tool heet, zoals je verwacht, httrack. Er is ook een GUI versie voor Linux genaamd webhttrack. Ik ga demonstreren hoe je zowel de commandoregel als de GUI tools kunt gebruiken, zodat je snel klonen van je websites kunt maken. Ik zal beide versies demonstreren vanuit Ubuntu Linux.
Installatie
Beide command line en GUI tools kunnen gevonden worden in de standaard repositories. Om ze te installeren, open een terminal venster en voer het volgende commando uit:
sudo apt install httrack webhttrack
Wanneer daarom wordt gevraagd, typ uw sudo wachtwoord, accepteer de installatie, en laat het voltooien. Dat is alles wat er nodig is om de tools te installeren.
Command line use
Eerst gaan we een site kopiëren met het command line tool. Dit kan enige tijd duren, afhankelijk van hoe groot je site is. Het commando om de kopie te maken is:
httrack http://SITE_URL -O LOCALDIRECTORY
Waarbij SITE_URL de actuele URL is van de site die u wilt kopiëren en LOCALDIRECTORY de directory op uw lokale schijf om de kopie op te slaan. Zodra het commando is voltooid, ziet u de nieuw aangemaakte kloon in LOCALDIRECTORY. U kunt dan met die kloon aan de slag zonder uw productie site te beïnvloeden.
De grootste kanttekening bij het gebruik van deze tool is dat, afhankelijk van hoe de site is geschreven en hoe deze is gehuisvest, je resultaten kunnen variëren. Als je vindt dat httrack niet veel meer download dan een index file, is de kans groot dat het niet werkt op jouw site. Ik heb tot nu toe gevonden dat WordPress sites, vooral die gehuisvest zijn op hosts van derden, bijna onmogelijk te klonen zijn met deze tool.
GUI gebruik
De GUI tool geeft je een beetje meer gebruikersvriendelijke kracht. Om de GUI te starten, open je een terminal venster en geef je het commando webhttrack. Dit zal een browser venster openen met de GUI in de aanslag. Selecteer in het eerste scherm uw taal en klik op Next >>. In het volgende venster (Figuur A) voert u een nieuwe projectnaam in, en selecteert u een van de vooraf gedefinieerde categorieën. Typ een basispad voor de gedownloade bestanden en klik op Volgende >>.
Figuur A
In het volgende venster (Afbeelding B) selecteert u de actie die moet worden gebruikt (aangezien dit een eerste download is, is de standaardwaarde prima) en typt u de URL voor de doelsite in het adresvak.
Figuur B
Klik op de knop Opties instellen en u kunt opties configureren zoals browser-ID, scanregels, robotregels, aantal verbindingen, proxy, limieten en meer (afbeelding C).
Figuur C
Als u een kloon uitvoert en deze mislukt, is de kans groot dat u het gedeelte Opties opnieuw moet bekijken en aanpassingen moet maken. Dit is uiteraard afhankelijk van het type site dat u probeert te klonen. Zodra u de opties precies hebt ingesteld zoals u ze nodig hebt, klikt u op OK en vervolgens op Volgende >> en vervolgens op de knop Start>>. Op dit punt (Afbeelding D) begint de site met klonen (opslaan in de geconfigureerde lokale map).
Figuur D
Wanneer het downloaden is voltooid, kunt u met uw kloon aan de slag.
Niet perfect, maar nuttig
Zolang je niet probeert een WordPress site te downloaden, zal httrack of webhttrack prima werk leveren door een kloon van je site te downloaden, zodat je kunt debuggen, een back-up kunt maken, of wat je behoeften ook mogen zijn. Zoals ik al zei, afhankelijk van het type site waar je mee wilt werken, zul je moeten spelen met de instellingen om dit werkend te krijgen. Probeer deze handige tool eens uit en kijk of het niet jouw favoriete site kloon tool wordt.
Zie ook
- Hoe maak je verbinding met een SMB share vanaf je Android toestel (TechRepublic)
- Hoe gebruik je Antsle om snel een virtuele machine te deployen (TechRepublic)
- 3 snelle stappen om de prestaties van je NGINX server te optimaliseren (TechRepublic)
- Hoe maak je verbinding met een MySQL-database op afstand met DBeaver (TechRepublic)
- Hoe voeg je eenvoudig een SSH-vingerafdruk toe aan je known_hosts-bestand in Linux (TechRepublic)
- Je kunt een VPN gebruiken om ISP netneutraliteitsmisbruik te bestrijden (ZDNet)
Geef een antwoord