So klonen Sie eine Website mit HTTrack

Inhaltsverzeichnis

HTTrack ist eine kostenlose und kostenlose und plattformübergreifende Software, deren Zweck die Weberfassung ist, dh die gesamte oder ein Teil einer Website wird heruntergeladen, um später offline navigieren zu können. Es gibt eine Version für Linux namens WebHTTrack, und seine Version für Windows heißt WinHTTrack. Wir können die HTTrack-Software von ihrer offiziellen Website herunterladen:

Im Fall von Linux können wir es auch mit dem folgenden Befehl aus den Repositorys installieren.

 sudo apt-get install httrack

Diese Software Es wird viel zum Kopieren von Websites verwendet und laden Sie sie dann auf einen anderen Server hoch und verwenden Sie sie, um den Datenverkehr auf die Kopierseite umzuleiten, wodurch Besucher auf eine gefälschte Seite geleitet werden. Es wird auch von denen verwendet, die den Code oder den Betrieb einer bestimmten Website sehen möchten. Schauen wir uns ein Beispiel mit der Website httrack.com an, auf der die Anwendung gehostet wird.

 httrack "httrack.com"
Dieser Befehl lädt die Dateien aus dem Internet in einen Ordner herunter www.httrack.com, die wir vor Ort sehen können.

HTTrack nimmt jede Website und erstellt eine Kopie in dem Ordner oder Laufwerk, in dem wir uns befinden. Dies kann nützlich sein, wenn Sie offline nach Daten auf der Website suchen, wie z. B. E-Mail-Adressen, nützliche Informationen für SEO oder die Struktur einer Website. HTTrack kommt sowohl in Windows als auch in einer Version für Linux, und die Verwendung ist die gleiche, nur dass es in Windows visuelles Intergaz hat.

Wir können Verwenden Sie Httrack für Penetrationstests und Sicherheitstests, da es beim Erstellen einer Replik einer Website ermöglicht, den gesamten Inhalt und die heruntergeladenen Dateien zu analysieren, um festzustellen, dass ein Angreifer keine kritische Datei sieht. Wenn wir Daten und Informationen sammeln, können wir Tests durchführen, Code oder Schlüsselwörter suchen und analysieren, wir können auch Daten sammeln, die später verwendet werden können.

Auch auf diese Weise lHacker verwenden die erstellten Kopien, um sie auf einen Server hochzuladen mit einer webähnlichen Domain kopiert, um die Websites zu emulieren und diese dann per Phishing zu nutzen, um Daten von ahnungslosen Nutzern zu stehlen oder Social-Engineering-Angriffe durchzuführen. Httrack hat viele Optionen und Parameter, um den Download zu verbessern, dafür wird der Befehl verwendet:

 httrack --help

Einige wichtige Parameter, die wir mit dem Httrack-Tool verwenden können, sind:

  • -m: gibt zum Beispiel die maximale Dateigröße in Byte zum Herunterladen an -m 20000000 entspricht 20 MB.
  • -Mime: Wird verwendet, um nur einen bestimmten Dateityp herunterzuladen, den wir mit seiner Erweiterung angeben, zum Beispiel mit dem Befehl
 httrack www.WEB.com -Mime: Bewerbung / * + Mime: Bewerbung / pdf
Die Verwendung von httrack ist einfach, Wir müssen die Domain der Website hinzufügen, die wir kopieren möchten, und dann den Scan starten in einem Verzeichnis auf unserer Festplatte positioniert, in dem wir die Website speichern werden. Wir müssen berücksichtigen, wie viele Links oder Inhalte eine Website aufgrund der Menge der herunterzuladenden Informationen haben kann. Das Durchsuchen der Kopie des Webs kann verwendet werden, um nach Fehlern und Schwachstellen zu suchen, die das Surfen gefährden können, sowie um festzustellen, welche Teile es bequem sind, zu verschlüsseln oder die Sicherheit zu erhöhen.

Wenn das Ziel des Downloads darin besteht, Informationen über ein Unternehmen oder Listen von Benutzern, Telefonen oder anderen Daten insbesondere für Social Engineering zu finden oder zu versuchen, eine Website oder ein Login zu fälschen, um Benutzerdaten zu erhalten, ist HTTrack ein hervorragendes Werkzeug für beide Aufgaben.

Grafische Oberfläche mit WebHTTrack
WebHTTrack ist eine grafische Benutzeroberfläche für httrack, die von einem Webbrowser verwendet wird und erlaubt Kopien ganzer Websites für den Offline-Zugriff und ändert Links automatisch. Tools wie WebHTTrack können helfen und ermöglichen die Aktualisierung der Kopie, ohne sich die Parameter zum Herunterladen oder Kopieren einer Website und ihres Inhalts merken zu müssen. Wir können es mit dem Befehl installieren:

 sudo apt-get install webhttrack
Dann zu starte es Wir werden den gleichen Befehl schreiben:
 webhttrack
Zu Starten Sie die grafische Oberfläche, wir können direkt durch das Anwendungsmenü gehen und Wir suchen die Anwendung Browse Mirrored Websites.

Eine andere Möglichkeit besteht darin, einfach, wie bereits erwähnt, aus dem Terminalfenster den Befehl webhttrack zu schreiben, um einen lokalen Webserver auf Port 8080 zu starten, dann öffnen wir den Browser unter Berücksichtigung, dass er sich nicht im Inkognito- oder Privatmodus befindet und im Browser schreiben wir die Adresse localhost: 8080.

Dies zeigt uns den grafischen Assistenten, der uns bei der Arbeit mit httrack hilft. Um zu beginnen, müssen wir die Sprache konfigurieren und auf Weiter klicken. Als nächstes konfigurieren wir ein neues Projekt, der Vorteil der grafischen Oberfläche besteht darin, dass wir die Daten der heruntergeladenen Websites und die verwendeten Parameter in einer Textdatei speichern können.

Als nächstes weisen wir die Website zu, die wir kopieren werden:

Dann konfigurieren wir in Optionen definieren die Parameter und Filter über einen Assistenten:

Nachdem wir die Filter konfiguriert haben, beginnen wir auf dem nächsten Bildschirm mit dem Scan.

Nachteile der Verwendung von HttrackDie Verwendung des Httrack-Tools zum Durchführen dieser Art des Scannens und Herunterladens von einer Website hat einige Nachteile wie die folgenden:

  • Es erfasst keine dynamischen Inhalte oder skriptgesteuerten Seiten.
  • Das Herunterladen von zu großen Sites oder mit großen Dateien kann zum Absturz des Servers führen.
  • Wenn wir httrack in zu vielen gleichzeitigen Verbindungen mit derselben Website verwenden, könnten wir den Server verlangsamen oder außer Betrieb nehmen.

Das Tutorial, in dem ein Code zum Verfolgen von Links erstellt wird, könnte für Sie von Interesse sein:

Verfolgen Sie Weblinks mit Python

Hat dir dieses Tutorial gefallen und geholfen?Sie können den Autor belohnen, indem Sie diesen Knopf drücken, um ihm einen positiven Punkt zu geben
wave wave wave wave wave