Apache Solr

Beste selbst gehostete Suchmaschinen

Beste selbst gehostete Suchmaschinen
Weiß dein Chef, dass du einen anderen Job suchst? Haben Sie Ihrem Lebensgefährten davon erzählt, dass Sie nicht entscheiden können, ob Sie Kinder haben möchten oder nicht?? Wissen deine Eltern von deiner sexuellen Orientierung?? Nun, Google und andere große Suchmaschinen tun es.

„Die meisten Benutzer suchen bei Google, während sie angemeldet sind, sodass alle Informationen zu ihrem Online-Leben verfügbar sind: YouTube-Suchen, E-Mails und vergangener Suchverlauf“, sagt Adam Tauber, der leitende Entwickler der datenschutzkonformen Metasuchmaschine Searx.

Natürlich könntest du Tor für die Anonymität verwenden und immer alle Spuren deiner Aktivität nach jeder Suche löschen, aber dies nach jeder einzelnen Suche würde höchstwahrscheinlich ziemlich schnell alt werden. Stattdessen sollten Sie erwägen, eine selbst gehostete Suchmaschine zu installieren, die Informationen für Sie abrufen kann, ohne etwas Sensibles über Sie preiszugeben.

Wir haben zwei solcher Suchmaschinen ausgewählt und stellen auch drei zusätzliche Suchmaschinen vor, um Ihnen zu zeigen, dass es bereits hervorragende Alternativen zu proprietären Suchmaschinen wie Google oder Bing gibt und die einfacher zu installieren und zu verwenden sind, als Sie vielleicht denken.

1. YaCy

YaCy ist eine kostenlose verteilte Peer-to-Peer-Suchmaschine, deren Kernkomponente in Java geschrieben ist. Da alle YaCy-Benutzer gleich sind und die Suchmaschine keine Benutzersuchanfragen speichert, ist eine Zensur einfach nicht möglich.

Derzeit indiziert YaCy etwa 1.4 Milliarden Dokumente in seinem Index dank der Aktivität von mehr als 600 Peer-Betreibern, die jeden Monat dazu beitragen. Zum Vergleich: Der Google-Suchindex enthält Hunderte von Milliarden Webseiten und ist weit über 100.000.000 Gigabyte groß.

Obwohl YaCy noch einen langen Weg vor sich hat, um mit den größten zentralisierten Suchmaschinen der Welt mithalten zu können, ist es bereits als Suchportal für private Intranets und projektspezifische Anwendungen nutzbar, da YaCy als eine einzige Search Appliance ohne Vernetzung mit anderen betrieben werden kann Gleichaltrigen.

YaCy lässt sich dank seiner einfachen Code-Schnipsel, die sich mühelos und ohne Modifikationen kopieren und einfügen können, problemlos in jede Webseite integrieren.

2. Searx

Searx wird als eine datenschutzkonforme, hackbare Metasuchmaschine beschrieben. Es ist unter der GNU Affero General Public License Version 3 verfügbar und sein Hauptziel ist es, die Privatsphäre seiner Benutzer zu schützen, indem es niemals die IP-Adressen oder den Suchverlauf der Benutzer mit den Suchmaschinen teilt, aus denen es Ergebnisse sammelt.

„Bei Searx wird standardmäßig die IP-Adresse von Searx, ein zufälliger User-Agent und eine Suchanfrage an Google gesendet“, erklärt Adam Tauber, alias asciimoo, die Funktionsweise seiner Metasuchmaschine. „Natürlich können Sie Searx so anpassen, dass weitere zusätzliche Parameter wie die Suchsprache oder die Seitennummer der angeforderten Ergebnisseite weitergeleitet werden.”

Searx blockiert automatisch alle Tracking-Cookies, die von den Suchmaschinen bereitgestellt werden, um eine Änderung der Ergebnisse auf der Grundlage von Benutzerprofilen zu verhindern, die daraus resultieren können, dass eine Suchmaschine versucht, eine Suche zu implementieren, die basierend auf dem Wissen der Suchmaschine über den Benutzer individualisiert ist. Searx ist zu 100 Prozent kostenlos und jeder kann es nach Bedarf ändern. Sie können sogar den Searx-Code nehmen und die Metasuchmaschine auf Ihrem eigenen Server ausführen, was definitiv alle Bedenken ausräumen sollte, die Sie in Bezug auf Protokolle haben könnten.

3. ElasticSearch

ElasticSearch ist eine Suchmaschine basierend auf Lucene, einer kostenlosen Open-Source-Softwarebibliothek zum Abrufen von Informationen, die von der Apache Software Foundation unterstützt wird und unter der Apache Software License veröffentlicht wird.

ElasticSearch bietet eine Volltextsuchmaschine mit einer HTTP-Webschnittstelle. Mit der Suchmaschine können alle Arten von Dokumenten durchsucht und problemlos auf mehrere Knoten verteilt werden.

Es ist möglich, mit ElasticSearch und Docker eine selbst gehostete Suchmaschine zu erstellen. Ein Tutorial, das den Prozess beschreibt, finden Sie hier.

4. Ambar

Ambar ist eine Open-Source-Dokumentensuchmaschine mit vielen nützlichen Funktionen. Es unterstützt automatisiertes Crawling, Tagging und sofortige Volltextsuche, um nur einige Beispiele zu nennen. Eine der aufregendsten Funktionen von Ambar ist die Möglichkeit, OCR für Bilder und PDF-Dateien durchzuführen. Zu den unterstützten Sprachen gehören Englisch, Deutsch, Russisch, Italienisch, Französisch, Spanisch, Polnisch und Niederländisch.

Ambar kann ganz einfach mit einer einzigen docker-compose-Datei bereitgestellt werden. Hier erfahren Sie, wie es geht.

5. Apache Solr

Apache Solr wurde in Java geschrieben und ist eine Plattform für die Unternehmenssuche, die Volltextsuche, Trefferhervorhebung, Facettensuche, Echtzeitindexierung, dynamisches Clustering und viele andere wichtige Funktionen umfasst. Es wurde 2004 für ein internes Projekt bei CNET Networks erstellt. CNET Networks hat es 2006 freundlicherweise der Apache Software Foundation gespendet, wo es 2007 vom Inkubationsstatus in ein eigenständiges Top-Level-Projekt übergegangen ist.

Heute ist Solr eine äußerst zuverlässige, skalierbare und fehlertolerante Suchplattform für Unternehmen, die die Such- und Navigationsfunktionen vieler der weltweit größten Websites wie DuckDuckGo, eHarmony und BestBuy unterstützt. Sie können

So installieren und konfigurieren Sie YaCy

Die Installation von YaCy ist sehr einfach und dauert nur wenige Minuten, da Sie keine externe Datenbank oder einen Webserver installieren müssen - YaCy wird mit allem geliefert, was Sie brauchen.

  1. Gehen Sie auf die offizielle Website von YaCy und laden Sie das neueste Paket für Linux herunter.
  2. Installieren Sie die OpenJDK 8-Laufzeitumgebung.
    • Wenn Sie eine Debian-basierte Distribution verwenden, verwenden Sie den folgenden Befehl: $ sudo apt-get install openjdk-8-jre
    • Wenn nicht, befolgen Sie die spezifischen Anweisungen für Ihre Distribution.
  3. Extrahieren Sie das heruntergeladene Paket an Ihren bevorzugten Speicherort.
  4. Gehe in den neuen Ordner und starte das „startYACY.sh“-Skript im Terminal.
  5. Sie sollten eine Bestätigungsnachricht sehen, die Sie darüber informiert, dass YaCy als Daemon gestartet wurde

Fazit

Suchmaschinen wissen mehr über uns, als die meisten Menschen zugeben möchten. Wenn Sie aufhören möchten, große Konzerne mit saftigen Daten zu versorgen, können Sie die Dinge selbst in die Hand nehmen und eine selbst gehostete Suchmaschine einrichten, um Ihre Privatsphäre zu schützen. Obwohl selbst gehostete Suchmaschinen noch einen langen Weg vor sich haben, um vollständig nutzbar zu werden, ist das Potenzial für sie, Google wie Google zu übertreffen, vorhanden und es geht nur darum, mehr Nutzer anzuziehen.

Vulkan für Linux-Benutzer
Mit jeder neuen Grafikkartengeneration stoßen Spieleentwickler an die Grenzen der grafischen Wiedergabetreue und kommen dem Fotorealismus einen Schrit...
OpenTTD vs. Simutrans
Das Erstellen einer eigenen Transportsimulation kann Spaß machen, entspannend und äußerst verlockend sein. Deshalb sollten Sie so viele Spiele wie mög...
OpenTTD-Tutorial
OpenTTD ist eines der beliebtesten Wirtschaftssimulationsspiele auf dem Markt. In diesem Spiel musst du ein wunderbares Transportunternehmen aufbauen....