Suchmaschine für Dateien: FindFiles.net findet Musik, Hörbücher, eBooks…

von

Wer mit Google das Internet durchsucht, findet Webseiten mit Text, ferner Bilder und Videos. Dabei stehen im Netz noch viel mehr Dateitypen zur Verfügung. Ein neuer Versuch, sie auffindbar zu machen, ist FindFiles.net, wo man u.a. nach Software, Musik, Hörbüchern, eBooks, Dokumenten für Excel, Word etc. suchen kann. Wir haben ein Interview mit dem FindFiles-Sprecher Claudius Gros von der Goethe-Universität Frankfurt geführt und stellen die Suchmaschine vor.

Die Oberfläche von FindFiles.net ist denkbar einfach (und lehnt sich – natürlich – an Google an). Im ersten Schritt wie üblich den Suchbegriff eingeben:

findfiles start

Im zweiten Schritt kann dann zwischen den Dateiarten gewählt werden. Zunächst über die Reiter oben (Text, Dokumente, Audio, Video…), dann über die genauen File-Typen im Fenster (in diesem Beispiel für Audio: wav, mp3, ram…).

findfiles search

Und das wär’s auch schon – jetzt können die Ergebnisse in der Unterkategorie durchsucht werden. Findfiles verzeichnet derzeit nahezu 400 Millionen (!) Dateien, so dass man viel zu durchstöbern hat. Die Bandbreite reicht von Soundschnipseln über Android- und Symbian-Apps zu CAD-Plänen, Exe- und Zip-Dateien, Flash-Spielen und Feeds – und auch für Powerpoint-Karaoke wird man natürlich hier fündig.

Eine Suchmaschine für alle möglichen Dateitypen stellt natürlich noch einmal andere Fragen und Problematiken als eine Text/HTML-Suchmaschine. Claudius Gros, Professor für Theoretische Physik an der Goethe-Universität Frankfurt am Main, gab uns in seiner Eigenschaft als FindFiles-Sprecher die Antworten.

Interview mit FindFiles-Sprecher Claudius Gros

Seit wann gibt es FindFiles und was ist die Idee hinter der Suchmaschine?

Claudius Gros: FindFiles.net ist seit Anfang 2011 aktiv. FindFiles.net betreibt einen eigenen Crawler, welcher, im Gegensatz zu anderen Suchmaschinen, jedoch ausschließlich Dateien indiziert und keine Html-Seiten. Derzeit haben wir Links zu zirka 400 Millionen Dateien im Index, wir rechnen im Endausbau mit deutlich über einer Milliarden Dateien.

Die Idee hinter dieser Suchmaschine ist es, diesen großen Schatz an Informationen und Dateien der Webgemeinde barrierefrei, also ohne Registriereung oder Captchas, zugänglich zu machen. FindFiles.net soll sich in ein `Suchportal’

für Dateien entwicklen. Eine ganze Reihe von Mehrwertdiensten sind geplant, um die Dateiensuche mit FindFiles.net komfortabler zu gestalten. Als erstes planen wir (relativ kurzfristig), einen Viruscheck anzubieten. Damit wird es möglich sein, die Dateien vor dem Runterladen auf Malware hin zu überprüfen.

Wie ergibt sich das Ranking der Ergebnisse? Bei Texten kann man z.B. nach Wörterdichte oder Verlinkung gehen, wie funktioniert das bei Files?

Claudius Gros: FindFiles.net untersucht nicht den Inhalt von Dateien, aus zwei Gründen. Bei vielen Datei-Typen, wie exe-Programmen, wäre dieses entweder technisch gar nicht möglich oder sinnvoll. Zum anderen ist FindFiles.net keine Text-Suchmaschine, sondern eine Datei-Suchmaschine. Es stellt sich heraus, dass sehr viele Dateien im Netz sehr gut durch Datei-Namen, Link-Text, Pfad-Text, etc. beschrieben werden und auffindbar sind. Diesen Umstand benutzt FindFiles.net zum Ranking.

Wie kann sicher gestellt werden, dass die Ergebnisse von legalen Quellen stammen?

Claudius Gros: Keine automatisch arbeitende Suchmaschine kann das sicherstellen. Doch es gibt einige Vorsichtmassnahmen, welche getroffen werden können und welche FindFiles.net befolgt.

  • Der Crawler von FindFiles.net ist ein “guter Crawler” und befolgt u.A. die “nofollow”-Anweisung. Anbieter von geschützten Dateien können also sicherstellen, dass ihre Dateien nicht von FindFiles.net indiziert werden.
  • FindFiles.net indiziert nur Dateien, welche auf dem gleichen Host gespeichert werden wie die referierende Webseite. Damit sind praktisch alle Dateien, welche auf File-locker (4shared, rapidshare, … ) und anderen Filesharing-Seiten angeboten werden, von der Indizierung ausgeschlossen.
  • FindFiles.net stellt zu jedem Download-Link einer Datei immer auch den Link zu referrierenden Html-Seite bereit. Der Nutzer hat also immer die Möglichkeit, sich selber aus erster Hand über Nutzungsbedingungen etc. zu informieren.

Vielen Dank für das Interview.

FindFiles – Erste Sucheindrücke

Bei ersten Testläufen mit FindFiles.net stößt man auf sehr, sehr viele Ergebnisse – für die man sich fast noch ein paar Filter- oder Vorschaufunktionen mehr wünschen würde. So wäre eine Sprach-Einschränkung z.B. für Dokumente und Hörbücher sinnvoll – so ist der Großteil eben auf Englisch, außerdem eine Vorschau bei Bildern und Videos. Die große Stärke ist wirklich das gezielte Suchen nach bestimmten Dateitypen, die man bei Google nicht findet. Das bietet sich also für Wissenschaft und Spezialisten an, aber auch für Sounddesigner und Stöberer. Ein spannendes Projekt.

Download
FindFiles.net – Die Datei-Suchmaschine
Findet diverse Filetypen, von eBooks bis Software


Kommentare zu diesem Artikel

Neue Artikel von GIGA SOFTWARE

Anzeige
GIGA Marktplatz