Mach mal weg mit der doofen Suche!
17. Oktober 2008, 0.05 Uhr von Sven WagenhöferWenn man eine Suchfunktion auf der eigenen Seite haben will, gibt es ein paar Möglichkeiten, wie das anzugehen ist. Zum Beispiel Datenbanktabellen durchsuchen, indizierte sind dabei am Besten. Resultat sind direkte Suchergebnisse aus dem eigenen Content, die können gemischt oder in diskreten Blöcken präsentiert werden. Letzteres haben wir damals bei onlinekosten.de so gemacht, und so schlecht kann es nicht gewesen sein, denn die Kollegen dort nutzen das minimal geänderte System immer noch. Sogar der Parameter “iwantmore” ist gleich geblieben, da werden alte Erinnerungen wach. Die zweite Möglichkeit ist die eigene Suchmaschine für den Server ? kann gut sein, kann aber auch ziemlich in die Hose gehen.

Pocketbrain als Schnecke – das muss nicht sein.
Dann nämlich, wenn auf einmal massiv viele Seiten im Index landen ? und dieser schlichtweg den Server plattmacht. Da skaliert natürlich jede Suchlösung unterschiedlich. Ziemlich gute Erfahrungen habe ich persönlich mit Apache Lucene, sei es nun in der PHP oder in der Java-Variante. Die präsentiert sinnvolle Ergebnisse, ist einfach zu verstehen und ziemlich fix. Ziemlich schlechte Erfahrungen habe ich mit der Typo3-Suchmaschine “indexed search”. Die präsentiert sinnvolle Ergebnisse, ist einfach zu verstehen und wahnsinnig lahmarschig.
Sind nur wenige Seiten im Index merkt man das noch nicht. Dank Softwareshop ging die Seitenzahl bei Pocketbrain jedoch steil nach oben, Google behauptet, es wären etwas um die zwölftausend. Trotz Umzug auf einen neuen Server blieb die Seite langsam. Dank Cache war das im Frontend noch erträglich, aber Kollege Giesecke konnte im Backend warten und warten. In allen Typo3-Optimierungsanleitungen gibt es einen Hinweis, der sich ständig wiederholt ? weg mit “indexed search”. Das ist heute abend passiert. Datenbankgröße vorher: 320,8 MB. Datenbankgröße danach: 54,0 MB. Hossa, und die Tabelle mit über 3 Millionen Einträgen ist auch endlich platt.
Auch wenn mich persönlich eine abgewandelte Form von Variante zwei gereizt hätte, zum Beispiel ein Typo3-Lucene-Plugin zu schreiben, sind wir aus Zeitgründen auf Variante drei ausgewichen. Warum selbst Expertise anhäufen, wenn das auch andere machen können? Aus diesem Grund verrichtet jetzt Google seinen Suchdienst bei uns, fancy neumodisch über AJAX eingebunden. Bisher allerdings nur in der “Basic”-Variante, ein wenig Customizing und Schnick-Schnack wird noch nachgeliefert. Nachteile hat auch diese Variante. Wir haben keine Kontrolle mehr über die Inhalte der Suche, machen uns von Google abhängig, können nicht selbst sortieren, machen uns von Google abhängig, sperren momentan User mit deaktiviertem JavaScript aus und machen uns von Google abhängig. Aber ? es funktioniert. Schnell und simpel liefert Google uns ? zumindest nach den ersten Stichproben ? relevante Suchtreffer. Kein Wunder, sitzen da doch ein paar schlaue Köpfe an den Entwicklertischen.
Ist Google jetzt der Weisheit letzter Schluss? Nein, bestimmt nicht. Irgendwann würde ich mich über eine eigene Pocketbrainsuche freuen. Die dann auch nur die wichtigen Infos aus den Seiten aufnimmt. Oder bei der Bildersuche auch nicht sichtbare Metadaten berücksichtigt. Bis dahin tut Google den Job aber gut ? und vor allem schnell.
Kommentare abonnieren (RSS)
Trackback-URL


18. Oktober 2008 um 00.52 Uhr
*hüstel*
Meinst Du nicht, die Kollegen mit den Southpark-Servernamen haben das System noch, weil ein gewisser Herr B., aka. Daniel Küblböck, einfach keine Kohle springen lässt?