Facettierte Suche: Nutzen Sie Endeca & Lucene effektiv für die Suchmaschinenoptimierung

Facettensuche war früher ziemlich selten. Jetzt scheint es überall zu sein! Es ist eines der Probleme, die heutzutage bei E-Commerce-Websites am häufigsten auftreten, wenn Sie die Suchsichtbarkeit von Websites mit dieser Funktion in Frage stellen. Wir bei Flying Point Digital stoßen immer wieder auf die gleichen Probleme, und aus SEO-Sicht ist es nicht einfach "bessere Kategorieseiten erstellen". Das ist zwar ein wichtiger Teil der Lösung, aber nur die halbe Wahrheit.

Danke, Captain Obvious

Es gibt genug Versehen oder Missverständnisse darüber, was mit der facettierten Suche vor sich geht und wie gut diese Site-Navigationstechnik für die Suchmaschinenoptimierung sein könnte , sodass es an der Zeit ist, einen Artikel zu schreiben. Es ist dieselbe, uralte, zufällige Spinnenfallengeschichte, aber mit einer Wendung. Oder sollten wir mit neuen Dimensionen sagen. Für diejenigen, die schon seit einiger Zeit in der SEO-Branche tätig sind, ist dies wahrscheinlich eine Fülle von Informationen, um das Problem abzuleiten und zu beheben. Die facettierte Suche erzeugt eine Spinnenfalle, die so groß ist wie jede Kombination möglicher Facettenauswahlen, solange Ihre Navigation "suchfreundlich" ist.

Problem definiert. Implizite Lösungen. Sie können salzige alte Hunde der SEO-Branche weggehen. Lesen Sie weiter, wenn Sie zum ersten Mal davon erfahren oder sich damit befassen. Wir werden Sie zuerst in die Geschichte eintauchen lassen, in die schlimme Situation, die derzeit auf solchen Websites häufig herrscht, und dann schließlich ein paar allgemeine Vorschläge für eine mögliche Lösung machen.

Wir werden Sie zuerst in die Geschichte eintauchen lassen, in die schlimme Situation, die derzeit auf solchen Websites häufig herrscht, und dann schließlich ein paar allgemeine Vorschläge für eine mögliche Lösung machen

Millionen-Produktkataloge

Überall dort, wo es E-Commerce mit großen Katalogen von Millionen oder sogar nur Zehntausenden von Produkten gibt, gibt es strukturierte Daten wie Preis, Farbe und Größe, die alles beschreiben. Und der Begriff, der gewählt wurde, um die Benutzeroberflächen zu beschreiben, die für das Suchen und Filtern mit solchen Produktbeschreibungen entwickelt wurden, ist facettenreich.

Facettierte Suche ist nur eine Auswahl von Filtern, auf die Sie klicken können, um Ihre Suche zu verfeinern. Hier gibt es einige formale Definitionen und eine implizite Unempfindlichkeit gegenüber Bestellungen (die in der Drilldown-Navigation nicht vorhanden ist). Ein Drilldown durch auftragssensitive Menüs (wie zum Beispiel Web-Hyperlinks) impliziert eine gewisse Endgültigkeit Ihrer Erkundung. Alles, was Sie "finden", entspricht Dateien auf einer Festplatte oder Knoten in einem Baum. Während es möglich ist, ist es einfach schwieriger, Spinnenfallen mit Drilldown-Navigation zu erstellen. So funktioniert meistens das Web, und das hat Google Search-and-Index zu einem so brillanten und effektiven System gemacht. Dies hat Google auch zu einem unfairen Ruf verholfen, dynamische Websites nicht zu mögen.

Spinnenfallen und gemischte Botschaften

Sobald ein Fragezeichen in die URL eingefügt wird, wird die Site als "dynamisch" eingestuft und kann für immer fortgeführt werden. Stellen Sie sich eine Kalender-Webseite vor, auf der Sie immer auf den Link "Nächster Tag" klicken können. So einfach ist es, eine Spinnenfalle zu bauen. Und es ist nicht das Vorhandensein des Fragezeichens, das die Website in irgendeiner Weise dynamisch oder schlecht oder für Google unlesbar macht. Es ist so, dass das Fragezeichen auf den Arten von Websites vorhanden ist, die Google irgendwann beiseite legen muss, um mit dem Crawlen von Websites fortzufahren, die die Dinge nicht unglücklich machen. Andernfalls würden alle scheinbar unendlichen Ressourcen von Google für das Crawlen dieses einfachen unendlichen Kalenders auf einer kleinen Website aufgewendet.

Dynamische Websites (oder URLs) sind nicht von Natur aus schlecht, wie manche Leute glauben. Schlimm ist, wie einfach es ist, versehentliche Spinnenfallen zu bauen und nie zu merken, dass Sie überhaupt ein Problem haben. Von Googles Seite gelangen sie nur auf realistische Weise auf die nächste Website, damit sie nicht allzu viel Zeit damit verbringen, ihre Räder zu drehen. Google hat heutzutage eine viel größere Bereitschaft, unerschrocken in Spinnenfallen einzutauchen, ein paar Millionen Seiten zurückzuziehen und zu sehen, ob sie keinen Sinn ergeben.

In diesem Artikel konzentrieren wir uns auf eine bestimmte Art von dynamischer URL-Spider-Trap, die durch das häufig als Facettensuche bezeichnete Navigationsschema generiert wird. Fun Wort, Facetten. Erinnert Sie an die Schnittflächen eines Schmuckstücks. Ich denke, das dient dem E-Commerce-Geschäft in Ordnung und es ist einfacher, willkürlich parametrisierte oder zugeschriebene oder mehrdimensionale oder feldgefilterte Suche zu sagen. Nicht alle parametrisierten Suchen sind Facetten. Facetten neigen dazu, sich in unterschiedlichen Reihenfolgen und scheinbar unendlichen Permutationen zu bewegen - beides, was sie zu "Facetten" und solch einer besonders üblen Spinnenfalle macht.

Endeca und Lucene

Wir bemerken häufiger Probleme mit facettierten Such-Websites, da es jetzt einfacher ist, Websites zu erstellen, die diese verwenden. Früher war diese Navigationstechnik aufgrund der Kosten und des Know-hows, die für die Einrichtung erforderlich waren, sowie der hohen Serveranforderungen für die Bereitstellung dieser Funktion (mit genauen Daten) im Maßstab erheblich seltener. Das ändert sich. Unabhängig davon, in was Ihre Daten eingeschlossen sind, können einige Produkte wie Endeca (jetzt von Oracle) oder Lucene (ein Apache-Projekt) sie durchsuchen und die Datenbank und die Indizes erstellen, die für die Verbindung zu den Komponenten für die Site-Erstellung erforderlich sind, die diese Schicht facettierte Suchen Sie in einer Site.

Endeca ist seit langem die führende kommerzielle Software für Unternehmen, die Facettensuche anbietet. Aus diesem Grund wird der Name bei diesem Thema so oft verwendet. Sie werden natürlich für dieses Vertrauen bezahlen. Wenn Sie jedoch Ihr eigenes Vertrauen und ein starkes Entwicklerteam haben, gibt es die nicht proprietäre (kostenlose und Open Source) Software-Stack-Alternative von Lucene.

Lucene, wie mir gesagt wurde - da ich mit diesem speziellen Software-Stack kein erfahrener Entwickler bin - macht fast alles, was Endeca tut, auch mit Leistung auf Unternehmensebene, aber kostenlos. Wie bei Endeca gibt es wirklich eine ganze Reihe von Einzelprodukten, die in einer Art Ökosystem zusammenarbeiten. Die Spitze dieses Ökosystems ist die Apache Software Foundation (vergleichbar mit dem Unternehmen), dann das Lucene-Projekt (vergleichbar mit dem Produkt) und danach der Teil, der die eigentliche Web-Benutzeroberfläche erstellt - entweder Solr oder Elastic Search.

Das ganze Lucene- und Endeca-Zeug ist zugegebenermaßen das IT-Infrastruktur-Zeug, mit dem "The Cloud" Sie nicht befassen müssen und das ein bisschen altmodisch wirkt. Wenn Sie ein kleineres Unternehmen sind oder einfach keine Implementierungsprobleme haben möchten und die am besten vereinbarten Best Practices sofort anwenden möchten und dennoch als Enterprise-Klasse gelten, gibt es immer Demandware oder eine eine Vielzahl anderer Produkte, die die Nischen zwischen Endeca / Lucene auf der einen Seite und einer selbst gehosteten Instanz von WooCommerce auf WordPress auf der anderen Seite füllen.

Darüber hinaus bieten alle großen Technologieunternehmen wie IBM, Microsoft und SAP auch Lösungen für das Problem der facettenreichen Websuche. Endeca und Lucene sind die Namen, die immer wieder auftauchen, wenn Sie als SEO diese Probleme angehen. Dies ist also eine einfache Möglichkeit, diese facettenreiche Suchdiskussion zu gestalten. Denken Sie jedoch daran, dass es wirklich an jedem Ende des Spektrums andere gibt. und unzählige mehr dazwischen. Wenn Sie zum Beispiel diese Cloud-Leichtigkeit von Demandware möchten, aber die Möglichkeit haben, eines Tages alles in Eigenregie zu erledigen, um mit extremen Anpassungen zu beginnen, um Wettbewerbsvorteile zu erzielen, dann gibt es Hybris im oberen und Magento im unteren Bereich.

Zwei extreme Szenarien

Letztendlich haben alle diese Infrastrukturen jedoch eine Form der facettenreichen Suche und müssen sich mit denselben Problemen befassen. Im Allgemeinen fällt die facettierte Suche in eine von zwei Kategorien. Alle Millionen potenzieller Seiten, die "ermöglicht" werden, sind entweder:

  1. Völlig unsichtbar für die Suche aus dem einen oder anderen Grund
  2. Sichtbar für die Suche, erstellt jedoch eine Site, die Googlebot nie vollständig durchsucht und durchsucht

Im ersten Szenario sind für die Suche unsichtbare facettierte Suchwebsites entweder unsichtbar, weil die Benutzeroberfläche aus altmodischen CGI-Formularelementen besteht und eine Übermittlung oder die Ausführung von JavaScript erforderlich ist, damit die Suche ausgeführt werden kann, oder sie kann tatsächlich gecrawlt werden. Die Websitebesitzer haben jedoch die Möglichkeit von Google, die Website über robots.txt oder einen anderen Mechanismus zu crawlen / indizieren, "deaktiviert" - normalerweise, weil sie unter den Schmerzen der Situation Nummer zwei gelitten haben.

In der zweiten Situation kann Google die gesamte facettierte Such-Website und alle potenziellen Seiten, die sie generieren kann, perfekt crawlen. Die Seiten werden jedoch nie beendet, und 99% dieses nie endenden Crawlvorgangs sind doppelter Inhalt. Mit anderen Worten, es ist eine Spinnenfalle. Google sieht Ihre gesamte Website, aber aufgrund der Lächerlichkeit der vor Ihnen gestellten Aufgabe gibt Google auf und wechselt zur nächsten Website.

Selten gedacht, aber von entscheidender Bedeutung ist, dass diese Spinnenfalle einen Einfluss auf Ihr Suchranking hat, indem sie die "Kernmenge" wichtiger Seiten, die Ihre Website generieren kann / sollte und die leicht zu positionieren sind, verwässert oder vollständig verschleiert -Entdecken Sie Klickpfade (Haupt- und Nebennavigation) und passen Sie sie an bekannte gesuchte und bekannte Conversion-Keywords an.

Denken Sie in realen Bäumen

Der Trick besteht also darin, diesen Kernsatz von Seiten wie den Hauptstamm und die Zweige eines Baumes zu beleuchten. Diese stellen möglicherweise die ersten beiden ausgewählten Facetten oder einen anderen Mechanismus zum "Definieren des Kernsatzes von Seiten" dar, der auf die Ziele Ihrer Keyword-Recherche abgestimmt ist. Stamm und Zweige sind Kern. Sie sind Ihr Master-Set kanonischer, nicht duplizierter Seiten - unabhängig davon, ob sie tatsächlich durch Auswahl facettierter Suchparameter erstellt wurden oder nicht. (Ihre Kernseiten könnten durchaus aus diesen bestehen).

Selbst wenn Ihre Site Millionen von Seiten mehr generieren kann, kann dieser "Kern" von 100 bis 10.000 Seiten Ihr kanonisches Master-Set sein. Alle anderen Millionen größtenteils duplizierter Variationen könnten kanonische Tags besitzen, die zur am besten übereinstimmenden URL aus dem Kernsatz zurückführen. Ja, es könnte einige kundenspezifische Entwicklungsarbeiten geben, wenn Sie E-Commerce-Plattform unterstützt keine solchen Out-of-the-Box-Tricks.

Und das ist nur einer der Ansätze, um diese Spinnenfallen unter Kontrolle zu bekommen - lassen Sie alles indizieren ... lassen Sie die Spinnenfalle weiter existieren ... aber seien Sie Google klar darüber, was los ist und wie allfälliges Kriechen am Endeffekt vorbei ist. Offensichtlicher Kern / wichtig-Satz ist übertrieben und möglicherweise unnötige Arbeit. Eine Google-Suche mit einem Site-Modifikator sollte ungefähr so ​​viele kanonische Kernseiten enthalten, wie Sie jetzt deutlich bewerben - und NICHT den Rest, den Sie zugeben, sind Permutationen mit niedriger Priorität.

Die besten Lösungen sind immer solche, bei denen nur eine begrenzte Anzahl von Seiten von einer Website generiert werden kann und Google sie alle in wenigen Tagen durchblättern kann. Versuche zu rennen Schreiender Frosch gegen eine Site (mit viel Speicher). Wenn es nie zu Ende geht, haben Sie möglicherweise eine Spinnenfalle.

Es ist wie bei jedem Baum, es könnte schwierig sein, aber man könnte tatsächlich die Blätter zählen! Es ist möglich, aber du wirst fertig. Ebenso wird Screaming Frog das Crawlen einer richtig endlichen Site beenden.

Ordnungsfragen - Reduzieren Sie die Permutationen

Eine bestimmte Hybridisierung von Facetten kann dabei helfen, die Situation in den Griff zu bekommen. Beispielsweise können bestimmte Facetten nur in Kombination mit bestimmten anderen Facetten aktiviert werden, um die Einschränkungen der Datenbeziehung zu berücksichtigen und durchzusetzen. Sie können dies als eine Kombination des viel endlicheren Drilldown-Navigationsschemas mit Suchfacetten betrachten. (Facetten werden speziell auf bestimmten Drilldown-Ebenen dargestellt.) Drilldown-Navigation erzwingt in der Regel eine bestimmte Reihenfolge für die Parameter der Abfragezeichenfolge (als Ordner verschleiert oder nicht).

Sie können Ihre URLs auch sorgfältig mit einer bestimmten erzwungenen Reihenfolge für die Facetten erstellen, sodass Sie nur mit Kombinationen statt mit Permutationen arbeiten. (Führen Sie eine Suche nach "Kombinationen vs. Permutationen" durch.) Wenn Sie in einem Fall die Facette A und dann die Facette B, in einem anderen Fall jedoch die Facette B und dann die Facette A auswählen, unterscheiden sich die URLs Seite das gleiche. Dies kann durch einfaches Alphabetisieren oder Verwenden einer voreingestellten Reihenfolge für die Darstellung der Parameter in der URL behoben werden.

Und schließlich erinnern wir uns daran, dass wir uns an die Baummetapher für die Standorthierarchie halten. Der Zweck eines Baums besteht darin, seine Zweige, Zweige und Blätter so auszubreiten, dass eine Oberfläche mit Blättern entsteht, die das Sonnenlicht am effizientesten einfängt. Die Evolution hat Bäume so geformt, dass sie nicht über den Punkt hinaus wachsen, an dem sie das Licht am effizientesten einfangen.

Eine Site künstlerisch gestalten

Wie bereits in diesem Artikel ausgeführt, machen die meisten facettierten Such-Websites ihre Website entweder für die Suche unsichtbar oder führen zu einer unmöglichen Durchforstung. Die eigentliche Antwort liegt irgendwo in der Mitte - eine künstlerische Gestaltung. Es gibt viele Möglichkeiten, dies umzusetzen, angefangen von Anpassungen an Ihrer robots.txt-Datei über das Ändern Ihrer Einstellungen in der Google Search Console (ehemals Webmaster-Tools) bis hin zum Ändern der Meta-Tags in Ihrer Ansichtsquelle.

Die Lösungen sind vielfältig und sollten alle von einer übergreifenden Keyword-Targeting-Strategie geleitet werden und auf dem basieren, was von Ihrer Technologieplattform unterstützt und von Ihrem Team implementiert werden kann. Im Gegensatz zu natürlichen Bäumen, deren maximale Form durch die Einschränkungen der Natur definiert wird, können facettierte Websites ungehemmt wachsen, und Sie werden es möglicherweise nie erfahren - es sei denn, Sie erzielen in Google keine guten Ergebnisse.