Fasirani Traži Gone Wild: Učinkovito Utjecati Endeca i Lucene za SEO

Fasirana pretraga je bila prilično rijetka. Sada, čini se da je svugdje! Pogrešno uočavanje pojedinosti o načinu na koji raspravljate o vidljivosti web-lokacija s ovom značajkom jedna je od stvari koje se danas najčešće krše na web-lokacijama e-trgovine. Na istom problemu stalno se susrećemo u Flying Point Digitalu, a iz SEO-perspektive, to nije jednostavno "napraviti bolje kategorije stranica". Iako je to važan dio popravka, to je samo pola priče.

Hvala, kapetane očito

Ima dovoljno nadzora ili pogrešne predodžbe o tome što se događa s fasetiranim pretraživanjem i koliko je dobra tehnika navigacije na web-mjestu za SEO, da je vrijeme da smo napisali članak. To je ista, prastara, slučajna priča o zamci pauka, ali s preokretom. Ili, treba li reći s novim dimenzijama. Za one koji su u SEO industriji neko vrijeme, to je vjerojatno mnogo informacija kako bi se zaključilo i riješilo problem. Fasirano pretraživanje stvara paukovu zamku jednako velikoj koliko i svaka kombinacija mogućih aspekata, sve dok je vaša navigacija "prijateljska za pretraživanje".

Problem definiran. Rješenja implicitna. Vi slanih starih pasa SEO industrije možete otići. Za one koji upravo o tome čuju ili se bave po prvi put, čitajte dalje. Najprije ćemo vas uroniti u povijest, lošu situaciju koja često postoji na takvim mjestima, a zatim napokon postaviti nekoliko širokih poteza jednog mogućeg rješenja.

Najprije ćemo vas uroniti u povijest, lošu situaciju koja često postoji na takvim mjestima, a zatim napokon postaviti nekoliko širokih poteza jednog mogućeg rješenja

Milijuni kataloga proizvoda

Gdje god postoji e-trgovina s velikim katalozima milijuna ili čak samo nekoliko desetaka tisuća proizvoda, postoje strukturirani podaci kao što su cijena, boja i veličina za opisivanje svega. Pojam odabran za opisivanje korisničkih sučelja izgrađenih oko pretraživanja i filtriranja pomoću takvih opisivača proizvoda je aspekt.

Fasirano pretraživanje samo su svi filtri koje možete kliknuti da biste pročistili pretraživanje, osim što ste uključili ključne riječi ili uključili navigaciju. Ovdje postoje neke formalne definicije i implicirana neosjetljivost narudžbi (koja nije prisutna na navigacijskoj ploči). Bušenje kroz izbornike osjetljive na narudžbe (kao što su web-hiperveze) podrazumijeva određenu konačnost vašeg istraživanja. Sve što "pronađete" analogno je datotekama na tvrdom disku ili čvorovima u stablu. Iako je moguće, jednostavno je teže stvoriti zamke paukova s ​​navigacijskom navigacijom. To je način na koji Web uglavnom radi, a to je ono što je učinilo Google pretraživanje i indeksiranje tako briljantnim i učinkovitim sustavom. To je također ono što je Googleu dalo nepravednu reputaciju za dinamičke web-lokacije koje se ne sviđaju.

Zamke paukova i mješovite poruke

Čim se upitnik uvede u URL, web-lokacija se smatra "dinamičnom", a web-lokacija može trajati zauvijek. Razmislite o web-stranici kalendara na kojoj uvijek možete kliknuti vezu "sljedeći dan". Stvarno je tako jednostavno stvoriti zamku pauka. I to nije postojanje upitnika koji web-lokaciju čini dinamičnom ili lošom ili nečitljivom Googleu na bilo koji način. To je to što je upitnik prisutan na vrstama web-lokacija koje Google u nekom trenutku mora ostaviti po strani, i nastaviti s poslovima indeksiranja web-lokacija koje ne čine stvari jadnima. Inače, svi naizgled beskonačni Googleovi resursi će biti utrošeni za indeksiranje jednog jednostavnog beskonačnog kalendara na jednom malom mjestu.

Dinamičke web-lokacije (ili URL-ovi) nisu inherentno loše, kao što neki ljudi osjećaju. Ono što je loše je kako je lako napraviti slučajne zamke pauka i nikada ne shvatiti da čak imate problem. Sa strane Googlea, oni su samo dobivanje na sljedeći site na neki realan način, tako da ne potrošiti sve svoje vrijeme predenje svoje kotače. Google ima mnogo više spremnosti ovih dana da neustrašivo zaroni u zamke pauka, povuče nekoliko milijuna stranica i vidi da li oni to mogu učiniti.

U ovom članku usredotočujemo se na jednu određenu vrstu dinamičke zamke paukova URL-a koju generira navigacijska shema koju često nazivamo facetirano pretraživanje. Zabavna riječ, aspekti. Misliš o izrezanim licima dragulja. Pretpostavljam da služi e-commerce biz sasvim u redu i to je lakše nego reći proizvoljno parametrizirani ili atribuirani ili višedimenzionalna ili filtrirana pretraživanja. Nisu sve parametrizirane pretrage fasete. Grane imaju tendenciju da dopuste da idu u različitim redovima i naizgled beskonačnim permutacijama - i ono što ih čini "aspektima" i takvom posebno gadnom zamkom paukova.

Endeca i Lucene

Češće primjećujemo probleme s fasetiranim web-lokacijama za pretraživanje jer je sada lakše izraditi web-lokacije koje ga koriste. Ova tehnika navigacije je bila znatno rjeđa zbog troškova i stručnosti potrebnih za postavljanje, kao i zbog zahtjevnih zahtjeva poslužitelja za isporukom ove značajke (s točnim podacima) na skali. To se mijenja. Bez obzira na vaše podatke, neki proizvodi poput Endeca (sada iz Oraclea) ili Lucene (projekt Apache) mogu proći kroz njega i izgraditi bazu podataka i indekse potrebne za povezivanje s komponentama gradnje web-lokacije koje se slojevito pretraživanje na web-lokaciji.

Endeca je dugo bila dominantan komercijalni softver u poslovnoj klasi koji nudi facetirano pretraživanje - zbog čega čujete kako se njihovo ime toliko poziva kada se pojavi ova tema. Platit ćete za to povjerenje, naravno. Ali ako imate vlastito povjerenje i snažan tim za razvojne inženjere, tu je alternativa Lucene softveru koji nije vlasnički (slobodan i otvoren izvor).

Lucene, kao što mi je rečeno - budući da nisam programer iskustva s ovim programskim paketom - čini gotovo sve što Endeca radi, čak i uz performanse na razini poduzeća, ali besplatno. Kao i kod Endece, uistinu postoji cijela vrećica pojedinačnih proizvoda koji rade zajedno u nekoj vrsti ekosustava. Vrh tog ekosustava je Apache Software Foundation (ekvivalent tvrtke), zatim Lucene projekt (ekvivalent proizvoda) i nakon toga dio koji čini stvarni Web UI o kojem govorimo - ili Solr ili Elastic Search.

Dakle, sve ove stvari Lucene i Endeca su, doduše, stvari u IT infrastrukturi koje "The Cloud" trebale spriječiti da se nosite s njima, i da im se osjećate malo starom školom. Ako ste manja tvrtka, ili jednostavno ne želite bolove u implementaciji, a želite koristiti najsporije dogovorene najbolje prakse i još uvijek smatrati poslovnu klasu, uvijek postoji Demandware, ili niz drugih proizvoda koji ispunjavaju niše između Endece / Lucene u jednom ekstremu i samohrane WooCommerce na WordPressu s druge strane.

Osim toga, svi stvarno veliki tehnološki igrači, poput IBM-a, Microsofta i SAP-a, nude nešto za rješavanje problema vezanog uz pretraživanje weba. Endeca i Lucene su imena koja se stalno pojavljuju kada se SEO bavite tim problemima, tako da je to jednostavan način da se uokvirite ovu diskusiju s fasetiranim pretraživanjem, ali imajte na umu da na svakom kraju spektra zaista postoje drugi, i bezbroj više između. Ako, na primjer, želite da vam oblak bude jednostavniji za Demandware, ali uz mogućnost da ga jednog dana sve bude u kući, da biste započeli slojevitost u ekstremnoj prilagodbi za konkurentsku prednost, tu je Hybris na high-end i Magento na low-end.

Dva ekstremna scenarija

No, na kraju dana, sve te infrastrukture imaju neki oblik facetiranog pretraživanja i moraju se nositi s istim skupom problema. Općenito gledano, fasetirano pretraživanje spada u dvije kategorije. Svi milijuni potencijalnih stranica koje su "omogućene" su ili:

  1. Potpuno nevidljiv za pretraživanje zbog jednog ili drugog razloga
  2. Vidljivo za pretraživanje, ali stvara web-lokaciju koju Googlebot nikada neće završiti indeksiranje i istraživanje

U prvom scenariju, stranice s fasetiranim pretraživanjem koje su nevidljive za pretraživanje su ili nevidljive jer je korisničko sučelje izgrađeno sa starim CGI-elementima i zahtijeva slanje ili izvršenje JavaScripta da bi se pretraživanje izvršilo, ili se zapravo može pretraživati, ali vlasnici web-lokacija "isključili" su Googleovu sposobnost indeksiranja / indeksiranja web-lokacije putem robots.txt ili nekog drugog mehanizma - obično zato što su pretrpjeli bolnu situaciju broj dva.

U situaciji broj dva, Google može potpuno pretražiti cjelokupnu facetiranu web-lokaciju za pretraživanje i sve potencijalne stranice koje može generirati. Međutim, stranice se nikada ne završavaju, a 99% tog beskrajnog indeksiranja je dvostruki sadržaj. Drugim riječima, to je zamka za pauke. Google vidi vašu cijelu web-lokaciju, ali zbog smiješnosti zadatka koji ste mu postavili, odustat će se i premjestiti na sljedeću web-lokaciju.

Rijetko se razmišljalo o tome, ali je od presudne važnosti, da će ova pauk-zamka utjecati na vaše rangiranje pretraživanja tako što će razvodnjavanje ili potpuno zamagljivanje "temeljnog skupa" važnih stranica koje vaša web-lokacija može / bi trebala generirati i koje bi se mogle smjestiti u lako - otkrijte puteve klikova (glavna i sekundarna navigacija) i prilagodite ih da biste se uskladili s poznatim ključnim riječima za pretragu i poznate pretvorbe.

Razmislite o stvarnim stvarnim stablima

Dakle, trik je osvijetliti taj temeljni skup stranica, poput glavnog debla i grana stabla. To možda predstavljaju prva dva odabrana aspekta ili neki drugi mehanizam za "definiranje osnovnog skupa stranica" koji je usklađen s onim za što se istražuje vaša ključna riječ. Deblo i grane su jezgra. Oni su vaš glavni skup kanonskih ne-dupliciranih stranica - bez obzira na to jesu li stvarno proizvedeni odabirom fasetiranih parametara pretraživanja. (Vaše bi se glavne stranice mogle sastojati od njih).

Čak i ako vaša web-lokacija može generirati više milijuna stranica, ova "jezgra" od 100 do 10.000 stranica može biti vaš glavni kanonski set. Svi ostali milijuni uglavnom dvostrukih varijacija mogli bi imati kanonske oznake natrag na URL najbližeg podudaranja iz skupa jezgre. Yep, možda postoji neki prilagođeni razvoj ovdje raditi ako vaš platforma za e-trgovinu ne podržava takve trikove.

I to je samo jedan od pristupa za dobivanje tih zamki pauka pod kontrolom - neka sve indeksira ... neka zamka paukova nastavi postojati ... ali budite jasni Googleu o tome što se dešava, i kako bilo koje puzanje prošlo na kraju očigledna jezgra / važan skup je over-the-top i možda nepotreban posao. Google-ovo pretraživanje s izmjenjivačem web-lokacije trebalo bi se vratiti s približno količinom kanonskih jezgri koje sada jasno oglašavate - a NE ostatak, koji priznajete, su permutacije niskog prioriteta.

Najbolja rješenja uvijek su ona na kojima web-lokacija može generirati samo ograničenu količinu stranica, a Google ih može preokrenuti sve za nekoliko dana. Pokušajte pokrenuti Vrištanje žaba na web-lokaciji (s mnogo memorije). Ako se nikada ne završi, možda imate zamku pauka.

To je kao na bilo kojem stablu, moglo bi biti teško, ali zapravo možete brojati lišće! Moguće je, ali vi ćete završiti. Tako će i Završna žaba završiti puzanje ispravno ograničenog mjesta.

Red je važan - rezanje perutacija

Određena hibridizacija aspekata može pomoći da se situacija dovede pod kontrolu - kao što je omogućavanje aktiviranja određenih aspekata samo u kombinaciji s određenim drugim aspektima kako bi se odražavala i provodila ograničenja u odnosu na podatke. Ovo biste mogli smatrati kombinacijom mnogo konačnije sheme za navigaciju s detaljnim detaljima. (Predmeti su prikazani na određenim razinama). Navigacija s detaljnim prikazom nastoji nametnuti određeni poredak na parametre niza upita (zamagljeni kao mape ili ne).

Također možete pažljivo konstruirati svoje URL-ove, s određenim prisilnim redoslijedom na fasete, tako da radite samo s kombinacijama umjesto s permutacijama. (Napravite potragu za "kombinacijama naspram permutacija.") Naime, ako u jednom slučaju odaberete ficu A, a zatim B u aspektu, a zatim u B, a zatim aspekt A u drugom, URL-ovi će biti različiti, ali rezultirajući stranica isto. To se može popraviti samo abecednim redoslijedom ili korištenjem unaprijed određenog reda za prikazivanje parametara na URL-u.

I konačno, prisjećajući se da se držimo metafore stabla za hijerarhiju mjesta, svrha stabla je da raširi svoje grane, grančice i lišće kako bi stvorila površinu s lišćem kako bi najučinkovitije zabilježila sunčevu svjetlost. Evolucija je oblikovala stabla tako da ne nastavljaju rasti i dalje od mjesta gdje najučinkovitije hvataju svjetlo.

Umjetničko oblikovanje mjesta

Kao što je navedeno na opining ovog članka, većina faceted pretraživanje web-mjesta ili učiniti njihov položaj nevidljiv za pretraživanje ili nemoguće puzeći posao. Pravi odgovor je negdje u sredini - umjetničko oblikovanje. Postoji mnogo načina na koje se to može izvesti, od prilagođavanja datoteke robots.txt do podešavanja postavki konzole Google pretraživanja (ranije alata za webmastere) do izmjene metaoznaka u izvornom prikazu.

Rješenja su različita, a sve bi trebala biti usmjerena na sveobuhvatnu strategiju ciljanja ključnih riječi, a na temelju onoga što podržava vaša tehnološka platforma i koja se može implementirati u vaš tim. Za razliku od prirodnih stabala čiji je maksimalni oblik određen prirodnim ograničenjima, obrađene web-stranice mogu postati nesputane i možda to nikada nećete znati - osim što nikada ne možete dobro funkcionirati u Googleu.