Faceted Search Gone Wild: tõhusalt võimendav Endeca & Lucene SEO jaoks

Hõbedane otsing oli haruldane. Nüüd tundub see olevat kõikjal! Üksikasjalik teave selle kohta, kuidas sa seda funktsiooni puudutavate veebisaitide otsinguvõimalusi otsima, on e-kaubanduse veebisaitidel kõige sagedamini murdunud. Me kohtame Flying Point Digitalis üha enam samu probleeme ja SEO-perspektiivist ei ole see lihtsalt "paremate kategooriate lehekülgede tegemine". Kuigi see on paranduse oluline osa, on see vaid pool lugu.

Tänan, kapten Obtress

Seal on piisavalt järelevalvet või eksiarvamust selle kohta, mis toimub keerulise otsinguga ja kui hea on see veebilehe navigatsioonitehnoloogia SEO jaoks, et on aeg kirjutada artikkel. See on sama vana, juhuslik spider-trap-lugu, kuid väändega. Või peaksime ütlema uute mõõtmetega. Neile, kes on olnud SEO tööstuses mõnda aega, see on ilmselt palju teavet nii järeldada ja lahendada probleem. Hõbedane otsing loob spider-lõksu nii suure kui iga võimaliku tahkete valikute kombinatsiooni, kui teie navigeerimine on "otsida sõbralik".

Määratletud probleem. Lahendused on kaudsed. Soolased vanad koerad SEO-tööstusest võivad ära minna. Neile, kes seda esimest korda kuulevad või sellega tegelevad, loe edasi. Me astume teid kõigepealt natuke ajaloosse, halba olukorda, mis sellistel saitidel sageli eksisteerib, ja paneme lõpuks mõne võimaliku lahenduse paar laiemat lööki.

Miljonit tootekataloogi

Kus on e-kaubandus, kus on suured miljonite või isegi kümnete tuhandete toodete kataloogid, on selle kirjeldamiseks struktureeritud andmeid nagu hind ja värv ning suurus. Ja otsides ja filtreerides kasutatavate kasutajaliideste kirjeldamiseks valitud termin, mis kasutab selliseid tootekirjeldusi, on tahke.

Filtreeritud otsing on ainult kõik filtrid, mida saate oma otsingu täpsustamiseks kaugemale peale märksõnade ühendamise või navigeerimise alandamise. Siin on mõned ametlikud definitsioonid ja kaudne järjekindlusetus (mis ei ole puurimise all). Tellimuse suhtes tundlike menüüde (nt veebi hüperlingid) läbipuurimine tähendab teie uurimise teatud lõplikkust. Kõik, mida sa leiad, on analoogne kõvakettal olevate failidega või puu sõlmedega. Kuigi see on võimalik, on lihtsalt keerulisema navigeerimisega spider-püüniste loomine lihtsam. See on see, kuidas veebi enamasti töötab, ja see muutis Google'i otsingu- ja indekseerimise selliseks suurepäraseks ja tõhusaks süsteemiks. See on ka see, mis on andnud Google'ile ebaõiglase maine dünaamiliste saitide „ei meeldi” eest.

Spider-Traps ja Mixed Messages

Niipea, kui URL-ile lisatakse küsimärk, loetakse sait "dünaamiliseks" ja sait võib jätkuda igavesti. Mõtle kalendri veebilehele, kus saate alati klõpsata lingil "Järgmine päev". Spider-lõksu loomine on tõesti nii lihtne. Ja see ei ole küsimus, mis muudab saidi dünaamiliseks või halvaks või loetamatuks Google'ile. See on see, et küsimärk on sellistel veebisaitidel, mida Google peab mingil hetkel kõrvale panema, ja jätkake veebisaitide indekseerimist, mis ei muuda asju õnnetuks. Või muidu oleksid kõik näiliselt lõpmatud Google'i ressursid ühe väikese saidi ühe lihtsa lõpmatu kalendri otsingul kulutatud.

Dünaamilised saidid (või URL-id) ei ole oma olemuselt halvad, nagu mõned inimesed tunnevad. Mis on halb on see, kui lihtne on juhuslike ämbliklõksude tegemine ja mitte kunagi aru saada, et teil on isegi probleem. Google'i poolelt saavad nad lihtsalt reaalsel viisil järgmisele saidile, nii et nad ei veeta oma aega oma rataste ketramiseks. Google'il on nendel päevadel palju rohkem tahet sukelduda spider-püünistesse, tõmmata paar miljonit lehekülge tagasi ja näha, kas nad ei saa sellest mingit mõtet.

Selles artiklis keskendume ühele dünaamilise URL-i spider-lõksu tüübile, mida genereerib navigatsiooniskeem, mida sageli nimetatakse lihvitud otsinguks. Lõbus sõna, tahud. Teeb mõtlema kalliskivi lõigatud külgedest. Ma arvan, et see teenib e-kaubanduse biz lihtsalt ja see on lihtsam kui öelda meelevaldselt parameetriga või omistatud või mitmemõõtmeline või välja filtreeritud otsing. Mitte kõik parameetrilised otsingud ei ole aspektid. Näidikud kalduvad end lubama erinevatel järjekorral ja näiliselt lõpmatu permutatsiooniga - nii, mis muudab nad "tahkudeks" ja niisuguseks eriti ebameeldivaks spider-lõksuks.

Endeca ja Lucene

Me täheldame sagedamini keerukate otsingusaitidega probleeme, sest seda on lihtsam teha saite, mis seda kasutavad. Seda navigatsioonitehnikat kasutati varem selle loomiseks vajalike kulude ja asjatundlikkuse tõttu ning selle teenuse (täpsete andmetega) edastamiseks vajalike suurte serverinõuete tõttu. See muutub. Ükskõik, millised teie andmed on lukustatud, võivad mõned sellised tooted nagu Endeca (nüüd Oracle) või Lucene (Apache projekt) selle läbi pühkida ja luua andmebaasi ja indeksid, mis on vajalikud, et ühendada veebilehe ehituskomponentidega, mis kihutavad otsing saidile.

Endeca on pikka aega olnud domineeriv äriklassi äritarkvara, mis pakub keerulist otsingut, mistõttu kuulete nende nime nii palju, kui see teema tekib. Te maksate selle usalduse eest muidugi. Aga kui teil on oma enesekindlus ja tugev arendajameeskond, on olemas mittekaubanduslik (vaba ja avatud lähtekoodiga) Lucene tarkvara korstna alternatiiv.

Lucene, nagu ma olen öelnud - kuna ma ei ole selle konkreetse tarkvarapaketi kogemuste arendaja, teeb peaaegu kõik, mida Endeca teeb, isegi ettevõtte tasandil, kuid tasuta. Nagu ka Endeca puhul, on tõepoolest terve käekotti üksikuid tooteid, mis töötavad koos teatud ökosüsteemis. Selle ökosüsteemi tipus on Apache Software Foundation (ettevõtte samaväärne), seejärel Lucene projekt (toote ekvivalent) ja pärast seda osa, mis tegeliku veebi kasutajaliidese kohta räägime - kas Solr või Elastic Search.

Nii et kõik see Lucene ja Endeca kraam on tõepoolest tõsi, et IT-infrastruktuuri asjad, mida "The Cloud" peaks hoidma, et sa ei peaks sellega tegelema, ja neil on neile natuke vana kooli DIY-tunne. Kui olete väikeettevõte või lihtsalt ei taha rakenduste valusid ja soovite kasutada kõige paremini kokkulepitud parimaid tavasid, mis on välja antud ja mida peetakse ikka veel äriklassi, siis on alati olemas Demandware või hulk muid tooteid, mis täidavad Endeca / Lucene'i vahel asuvaid nišše ühes äärmuslikus servas ja iseenda poolt korraldatud WooCommerce'i eksemplari WordPressis.

Lisaks pakuvad kõik tõesti suured tehnilised mängijad, nagu IBM, Microsoft ja SAP, veebi keerukate otsinguprobleemide lahendamiseks midagi. Endeca ja Lucene on nimed, mis kerkivad üles ja jälle, kui olete SEO, mis tegeleb nende probleemidega, nii et see on lihtne viis selle keerulise otsingu arutamiseks, kuid pidage meeles, et spektri igas otsas on tõesti teisi, ja lugematu rohkem vahel. Näiteks, kui soovite, et Demandware'i pilv-lihtsus, kuid võimalus võtta see kõikjal üheks päevaks, et alustada kihistumist äärmuslikes kohandustes konkurentsieelise saamiseks, on Hybris tipptasemel ja Magento madalama hinnaga.

Kaks äärmuslikku stsenaariumi

Kuid päeva lõpus on kõigil nendel infrastruktuuridel mingisugune keeruline otsing ja nad peavad tegelema samade probleemidega. Üldiselt jaguneb lihvitud otsing ühte kahest kategooriast. Kõik miljonid potentsiaalsed lehed, mis on "võimalikud", on kas:

Täiesti nähtamatu, et otsida ühel või teisel põhjusel
Nähtav otsingule, kuid loob saidi, mida Googlebot ei lõpeta kunagi indekseerimise ja uurimise lõpetamisega

Esimeses stsenaariumis on nähtamatud otsingumootorid kas nähtamatud, sest kasutajaliides on ehitatud vanaaegsete CGI-vormi elementidega ja nõuab otsingu teostamiseks või JavaScript-i käivitamiseks või JavaScripti täitmiseks, kuid saidi omanikud on "Google'i võime välja lülitada / indeksida saidi robots.txt või mõne muu mehhanismi abil - tavaliselt sellepärast, et nad on kannatanud olukorras, kus olukord on teine.

Teise olukorra puhul on Google tervikuna hõlpsasti jälgitav kogu tervikliku otsingu sait ja kõik võimalikud lehed, mida see suudab luua. Siiski on leheküljed lõputud ja 99% sellest lõputust indekseerimisest on dubleeriv sisu. Teisisõnu, see on spider-lõksu. Google näeb teie kogu saiti, kuid selle ees tehtud ülesande naeruväärsuse tõttu loobub ja liigub järgmisele saidile.

Mõttetu, kuid kriitilise tähtsusega mõte on see, et see ämbliklõks avaldab mõju teie otsingupositsioonidele, lahjendades või täielikult segades oluliste lehekülgede "põhikomplekti", mida teie sait saab / peaks looma, mida saab hõlpsasti paigutada - avastage klõpsutee (peamine ja sekundaarne navigeerimine) ning neid saab muuta, et viia need vastavusse teadaolevate otsitud ja teadaolevate konverteerivate märksõnadega.

Mõelge tegelike tegelike puude tingimustele

Niisiis, trikk on valgustada see põhiline lehekülgede kogum, nagu puu peakere ja oksad. Need võivad esindada kahte esimest valitud tahku või mõnda muud mehhanismi, et "määratleda peamised lehekülgede kogum", mis on kooskõlastatud märksõnauuringutega. Trunk ja oksad on tuum. Need on teie peamiste kanooniliste mitte-dubleerivate lehekülgede kogum, olenemata sellest, kas need on tegelikult valmistatud, valides viimistletud otsinguparameetrid. (Teie peamised leheküljed võiksid koosneda nendest).

Isegi kui teie sait suudab luua miljoneid rohkem lehekülgi, võib see 100–10000 lehekülje „tuum” olla teie peamine kanooniline komplekt. Kõigil teistel miljonitel enamasti dubleerivatel variatsioonidel võivad olla kanoonilised sildid põhisümbolist lähima sobiva URL-i juurde. Jah, siin võib olla mõned kohandatud arendustööd, kui teie e-kaubanduse platvorm ei toeta selliseid väliseid trikke.

Ja see on vaid üks lähenemine nende ämbliklõksude kontrolli all hoidmisele - lase kõigil indeksitel ... lase ämbliklõksul endiselt eksisteerida ... aga olge Google'ile selge, mis toimub ja kuidas ükski indekseerimine möödas ilmselge tuum / tähtsus on ülemäärane ja võib-olla tarbetu töö. Google'i otsing saidi-modifikaatoriga peaks tagasi tulema koos ligikaudu ühe kanoonilise põhilehekülje suurusega, mida te nüüd selgelt reklaamite - ja MITTE ülejäänud, mida te lubate, on madala prioriteediga permutatsioonid.

Parimad lahendused on alati need, kus sait saab genereerida ainult piiratud hulga lehekülgi, ja Google võib neid kõiki paari päeva pärast spin. Proovige käivitada Screaming konn vastu (palju mälu). Kui see kunagi ei lõppe, võib teil olla ämbliklõks.

See on nagu mis tahes puul, see võib olla raske, kuid sa võiksid tegelikult lehed lugeda! See on võimalik, aga sa lõpetad. Ka Screaming Frog lõpetab korralikult piiratud saidi indekseerimise.

Tellimuse küsimused - Permutatsioonide kärpimine

Teatud aspektide hübridiseerimine võib aidata olukorda kontrolli all hoida - näiteks teatud tahkude aktiveerimine ainult teatud muude aspektidega, et peegeldada ja jõustada andmeside piiranguid. Võib-olla võiksite seda pidada kombinatsiooniks palju piiratumast puuri-alla navigeerimiskavast koos otsingupunktidega. (Näidikud on esitatud konkreetsete puurimistasandite puhul). Allavoolu navigeerimine kipub täitma teatud järjekorra oma päringustringiparameetrite jaoks (varjatud kaustadena või mitte).

Samuti saate oma URL-id hoolikalt ette valmistada, teatud tahkudega, nii et tegelete ainult kombinatsioonidega, mitte permutatsioonidega. (Kas otsida "kombinatsioone vs permutatsioone.") Täpsemalt, kui valite facet A ja seejärel ühel juhul B-otsa, kuid seejärel B-nurga ja seejärel teise tahu A-ga, siis URL-id on erinevad, kuid tulemuseks on erinevad lehekülg sama. Seda saab fikseerida lihtsalt tähestiku järgi või kasutades mõnda eelnevalt määratud järjekorda, kuidas parameetreid URL-il kuvada.

Ja lõpuks meenutades, et me oleme kinni koha-hierarhia puude metafoorist, on puu eesmärk levitada selle oksad, oksi ja lehti, et luua lehtedega pindala, et lüüa päikesevalgust kõige tõhusamalt. Evolutsioon on kujundanud puud nii, et nad ei kasvaks kaugemale sellest punktist, kus nad valgust kõige tõhusamalt koguvad.

Saidi kujundamine

Nagu käesoleva artikli avastamisel öeldi, teevad enamik keerukad otsingusaitid oma saidi nähtamatuks otsinguks või võimatuks indekseerimiseks. Tegelik vastus on kusagil keskel - kunstiline vormimine. Selle väljalülitamiseks on mitmeid viise, alates robots.txt-faili kohandamisest kuni Google'i otsingukonsooli (endise veebimeistri tööriistade) seadete muutmiseni, metakoodide muutmist oma vaateallikas.

Lahendused on erinevad ja kõik peaks olema suunatud üldise märksõna sihtimisstrateegiaga ning põhinema teie tehnoloogiaplatvormi toetusel ja teie meeskonna poolt rakendataval. Erinevalt looduslikest puudest, mille maksimaalne kuju on määratletud looduspiirangutega, võivad keerukad veebisaidid kasvada tõrgeteta ja te ei pruugi seda kunagi teada, välja arvatud juhul, kui Google'is ei toimi.