Fasēta meklēšana Gone Wild: efektīvi izmantojuši Endeca & Lucene par SEO

Fasēta meklēšana bija diezgan reta. Tagad, šķiet, ir visur! Viena no lietām, kas šodien visbiežāk tiek sadalīta e-komercijas vietnēs, ir nepareizas informācijas iegūšana par to, kā rīkoties ar vietnes meklēšanas redzamību. Mēs sastopamies ar tādiem pašiem jautājumiem, kas šeit ir atkal un atkal no Flying Point Digital, un no SEO viedokļa tas nav vienkārši "padarīt labākas kategorijas lapas". Lai gan tas ir svarīga daļa no labojuma, tas ir tikai puse no stāsta.

Paldies, Kapteinis acīmredzams

Ir pietiekami daudz pārraudzības vai nepareizu priekšstatu par to, kas notiek ar detalizētu meklēšanu, un cik labi šī vietnes navigācijas tehnika varētu būt SEO, ka ir pienācis laiks rakstīt rakstu. Tas ir tas pats, vecs, nejaušs zirnekļa lamatas stāsts, bet ar pagriezienu. Vai arī mums vajadzētu pateikt jaunas dimensijas. Tiem, kas ir bijuši SEO nozarē awhile, tas, iespējams, ir daudz informācijas, lai secinātu un atrisinātu problēmu. Saspiežot meklēšanu, tiek izveidots zirnekļa slazds tikpat liels kā jebkura iespējamo elementu kombinācija, ja vien navigācija ir "meklēšanas draudzīga".

Definēta problēma. Risinājumi netieši. Jūs sāļie vecie suņi no SEO nozares var aiziet. Tiem, kas tikko dzird par to vai nodarbojas ar to pirmo reizi, lasiet tālāk. Mēs jūs vispirms ienāksim mazliet vēsturē, sliktajā situācijā, kas pašlaik pastāv šādās vietās, un pēc tam galu galā izplāno dažus plašus viena iespējamā risinājuma insultus.

Mēs jūs vispirms ienāksim mazliet vēsturē, sliktajā situācijā, kas pašlaik pastāv šādās vietās, un pēc tam galu galā izplāno dažus plašus viena iespējamā risinājuma insultus

Miljonu produktu katalogi

Kur ir e-komercija ar lieliem miljoniem vai pat tikai desmitiem tūkstošu produktu katalogiem, ir strukturēti dati, piemēram, cena un krāsa un izmērs, lai to visu aprakstītu. Un termins, kas izvēlēts, lai aprakstītu lietotāja saskarnes, kas veidotas, meklējot un filtrējot, izmantojot šādus produktu aprakstus, ir aspekti.

Fasēta meklēšana ir tikai visi filtri, kurus varat noklikšķināt, lai precizētu meklēšanu, neņemot vērā atslēgvārdu pievienošanu vai navigāciju. Šeit ir dažas formālas definīcijas un netiešā secība, ka tā nav jutīga (kas nav redzama urbšanas navigācijā). Urbšana uz leju, izmantojot izvēlnes, kas jutīgas pret pasūtījumu (piemēram, tīmekļa hipersaites), nozīmē zināmu galīgumu jūsu izpētē. Viss, ko jūs atradīsiet, ir analogs failiem cietajā diskā vai koka mezglos. Lai gan tas ir iespējams, vienkārši ir grūtāk veidot zirnekļa slazdus ar urbšanas navigāciju. Tas, kā Web galvenokārt darbojas, ir tas, kas padarīja Google meklēšanas un indeksēšanas sistēmu tik izcilu un efektīvu. Tas ir arī tas, kas ir devis Google negodīgu reputāciju dinamisku vietņu „nepatīk” dēļ.

Zirnekļu slazdi un jaukti ziņojumi

Tiklīdz URL tiek ievadīta jautājuma zīme, vietne tiek uzskatīta par "dinamisku", un vietne var turpināties uz visiem laikiem. Padomājiet par kalendāra tīmekļa lapu, kurā jūs vienmēr varat noklikšķināt uz "nākamās dienas" saites. Tas ir tiešām tik vienkārši izveidot zirnekļa slazdu. Un tā nav jautājuma zīmes esamība, kas padara vietni dinamisku vai sliktu vai Google lasāmu nekādā veidā. Tas ir tāds, ka jautājuma zīme ir tāda veida vietnēs, kuram Google ir jānovērš kādā brīdī, un jāvēršas pie vietņu pārmeklēšanas, kas nedara lietas nožēlojamām. Vai arī, visi šķietami bezgalīgie Google resursi tiks iztērēti, pārbaudot vienu vienkāršu bezgalīgu kalendāru vienā mazā vietnē.

Dinamiskās vietnes (vai URL) nav raksturīgas slikti, kā daži cilvēki jūtas. Kas ir slikti, ir tas, cik viegli ir nejaušus zirnekļa slazdus un nekad neapzināties, ka jums pat ir problēma. No Google puses viņi tikai reāli nokļūst uz nākamo vietni, tāpēc viņi ne visu laiku velk savus riteņus. Google šajās dienās ir daudz vairāk gatavojusies ienirt spidera slazdos, atvilkt dažus miljonus lappušu un noskaidrot, vai viņi nevar to saprast.

Šajā rakstā mēs koncentrējamies uz vienu konkrētu dinamiskā URL zirnekļa lamatas veidu, ko rada navigācijas shēma, ko bieži sauc par šķembu meklēšanu. Jautri vārds, aspekti. Jūs domājat par dārgakmens sagrieztajām sejām. Es domāju, ka kalpo e-komercijas biz tikai naudas sodu, un tas ir vieglāk, nekā sakot patvaļīgi parametru vai attiecinātu vai daudzdimensiju vai lauka filtrētu meklēšanu. Ne visi parametru meklējumi ir aspekti. Fasādes mēdz ļaut sevi ieiet dažādos rīkojumos un šķietami bezgalīgās permutācijās - gan to dēļ, kas padara tos "šķautnes", gan tik īpaši vētraina zirnekļa slazdu.

Endeca un Lucene

Mēs biežāk pamanām problēmas ar sarežģītām meklēšanas vietnēm, jo ​​tagad ir vieglāk izveidot vietnes, kas to izmanto. Šis navigācijas paņēmiens bija daudz retāks, jo bija nepieciešamas izmaksas un zināšanas, kas nepieciešamas, lai to izveidotu, un lielās servera prasības šīs funkcijas nodrošināšanai (ar precīziem datiem) mērogā. Tas mainās. Neatkarīgi no tā, kādi ir jūsu dati, daži produkti, piemēram, Endeca (tagad no Oracle) vai Lucene (Apache projekts), var to izlaist un izveidot datubāzi un indeksus, kas nepieciešami, lai izveidotu savienojumu ar vietnes veidošanas komponentiem, kas slāņos slīpi meklēt vietnē.

Endeca jau sen ir dominējošā biznesa klases komerciālā programmatūra, kas piedāvā daudzpusīgu meklēšanu, un tāpēc jūs dzirdat, ka viņu vārds tiek izmantots tik daudz, kad rodas šī tēma. Jūs, protams, maksāsiet par šo pārliecību. Bet, ja jums ir sava pārliecība un spēcīga attīstītāju komanda, tur ir nepatentēta (bezmaksas un atvērtā koda) Lucene programmatūras kaudze alternatīva.

Lucene, kā es esmu teicis - kā es neesmu pieredzes attīstītājs ar šo konkrēto programmatūras paketi - dara gandrīz visu, ko Endeca dara, pat ar uzņēmuma līmeņa veiktspēju, bet bez maksas. Tāpat kā Endeca, patiešām ir viss atsevišķu produktu rokturis, kas darbojas kopā ar kādu ekosistēmu. Šīs ekosistēmas virsotne ir Apache Software Foundation (uzņēmuma ekvivalents), tad Lucene projekts (produkta ekvivalents) un pēc tam daļa, kas padara faktisko tīmekļa lietotāja interfeisu, par kuru mēs runājam - vai nu Solr vai Elastic Search.

Tātad, tas viss Lucene un Endeca sīkumi, protams, ir tāds, ka IT infrastruktūras sīkumi, kas "Mākonī" ir domāti, lai jūs no jums nebūtu jātiek galā, un viņiem ir jābūt mazliet vecai skolai. Ja jūs esat mazāks uzņēmums vai vienkārši nevēlaties realizēt sāpes, un vēlaties izmantot visatbilstošākās labākās prakses, kas nav pieejamas, un joprojām tiek uzskatītas par uzņēmumu klasi, vienmēr ir Demandware vai daudzi citi produkti, kas aizpilda nišas starp Endeca / Lucene vienā galējā un pašpasākto WooCommerce gadījumu WordPress.

Turklāt, visi patiešām lielie tehnoloģiju spēlētāji, piemēram, IBM, Microsoft un SAP, piedāvā arī kaut ko, lai atrisinātu Web sarežģīto meklēšanas problēmu. Endeca un Lucene ir vārdi, kas atnāk un atkal parādās, kad esat SEO, kas risina šīs problēmas, tāpēc tas ir vienkāršs veids, kā veidot šo sarežģīto meklēšanas diskusiju, bet paturiet prātā, ka katrā spektra galā patiešām ir citi, un neskaitāmas vēl vairāk. Piemēram, ja jūs vēlaties, lai Demandware mākonis būtu vieglāks, bet ar iespēju to izdarīt mājās kādreiz, lai sāktu slāņošanu ārkārtas pielāgošanā, lai sasniegtu konkurences priekšrocības, Hybris ir augstas klases un Magento pie zemākā līmeņa.

Divi ekstrēmi scenāriji

Taču dienas beigās visām šīm infrastruktūrām ir sava veida šķembu meklēšana, un tām ir jārisina tādas pašas problēmas. Parasti šķembu meklēšana ietilpst vienā no divām kategorijām. Visi miljonu potenciālo lapu, kas ir "iespējamas", ir vai nu:

  1. Pilnīgi neredzams meklēšanai viena vai cita iemesla dēļ
  2. Redzams, lai meklētu, bet izveido vietni, kuru Googlebot nekad nebūs pabeidzis pārmeklēt un izpētīt

Pirmajā scenārijā šķautnes meklēšanas vietnes, kas nav redzamas meklēšanai, ir vai nu neredzamas, jo lietotāja interfeiss ir veidots ar vecmodīgi CGI veidlapas elementiem un pieprasa iesniegt vai izpildīt JavaScript, lai meklētu, vai tas ir faktiski pārmeklējams, taču vietņu īpašnieki ir izslēguši Google spēju pārmeklēt / indeksēt vietni, izmantojot robots.txt vai kādu citu mehānismu - parasti tāpēc, ka viņi ir cietuši no otrās situācijas.

Otrajā situācijā Google var pilnībā pārmeklēt visu fasēto meklēšanas vietni un visas iespējamās lapas, ko tā var radīt. Tomēr lapas nekad nebeidzas, un 99% no šī nebeidzamā pārmeklēšanas ir dublējošs saturs. Citiem vārdiem sakot, tas ir zirnekļa slazds. Google redz jūsu visu vietni, bet tā uzdevuma smieklības dēļ, ko esat iestatījis pirms tam, tas atdos un pārvietosies uz nākamo vietni.

Slikta domāšana, bet ļoti svarīga ir tā, ka šis zirnekļa slazds ietekmēs jūsu meklēšanas rezultātus, atšķaidot vai pilnībā aizskarot svarīgāko lapu "galveno komplektu", ko jūsu vietne var / vajadzētu radīt, lai to varētu novietot viegli - atklāt klikšķu ceļus (galveno un sekundāro navigāciju) un izmainīt, lai tie atbilstu zināmajiem meklētajiem un zināmajiem konvertējošajiem atslēgvārdiem.

Padomājiet par faktisko reālo dzīves koku noteikumiem

Tātad, triks ir izgaismot šo galveno lapu kopu, piemēram, koka stumbra un filiāles. Tie, iespējams, ir pirmie divi atlasītie elementi vai kāds cits mehānisms, lai "definētu galveno lapu kopu", kas ir saskaņota ar jūsu atslēgvārdu pētījumiem. Bagāžnieks un zari ir kodols. Tie ir jūsu galvenās kanonisko, nevis dublējošo lapu kopas, neatkarīgi no tā, vai tās ir faktiski ražotas, izvēloties fasētus meklēšanas parametrus. (Jūsu galvenās lapas, iespējams, sastāv no šīm lapām).

Pat ja jūsu vietne var radīt miljoniem vairāk lappušu nekā šis, šī "kodola" daļa no 100 līdz 10000 lapām var būt jūsu galvenais kanoniskais komplekts. Visiem pārējiem miljoniem pārsvarā dublējošo variantu var būt kanoniski tagi, kas atgrieztos tuvākajā atbilstošajā URL no koda kopas. Jā, šeit var būt daži pielāgoti izstrādes darbi, ja jūsu e-komercijas platforma neatbalsta šādus ārpusbiržas trikus.

Un tas ir tikai viens no veidiem, kā kontrolēt šos zirnekļa slazdus - ļaujiet visiem rādītājiem ... ļaut zirnekļa slazdam turpināt pastāvēt ... bet ir skaidrs Google par to, kas notiek, un kā jebkurš pārmeklējums pagātnē acīmredzams kodols / svarīgākais ir pārāk liels un varbūt nevajadzīgs darbs. Google meklēšanai ar vietnes modifikatoru jāatgriežas ar aptuveni kanonisko galveno lapu skaitu, kuras jūs tagad skaidri reklamējat, un NAV pārējo, ko jūs uzņemat, ir zemas prioritātes permutācijas.

Vislabākie risinājumi vienmēr ir tādi, kuros vietne var radīt tikai ierobežotu lapu skaitu, un Google dažu dienu laikā tos var spinēt. Mēģiniet darboties Screaming Frog pret vietni (ar lielu atmiņu). Ja tas nekad nebeidzas, jums var būt zirnekļa slazds.

Tas ir tāpat kā jebkurā kokā, tas var būt grūti, bet jūs faktiski varētu skaitīt lapas! Tas ir iespējams, bet jūs pabeigsiet. Arī Screaming Frog beigs pārmeklēt pienācīgi ierobežotu vietu.

Pasūtīt jautājumus - samazināt leņķus

Noteiktu aspektu hibridizācija var palīdzēt kontrolēt situāciju, piemēram, padarot atsevišķus aspektus iespējamu aktivizēt tikai kopā ar dažiem citiem aspektiem, lai atspoguļotu un īstenotu datu attiecību ierobežojumus. Jūs to varat uzskatīt par kombināciju ar daudz precīzāku urbšanas shēmu ar meklēšanas aspektiem. (Fakti tiek atspoguļoti konkrētos urbšanas līmeņos). Drill-down navigācija mēdz izpildīt noteiktu kārtību jūsu vaicājuma virknes parametriem (kā mapes vai ne).

Jūs varat arī veidot savus URL uzmanīgi, norādot konkrētu piespiedu kārtību, lai jūs tikai risinātu kombinācijas, nevis permutācijas. (Veiciet meklēšanu "kombinācijām pret permutācijām".) Konkrēti, ja jūs izvēlaties elementu A un pēc tam vienā pusē iezīmē B, bet pēc tam iezīmējiet B un pēc tam iezīmējiet A citā, URL būs atšķirīgi, bet rezultāts būs atšķirīgs. tas pats. To var noteikt, vienkārši izmantojot alfabētus vai izmantojot kādu iepriekš iestatītu kārtību, lai parametri tiktu parādīti URL.

Un, visbeidzot, atceroties, ka mēs pieliekam koku metaforu vietnes hierarhijai, koka mērķis ir izplatīt tās filiāles, zarus un lapas, lai radītu virsmas laukumu ar lapām, lai visefektīvāk iegūtu saules gaismu. Evolūcija ir veidojusi kokus tā, lai viņi nepaliktu augt tālāk par vietu, kur tie visefektīvāk uztver gaismu.

Vietnes mākslinieciskā veidošana

Kā teikts šī raksta atklāšanā, vairums sarežģītu meklēšanas vietņu padara viņu vietni neredzamu meklēšanai vai neiespējamu pārmeklēšanu. Reālā atbilde ir kaut kur pa vidu - mākslinieciski veidojošs. Ir daudz veidu, kā to izslēgt, sākot ar robots.txt faila korekcijām, lai izmainītu jūsu Google meklēšanas konsoles (agrāk Webmaster Tools) iestatījumus, lai mainītu meta tagus jūsu skatījuma avotā.

Risinājumi ir dažādi, un visiem vajadzētu būt vērstiem uz visaptverošu atslēgvārdu stratēģiju un balstoties uz to, ko atbalsta jūsu tehnoloģiju platforma un ko var īstenot jūsu komanda. Atšķirībā no dabiskajiem kokiem, kuru maksimālo formu nosaka dabas ierobežojumi, fasetes tīmekļa vietnes var kļūt neierobežotas, un jūs nekad to nezināt, izņemot gadījumus, kad Google neveiks labi.