„Faceted Search“ išnyko lauke: efektyviai panaudojant „Endeca“ ir „Lucene“ SEO

Išpopuliarinta paieška anksčiau buvo gana reti. Dabar, atrodo, yra visur! Viena iš labiausiai e. Prekybos svetainėse dažniausiai suskaidytų dalykų yra informacijos apie tai, kaip elgiatės su svetainių paieškos matomumu. Su „Flying Point Digital“ vis dažniau susiduriame su tomis pačiomis problemomis, o iš SEO perspektyvos tai nėra tiesiog „geriau kategorijų puslapiai“. Nors tai yra svarbi pataisos dalis, tai tik pusė istorijos.

Ačiū, kapitonas akivaizdus

Yra pakankamai stebėjimo ar klaidingo supratimo apie tai, kas vyksta su briaunuota paieška ir kaip gera ši svetainės navigacijos technika gali būti skirta SEO, kad atėjo laikas parašyti straipsnį. Tai ta pati, senatvė, atsitiktinė voratinklio istorija, bet su pasukimu. Arba turėtume pasakyti naujus aspektus. Tiems, kurie buvo SEO pramonėje šiek tiek, tai tikriausiai daug informacijos ir išvadų ir išspręsti problemą. Išskleidžiamas ieškojimas sukuria didžiausią spidero spąstus, kaip ir bet kokį galimų aspektų pasirinkimą, jei jūsų navigacija yra „draugiškas ieškoti“.

Nustatyta problema. Sprendimai numanomi. Jūs sūrūs seni šunys iš SEO pramonės gali išeiti. Tiems, kurie tiesiog girdi apie tai arba pirmą kartą ją tvarko, skaitykite toliau. Pirmą kartą įsikursime į istoriją, blogą situaciją, kuri šiuo metu dažnai egzistuoja tokiose svetainėse, ir pagaliau išdėstykite kelis plačius vieno galimo sprendimo smūgius.

Pirmą kartą įsikursime į istoriją, blogą situaciją, kuri šiuo metu dažnai egzistuoja tokiose svetainėse, ir pagaliau išdėstykite kelis plačius vieno galimo sprendimo smūgius

Milijonų produktų katalogai

Kur yra elektroninė prekyba su dideliais milijonų ar net dešimčių tūkstančių produktų katalogais, yra visi struktūrizuoti duomenys, pvz., Kaina ir spalva bei dydis. Ir terminas, pasirinktas apibūdinti naudotojo sąsajas, sukurtus pagal paiešką ir filtravimą naudojant tokius produktų aprašymus, yra aspektai.

Išskirtinė paieška yra tik visi filtrai, kuriuos galite spustelėti norėdami patobulinti paiešką, ne tik prijungę raktinius žodžius, nei naršyti. Čia yra keletas oficialių apibrėžimų ir numanomas užsakymo nejautrumas (kuris nėra gręžimo navigacijoje). Gręžimas žemyn per užsakymų jautrių meniu (pvz., Interneto hipersaitus) reiškia tam tikrą galutinį tyrimą. Viskas, ką „surasite“, yra analogiška kietojo disko ar medžio mazgų failams. Nors tai įmanoma, paprasčiausiai sunkiau sukurti spidero spąstus su gręžimo navigacija. Tai, kaip internetas daugiausia veikia, ir tai padarė tokį puikų ir efektyvų „Google“ paieškos ir indeksavimo sistemą. Tai taip pat suteikė „Google“ nesąžiningos reputacijos dinamiškų svetainių „nepatinka“.

„Spider-Traps“ ir „Mixed Messages“

Kai tik URL bus įvestas klausimynas, svetainė laikoma „dinamiška“, o svetainė gali tęstis amžinai. Pagalvokite apie kalendoriaus tinklalapį, kuriame visada galite spustelėti nuorodą „kitą dieną“. Tai tikrai taip paprasta sukurti voratinklį. Ir tai nėra klausimo ženklo buvimas, kuris daro svetainę dinamišku ar blogu ar neskaitytu „Google“. Tai, kad klausimų ženklas yra apie svetainių tipus, kuriuos „Google“ turi atidėti tam tikru momentu, ir toliau ieškoti svetainių, kurios nedaro nieko nelaimingo. Arba visi „Google“ begaliniai ištekliai būtų išleidžiami viename paprastame begaliniame kalendoriuje vienoje mažoje svetainėje.

Dinaminės svetainės (arba URL) nėra blogos, kaip jaučiasi kai kurie žmonės. Kas blogai yra tai, kaip lengva padaryti atsitiktinius voratinklius ir niekada nesuvokti, kad netgi turite problemų. Iš „Google“ pusės jie tik į realybę patenka į kitą svetainę, todėl jie ne visą laiką praleidžia savo ratus. „Google“ šiomis dienomis turi daug daugiau noro panirti į vorų spąstus, ištraukti kelis milijonus puslapių ir pažiūrėti, ar jie neturi jokios prasmės.

Šiame straipsnyje mes sutelkiame dėmesį į vieną tam tikrą dinaminio URL spidero spąstų tipą, kurį generuoja navigacinė schema, dažnai vadinama briaunuota paieška. Pramogos, aspektai. Pagalvoja apie pjaustytus brangakmenių veidus. Manau, kad tarnauja e-komercijos biz tik gerai ir lengviau nei sakyti savavališkai parametruoti arba priskirta arba daugiamatė arba lauko filtruojama paieška. Ne visos parametrinės paieškos yra aspektai. Faktai linkę leisti sau eiti skirtingomis tvarkomis ir iš pažiūros begalinėmis permutacijomis - tiek tai, kas daro juos „briaunomis“, tiek tokiu ypač bjauriu spidero spąstu.

Endeca ir Lucene

Dažniau pastebime, kad susiduriama su sudėtingomis paieškos svetainėmis, nes dabar lengviau kurti svetaines, kurios ją naudoja. Ši navigacijos technika buvo daug retesnė dėl sąnaudų ir patirties, kurios reikia norint ją įdiegti, ir jautrių serverio reikalavimų pateikti šią funkciją (su tiksliais duomenimis) skalėje. Tai keičiasi. Nesvarbu, kokie jūsų duomenys yra užrakinti, kai kurie produktai, pvz., „Endeca“ (dabar „Oracle“) arba „Lucene“ („Apache“ projektas), gali jį perplėsti ir sukurti duomenų bazę bei indeksus, reikalingus prisijungti prie svetainės kūrimo komponentų, kurie sluoksniuoti ieškoti svetainėje.

„Endeca“ jau seniai yra dominuojanti verslo klasės komercinė programinė įranga, suteikianti išsamią paiešką, todėl išgirsite jų pavadinimą, kuris atsirado tiek, kai atsiranda ši tema. Jūs, žinoma, mokėsite už šį pasitikėjimą. Tačiau, jei turite savo pasitikėjimą ir stiprią kūrėjų komandą, yra alternatyva „Lenene“ programinei įrangai, kuri nėra patentuota (laisvas ir atviras).

Lucene, kaip sakau, nes aš nesu patirties kūrėjas, turintis šią programinę įrangą, beveik viskas, ką daro „Endeca“, net ir su įmonės lygiu, bet nemokamai. Kaip ir „Endeca“, tikrai yra visas atskirų gaminių pakabukas, dirbantis kartu su tam tikra ekosistema. Šio ekosistemos viršūnė yra „Apache Software Foundation“ (bendrovės atitikmuo), tada „Lucene“ projektas (produkto ekvivalentas) ir po to dalis, kuri sudaro faktinę žiniatinklio vartotojo sąsają, - tai „Solr“ arba „Elastic Search“.

Taigi visi šie „Lucene“ ir „Endeca“ daiktai yra tai, kad IT infrastruktūros dalykai, kuriuos „Cloud“ turėtų išlaikyti, kad jums nereikėtų susidoroti, ir turėti jiems šiek tiek senos mokyklos „pasidaryk pats“. Jei esate mažesnė įmonė arba tiesiog nenorite diegti skausmo ir norite naudoti labiausiai suderintus geriausios praktikos pavyzdžius ir vis tiek laikyti verslo klasės paslaugomis, visada yra „Demandware“ arba daugybė kitų produktų, kurie užpildo nišas tarp Endeca / Lucene vienoje ekstremalioje situacijoje ir savarankišką „WooCommerce“ egzempliorių „WordPress“.

Be to, visi tikrai dideli technologijų žaidėjai, pvz., „IBM“, „Microsoft“ ir „SAP“, taip pat siūlo kažką, kad išspręstų neturtingą paieškos problemą. „Endeca“ ir „Lucene“ yra tie pavadinimai, kurie vėl ir vėl atsiranda, kai esate SEO, sprendžiantis šias problemas, todėl tai yra paprastas būdas susieti šią sudėtingą paieškos diskusiją, tačiau nepamirškite, kad kiekvienas spektro galas tikrai yra kitas, ir daugybė daugiau tarp jų. Pavyzdžiui, jei norite, kad „Demandware“ debesys būtų lengvesnis, bet su visais būdais kada nors pradėsite sluoksnį, norint pradėti ypatingą pritaikymą, kad būtų pasiektas konkurencinis pranašumas, „Hybris“ yra aukščiausios klasės, o „Magento“ - žemo lygio.

Du ekstremalūs scenarijai

Tačiau dienos pabaigoje visos šios infrastruktūros turi tam tikrą išvaizdą ir turi spręsti tas pačias problemas. Apskritai, briaunuota paieška patenka į vieną iš dviejų kategorijų. Visi milijonai galimų puslapių, kuriuos galima „padaryti“, yra:

  1. Visiškai nematoma ieškoti dėl vienos ar kitos priežasties
  2. Matoma ieškoti, bet sukuria svetainę, kurią „Googlebot“ niekada nesibaigs nuskaitymo ir tyrinėjimo

Pirmajame scenarijuje matomos nematomos paieškos svetainės yra nematomos, nes naudotojo sąsaja yra sukurta su senoviniais CGI formos elementais ir reikalauja pateikti arba vykdyti JavaScript, kad paieška būtų vykdoma, arba ji yra tikrinama, tačiau svetainės savininkai „išjungė“ „Google“ sugebėjimą nuskaityti / indeksuoti svetainę naudodami robots.txt arba kitą mechanizmą - dažniausiai todėl, kad jie patyrė antrosios situacijos skausmus.

Antrojoje situacijoje „Google“ puikiai tikrina visą išsiskyrusią paieškos svetainę ir visus galimus jo sukuriamus puslapius. Tačiau puslapiai niekada nesibaigia, o 99% šio nesibaigiančio nuskaitymo yra dublikatas. Kitaip tariant, tai spideras. „Google“ mato visą jūsų svetainę, tačiau dėl to, kad užduotis, kurią jūs nustatėte, yra juokinga, ji atsisakys ir pereis į kitą svetainę.

Nerimaujama, bet labai svarbi mintis yra ta, kad šis „spider-trap“ turės įtakos jūsų paieškos reitingams, skiedžiant ar visiškai užslėpiant svarbiausių puslapių, kuriuos jūsų svetainė gali / turėtų generuoti „pagrindinį“ rinkinį, kurį būtų galima lengvai išdėstyti - aptikti paspaudimų maršrutus (pagrindinę ir antrinę navigaciją) ir sureguliuoti, kad atitiktų žinomus ieškomus ir žinomus konvertuojančius raktinius žodžius.

Pagalvokite apie realaus gyvenimo medžių sąlygas

Taigi, gudrybė yra apšviesti tą pagrindinį puslapių rinkinį, pavyzdžiui, pagrindinį kamieną ir medžio šakas. Tai galbūt atspindi pirmuosius du pasirinktus aspektus arba kitą mechanizmą, skirtą „nustatyti pagrindinį puslapių rinkinį“, kuris yra suderintas su tuo, ką vykdo raktinių žodžių tyrimai. Pagrindiniai kamieno ir šakos. Jie yra jūsų pagrindiniai kanoninių ne dubliuojamų puslapių rinkiniai, nepriklausomai nuo to, ar jie iš tikrųjų buvo pagaminti pasirinkus briaunuotus paieškos parametrus. (Jūsų pagrindiniai puslapiai gali būti šie).

Net jei jūsų svetainė gali generuoti milijonus daugiau puslapių nei šis, šis „branduolys“ nuo 100 iki 10 000 puslapių gali būti jūsų pagrindinis kanoninis rinkinys. Visi kiti milijonai dažniausiai pasikartojančių variantų gali turėti kanonines žymes atgal į artimiausią atitinkamo URL iš pagrindinio rinkinio. Taip, čia gali būti tam tikras užsakymų kūrimo darbas, jei jūsų elektroninės prekybos platforma nepalaiko tokių gudrybių.

Ir tai tik vienas iš būdų, kaip valdyti šiuos voratinklius - leiskite viskas indeksui ... tegul vis dar egzistuoja voras-spąstai ... tačiau būkite aiškūs „Google“ apie tai, kas vyksta, ir kaip bet kokie nuskaitymai praeityje akivaizdu, kad esminis / svarbus rinkinys yra viršutinis ir galbūt nereikalingas darbas. „Google“ paieška su svetainės modifikatoriumi turėtų grįžti su maždaug kanoninių pagrindinių puslapių, kuriuos dabar aiškiai reklamuojate, suma, o ne poilsio, kuriuos priėmėte, yra mažo prioriteto permutacijos.

Geriausi sprendimai visada yra tie, kai svetainę gali generuoti tik ribotas kiekis puslapių, o „Google“ per kelias dienas gali juos suktis. Pabandykite paleisti Screaming Frog prieš svetainę (su daug atminties). Jei jis niekada nesibaigia, gali turėti spidero spąstus.

Tai panašu į bet kurį konkretų medį, tai gali būti sunku, bet jūs iš tikrųjų galite skaičiuoti lapus! Tai įmanoma, bet baigsite. Taip pat „Screaming Frog“ baigs nuskaityti tinkamai baigtą svetainę.

Užsisakykite svarbius dalykus - nukirpkite leidimus

Tam tikras aspektų hibridizavimas gali padėti kontroliuoti situaciją - pvz., Kai kurie aspektai gali aktyvuoti tik kartu su tam tikrais kitais aspektais, kad atspindėtų ir užtikrintų duomenų santykių apribojimus. Galite apsvarstyti, kad tai yra daug labiau ribotos gręžimo navigacijos schemos ir paieškos aspektų derinys. (Faktai pateikiami konkrečiai tam tikru gręžimo lygiu). Gręžimo navigacija paprastai verčia tam tikrą tvarką į užklausų eilutės parametrus (užfiksuoti kaip aplankai arba ne).

Jūs taip pat galite kruopščiai kurti savo URL su tam tikra priverstine tvarka, kad galėtumėte spręsti tik kombinacijas, o ne permutacijas. (Ar ieškokite „derinių ir permutacijų“.) Konkrečiai, jei pasirinksite „A“ aspektą ir tada vienu atveju pažymėkite „B“, bet tada suskirstykite B ir tuomet nukreipkite A į kitą, URL bus skirtingi, tačiau gaunami tas pats. Tai galima nustatyti tiesiog pagal abėcėlę arba naudojant tam tikrą iš anksto nustatytą tvarką, kaip parametrai turi būti rodomi URL.

Ir galiausiai prisimindami, kad mes laikomės vietovės hierarchijos medžio metaforos, medžio tikslas yra išskleisti savo šakas, šakeles ir lapus, kad būtų sukurtas paviršiaus plotas su lapais, kad efektyviausiai užfiksuotų saulės šviesą. Evoliucija suformavo medžius taip, kad jie nebegali augti praeityje už taško, kur jie efektyviausiai užfiksuoja šviesą.

Meninis meno kūrimas

Kaip minėta šio straipsnio atidaryme, dauguma išreikštų paieškos svetainių savo svetainę paverčia nematoma ieškoti arba neįmanoma nuskaityti. Tikrasis atsakymas yra kažkur viduryje - meninis kūrimas. Yra daug būdų, kaip išjungti šią funkciją - nuo patobulinimų „robots.txt“ faile, kad „Google“ paieškos konsolės (anksčiau žiniatinklio valdytojo įrankių) nustatymai būtų pakeisti, meta žymeles pakeitus peržiūros šaltinyje.

Sprendimai yra įvairūs, o visa tai turėtų būti nukreipta pagal visuotinę raktinių žodžių taikymo strategiją ir remiantis tuo, ką palaiko jūsų technologijų platforma ir kurią gali įgyvendinti jūsų komanda. Skirtingai nuo natūralių medžių, kurių didžiausia forma apibrėžiama gamtos apribojimais, briaunuotos svetainės gali augti netrukdomai, ir jūs niekada to nežinote, išskyrus tuos atvejus, kai „Google“ niekada neveikia.