Faceted Search Gone Wild: SEO uchun Endeca & Lucene'dan samarali foydalanish

Faceted qidirish juda kamdan-kam hollarda ishlatilgan. Endi hamma joyda ko'rinadi! Ushbu funksiya bilan saytlarning qidirishni ko'rishni qanday bahslashayotganingiz haqida noto'g'ri ma'lumot olish - bugungi kunda elektron tijorat saytlarida eng ko'p buzilgan narsalardan biri. Bu erda Flying Point Digital-da bir xil masalalar yuzaga keladi va SEO nuqtai nazari bilan bu "oddiy toifadagi sahifalarni yaratish" emas. Bu tuzatishning muhim qismi bo'lsa-da, bu faqatgina yarim hikoyadir.

Tashakkur, kapitan ravshan

Yuzlab qidirish bilan nima sodir bo'lishini va bu sayt navigatsiya texnikasi SEO uchun qanchalik yaxshi bo'lishi mumkinligini etarli darajada nazorat qilish yoki noto'g'ri tushunish, biz maqolani yozish vaqti keldi. Bu xuddi shunday, asriy, tasodifiy o'rgimchak-tuzoqqa oid hikoyadir, lekin burilish bilan. Yoki yangi o'lchovlar bilan aytmoq kerak. SEO industriyasida bo'lganlar uchun bir oz vaqt o'tishi kerak bo'lgan ma'lumotlarning ko'pligi va muammoni bartaraf etish. Yonaltiruvchi qidirish navigatsiya "qidirish do'sti" ekanligida, mumkin bo'lgan bantlar tanlovining har bir kombinatsiyasi kabi keng o'rgimchak to'ri yaratadi.

Muammo tavsiflangan. Ehtiyot echimlar. SEO-sanoatning sho'r eski itlari ketishi mumkin. Bu haqda eshitgan yoki birinchi marta eshitgan kishilar uchun o'qing. Biz sizni tarixning bir qismiga, sizningcha, hozirgi vaqtda bunday saytlarda mavjud bo'lgan yomon vaziyatga tushiramiz va keyinchalik mumkin bo'lgan echimning bir nechta keng nishonlarini joylashtiramiz.

Million-mahsulot kataloglari

Qaerda bo'lmasin, millionlab katta kataloglar yoki hatto o'n minglab mahsulotlarning elektron katalogi mavjud bo'lsa, narxni, rangi va o'lchamlari kabi tuzilgan ma'lumotlar mavjud. Va bunday mahsulotni identifikatorlardan foydalanib qidirish va filtrlash atrofida qurilgan foydalanuvchi interfeyslarini tavsiflash uchun tanlangan atamalar yuz beradi.

Qo'ng'iroq qilingan qidirish - qidiruvni aniqlashtirish uchun kalit so'zlarni kiritish yoki navigatsiya bo'yicha pastga tushirishdan tashqari, siz bosishingiz mumkin bo'lgan barcha filtrlardan iborat. Bu yerda ba'zi bir rasmiy atamalar mavjud va aniqlangan buyruqlar sezgirligi (pastga qarab harakat qilishda mavjud emas). Buyurtma sezgir menyular orqali (veb-kengaytmalar kabi) pastga burilish sizning kashfiyotingizga aniq yakuniyligini bildiradi. Siz topadigan har bir narsa qattiq diskdagi yoki daraxtdagi düğümlere o'xshash. Mumkin bo'lsa-da, o'rgimchak-navigatsiya bilan o'rgimchak to'ri tuzish osonroq. Internet juda ko'p ishlaydi, bu Google qidiruv va indeksini shunday yorqin va samarali tizimga aylantirdi. Bundan tashqari, Google "dinamik" saytlarni yoqtirmaslik uchun adolatsiz obro'ga ega bo'lgan.

O'rgimchak makrlari va aralash xabarlar

URLga savol belgisi kiritilgandan so'ng, sayt "dinamik" hisoblanadi va sayt abadiy davom etishi mumkin. Har kuni "keyingi kun" havolasini bosishingiz mumkin bo'lgan taqvim veb-sahifasini o'ylab ko'ring. Bu o'rgimchak makrini yaratish juda oson. Va saytni dinamik yoki yomon yoki Google tomonidan o'qib bo'lmaydigan savol belgisi mavjud emas. Bu savolning belgisi, Google ba'zi nuqtada chetga surib qo'yishi kerak bo'lgan saytlarning turlarida mavjud bo'lib, tekshirib chiqadigan saytlarning biznesiga shunchalik zarar etkazmaydigan narsalar bilan bog'lanish kerak. Aksincha, Googlening hamma ko'rinadigan cheksiz resurslari bitta kichik saytga bitta oddiy cheksiz taqvimni tomosha qilish uchun sarflanadi.

Dinamik saytlar (yoki URL) ba'zi odamlar his qilgandek tabiiy ravishda yomon emas. Afsuski, o'rgimchakka o'xshash tuzoqqa tushish oson emas va sizda muammoga duch kelishingizni hech qachon anglamaysiz. Google tarafidan, ular keyingi saytga faqat realistik tarzda kirishmoqda, shuning uchun ular o'z vaqtlarini o'z g'ildiraklariga aylantirishga sarflamaydilar. Google bugungi kunda o'rgimchak to'riga sho'ng'ib, bir necha million sahifani orqaga tortib, bu haqda hech qanday ma'noga ega emasligini bilish uchun juda ham tayyor.

Ushbu maqolada, tez-tez mo'ljallangan qidirish navigatsiya sxemasi tomonidan ishlab chiqarilgan dinamik URL o'rgimchak to'ri o'ziga xos turiga e'tibor qaratmoqdamiz. Qiziqarli so'z, qirralar. Agar marvaridning kesilgan yuzlarini o'ylab topsangiz. O'ylaymanki, biz elektron tijorat xizmatiga sodiqmiz va bu parametrlangan yoki atributli yoki ko'p o'lchovli yoki maydonni filtrlashni qidirishdan ko'ra osonroqdir. Parametrlangan barcha parametrlar qidirishning bir qismidir. Fasetalar turli xil buyruqlarda va cheksiz muttasil o'zgarishlarda bo'lishlariga imkon beradi - ikkalasi ham ularni "qirralarning" va bunday notinch o'rgimchakni tuzoqqa aylantiradi.

Endeca va Lucene

Biz tez-tez qidirish bo'yicha saytlar bilan bog'liq muammolarni tez-tez ko'rib turibmiz, chunki endi undan foydalanishni osonlashtiradi. Ushbu navigatsiya texnikasi, uni sozlash uchun talab qilinadigan xarajatlar va tajribalar tufayli juda kamdan-kam hollarda qo'llanilgan va bu xususiyatni (aniq ma'lumot bilan) o'lchovdagi serverga etkazish talablari. Bu o'zgarib bormoqda. Sizning ma'lumotlaringiz qanday qulflangan bo'lsa-da, Endeca (hozir Oracle) yoki Lucene (Apache loyihasi) kabi ba'zi mahsulotlar uni silamoqdalar va qavatma-yuz tuzilgan sayt tuzish komponentlariga ulanish uchun kerakli ma'lumotlar bazasini va indekslarini yaratishlari mumkin saytga qidirish.

Endeca uzoq vaqtdan buyon korporativ darajadagi tijorat dasturiy ta'minotiga aylandi, shuning uchun bu mavzu paydo bo'lganda ularning nomi juda ko'p. Albatta, bu ishonch uchun pul to'laysiz. Ammo o'zingizning ishonchingiz va kuchli ishlab chiquvchi jamoangiz bo'lsa, muqobil (erkin va ochiq manba) Lucene dasturiy ta'minotining muqobil qismi mavjud.

Lucene, menga aytilganidek, men ushbu dasturiy ta'minot to'plamidan tajriba ishlab chiquvchi emasman-Endeca deyarli hamma narsani qiladi, hatto korporativ darajadagi ishlashi bilan ham bepul. Endeca singari, bir xil ekotizim bilan birgalikda ishlaydigan ayrim mahsulotlarning qopqog'i ham bor. Ushbu ekotizimning yuqori qismi Apache Software Foundation (kompaniyaning ekvivalenti), undan so'ng Lucene loyihasi (mahsulotga o'xshash) hisoblanadi va bundan keyin haqiqiy Web-foydalanuvchi usuli - Solr yoki Elastic Search haqida gapiradigan qism.

Shunday qilib, bu Lucene va Endeca materiallari, "The Cloud" ning siz bilan ishlashni to'xtatib turishi va ularga biroz eski DIY-hissiyotlari bo'lishi kerak bo'lgan IT-infratuzilmasi ob'ekti deb e'tirof etiladi. Agar siz kichikroq firma bo'lsangiz yoki dasturning og'rig'ini istamasangiz va eng yaxshi kelishuvga asoslangan eng yaxshi amaliyotlardan foydalanishni istasangiz va korporativ sinf deb hisoblansangiz, har doim Demandware Endeka / Lucene kompaniyalari orasida WordPress-dagi WooCommerce-ning bir nechta ekstremal va nostandart nusxalarini to'ldirgan boshqa mahsulotlar ham bor.

Bundan tashqari, IBM, Microsoft va SAP kabi, albatta, katta texnologiyali o'yinchilarning hammasi veb-sahifadagi qidirish muammolarini hal qilish uchun biror narsa taklif qilishadi. Endeca va Lucene bu muammolarni hal qilishda SEO bo'lganingizda qayta-qayta takrorlanadigan ismlardir, shuning uchun bu osonlik bilan ushbu ko'p tomonlama qidirish muhokamasini tashkil etishning oson usuli, lekin u erda haqiqatan ham spektrning har bir uchida boshqalar bo'lsa, va ularning orasida ko'p sonli. Masalan, agar siz bulutni "Demandware" ning qulayligini istasangiz, biroq baribir raqobatbardosh ustunlik uchun haddan tashqari moslashtirishni boshlash uchun uyda bir kunning o'zida qabul qilish imkoniyati bilan yuqori darajadagi Hybris va pastda Magento bor.

Ikki favqulodda senariy

Biroq, kunning oxirida ushbu infratuzilmalar bir necha turdagi qidirishga ega bo'lib, bir xil muammolarni hal etishga to'g'ri keladi. Umuman olganda, izlanishlar bo'yicha qidiruv ikki toifaga bo'linadi. Millionlab potentsial sahifalar "imkon yaratildi" yoki:

  1. Bir sabab bilan yoki boshqa sabablarga ko'ra qidirishni umuman ko'rinmas
  2. Qo'ng'iroq qilish uchun ko'rinadi, lekin Googlebot hech qachon brauzerni tekshirib chiqishni yakunlamaydigan sayt yaratadi

Birinchi stsenariyda qidirish uchun ko'rinmas yuzli qidirish saytlari ko'rinmasdir, chunki foydalanuvchi interfeysi eski moda CGI-form elementlari bilan qurilgan va qidiruvni bajarish uchun JavaScript-ni topshirishni yoki bajarilishini talab qiladi yoki aslida uni tekshirib ko'rish mumkin, sayt egalari robots.txt yoki boshqa mexanizm orqali saytni skanerlash / kataloglashtirish imkoniyatini "o'chirib qo'ygan". Odatda, ular vaziyatning qayg'usiga uchragan.

Ikki-sonli vaziyatda, butun yuzli qidirish saytlari va yaratadigan barcha mumkin sahifalar Google tomonidan mukammal ko'rish mumkin. Biroq, sahifalar hech qachon tugamaydi va 99% bu tugallanmagan taramalar ikki nusxadagi kontentdir. Boshqacha aytganda, bu o'rgimchak to'ri. Google butun saytingizni ko'radi, lekin oldindan belgilagan vazifaning kulgililigi sababli, u vazni va keyingi saytga o'tadi.

Noyob o'ylab ko'ring, ammo tanqidiy jihatdan muhimki, bu o'rgimchak to'ri sizning saytingizga osonlikcha joylashtirilishi mumkin bo'lgan muhim sahifalardagi "asosiy to'siq" ni suyultirish yoki butunlay og'dirib, qidiruv natijalariga ta'sir ko'rsatadi. - qidirish yo'llari (asosiy va ikkilamchi navigatsiyani) aniqlab oling va ma'lum qidiruv va ma'lum konvertatsiya kalit so'zlari bilan mos kelish uchun tweaked.

Haqiqiy Haqiqiy hayot daraxtlari shartlarini o'ylab ko'ring

Xullas, bu hodisa ana shoxlar va daraxtning filiallari kabi asosiy sahifani yoqishdir. Ular, ehtimol, dastlabki ikkita tanlangan tomonni yoki kalit so'z tadqiqotingiz nima bilan muvofiqlashtirilgan "asosiy sahifalarni aniqlash" uchun boshqa mexanizmni ifodalaydi. Magistral va filiallar asosiy hisoblanadi. Ular sizning ustozingiz kanonik bo'lmagan nusxadagi sahifalar to'plamidir - ular aslida qidirilgan parametrlarni tanlash orqali ishlab chiqarilganmi yoki yo'qmi. (Sizning asosiy sahifalaringiz shu jumladan bo'lishi mumkin).

Agar sizning saytingiz milliondan ortiq sahifani yaratsa ham, 100 dan 10000 sahifaga qadar ushbu "yadro" sizning usta kanonik to'plamingiz bo'lishi mumkin. Boshqa barcha millionlab asosan ikki nusxadagi farqlar kanonik belgilarni yadro to'plamidan eng yaqin mos keladigan URLga qaytarishi mumkin. Ha, agar sizning ba'zi bir maxsus ishlab chiqarish ishlari bu erda bo'lishi mumkin elektron tijorat platformasi Bunday qut-barakali fokuslarni qo'llab-quvvatlamaydi.

Bu o'rgimchak to'rlarini nazorat ostiga olishning yondashuvlaridan faqat bittasi - har bir narsa indeksni bildiring ... o'rgimchak to'ri mavjud bo'lishiga yo'l qo'ying ... lekin Googlega nima sodir bo'layotgani va qanday qilib oxir oqibat qanday taraqqiy etayotgani aniq bo'lishi kerak. ochiq-oydin yadro / muhim-to'plam ustun va ehtimol keraksiz ish. Sayt-modifikatori bilan Google qidiruvi, hozir siz aniq reklama qilayotgan va taxminan past ustunlikdagi permutatsiyalar deb hisoblanmaydigan qolgan qismlar bilan qaytib kelishi mumkin.

Eng yaxshi echimlar har doim bir sayt tomonidan cheklangan miqdordagi sahifalarni yaratadigan va Google bir necha kun ichida ularning barchasini aylantirishi mumkin. Ishlamoqchi bo'l Soxta qurbaqa saytga qarshi (ko'p xotira bilan). Agar u hech qachon tugamasa, sizda o'rgimchak to'ri bo'lishi mumkin.

Har qanday daraxtga o'xshaydi, bu qiyin bo'lishi mumkin, lekin barglarni sanash mumkin! Bu mumkin, lekin siz tugatishingiz kerak. Shunday qilib, qurbaqa qurbaqasini to'g'ri sonli saytni tekshirib chiqadi.

Buyurtma masalalari - ruxsatnomalarni kesish

Fasetalarning ma'lum hibridizatsiyasi vaziyatni nazorat ostida ushlab turishga yordam beradi, masalan, muayyan chiziqlarni faqat ba'zi boshqa tomonlar bilan birgalikda ma'lumotlar aloqasi cheklovlarini aks ettirish va amalga oshirish uchun faollashtira olasiz. Buni juda ko'p sonli burg'ulash-navigatsiya sxemasining qidirish moslamalari bilan birgalikda ko'rib chiqishingiz mumkin. (Fasetalar aniq pastga tushadigan darajalarda ko'rsatilgan). Pastga tushuvchi navigatsiya so'rovlar parametrlariga ma'lum buyurtma berishni talab qiladi (papkalar sifatida obdon yoki yo'q).

O'zingizning URL-laringizni ehtiyotkorlik bilan, muayyan kuchga ega buyruqlar bilan qirralarni tuzishingiz mumkin, shunda siz faqat almashtirishlar o'rnida kombinatsiyalar bilan ishlaysiz. ("Kombinatsiyalarga nisbatan permutatsiyalar" ni qidirib toping.) Ayniqsa, A holatida va keyin B holatida B holatida, so'ngra B tomoni va undan keyin A tomonini tanlang, URLlar turli xil bo'ladi, lekin natijada sahifa xuddi shunday. Bu faqat alifbo tartibida yoki URLda parametrlarning qanday ko'rinishini olish uchun oldindan belgilangan tartibdan foydalanib tuzilishi mumkin.

Va nihoyat biz sayt-iyerarxiya uchun daraxt-metafora bilan yopishib qolganimizni eslaylik, daraxtning maqsadi quyosh nuri eng samarali tarzda qo'lga olish uchun barglari bilan sirt maydoni yaratish uchun uning novdalari, novdalari va barglarini tarqatishdir. Evolyutsiya daraxtlarni shakllantiradi, shunda ular yorug'likni eng samarali tarzda qo'lga kiritgan nuqtadan o'tib bormayapti.

Saytni shakllantirish

Ushbu maqolaning ochilishida ta'kidlanganidek, ko'p tomonlama qidirish saytlari yoki ularning saytini izlashga yoki imkansiz tekshirishga qodir emas. Haqiqiy javob ortida - ijodiy-shakllantirishda. Buni o'chirib tashlashning ko'p usullari mavjud, robots.txt dosyanangizga Google Qidiruv Konsolining (avvalgi veb-menejeri asboblari) sozlamalarini tweaking qilish uchun siz manba-resursingizda meta teglarni o'zgartirish uchun.

Ushbu yechimlar turli-tuman bo'lib, ularning barchasi butun dunyo bo'ylab kalit so'zlarni maqsadli strategiyasi bilan boshqarilishi kerak, va sizning texnologiya platformangiz tomonidan qo'llab-quvvatlanadigan va sizning jamoangiz tomonidan amalga oshiriladigan narsalarga asoslanadi. Tabiiy cheklovlar bilan aniqlangan tabiiy daraxtlardan farqli o'laroq, veb-saytlar, hech qachon Google'da yaxshi ishlashi mumkin bo'lmagan holatlardan tashqari, siz hech qachon bilmasligingiz mumkin.