Faceted Search Gone Wild: SEO үшін Endeca & Lucene қызметін тиімді пайдалану

Қарапайым іздеу өте сирек болатын. Енді барлық жерде көрінеді! Бұл мүмкіндікті пайдаланатын сайттарды іздестіруді қалай талқылағаны туралы мәліметтерді дұрыс емес ету - электрондық коммерция сайттарында жиі бұзылған нәрселердің бірі. Біз Flying Point Digital-де осындай мәселелерге кезігеміз және SEO тұрғысынан бұл жай ғана «жақсы категориялы беттерді жасау» емес. Бұл түзетудің маңызды бөлігі болса да, бұл тек жартысы ғана.

Рахмет, капитан айқын

Мақаланы жазған кезіміз келе ме, бұл SEO үшін бұл сайтты навигация әдісі қаншалықты жақсы болуы мүмкін екенін және қандай-да бір ізденісте болып жатқан нәрсені қадағалау немесе дұрыс түсінбеу. Бұл бірдей, ескі, кездейсоқ өрмекші-тұзақ тарихымен, бірақ бұрылыста. Немесе жаңа өлшемдермен айту керек. SEO индустриясында болған адамдар үшін бұл мәселені шешу үшін екіталай ақпараттар бар. Нақты шарлау «іздестіруге дайын» ​​болғандықтан, фракциялы іздеу іздеу мүмкіндігінше әртүрлі ықтимал фрагменттерді таңдаған кезде кең пішінді тұзақты жасайды.

Мәселе анықталды. Шешімдер жабық. SEO-саласының тұзды ескі иттері кетуі мүмкін. Бұл туралы тек естуді немесе онымен айналысатын адамдарды оқу. Біз сізді тарихымыздың бір бөлігіне айналдырып, мұндай сайттарда жиі кездесетін нашар жағдайды бастан кешіреміз, содан соң бір ықтимал шешімнің бірнеше кең жолағын шығарамыз.

Біз сізді тарихымыздың бір бөлігіне айналдырып, мұндай сайттарда жиі кездесетін нашар жағдайды бастан кешіреміз, содан соң бір ықтимал шешімнің бірнеше кең жолағын шығарамыз

Миллион бұйымдар каталогы

Миллиондаған ірі каталогтармен, тіпті он мыңдаған өнімдермен бірге электрондық коммерция бар болса, онда баға мен түс пен өлшем сияқты құрылымдық деректер бар. Сондай-ақ, мұндай өнім-анықтамаларды пайдаланып, іздеу және сүзу айналасында құрылған пайдаланушы интерфейстерін сипаттау үшін таңдалады.

Күрделі іздеу - іздестіруді нақтылау үшін кілт сөздерді немесе шарлау кезінде бұрғылаудан басқа, барлық сүзгілерді басуыңызға болады. Мұнда кейбір формальды анықтамалар бар және тұспалданған тәртіптегі сезімталдық (бұл бұрғылау шарлауында жоқ). Тапсырыс-сезімтал мәзірлерді (веб-гиперсілтемелер сияқты) төмен бұрғылау сіздің барлауыңызға белгілі бір нақтылықты білдіреді. Сіз «таба» аласыз, қатты дискідегі немесе ағаштан түйіндердегі файлдарға ұқсас. Мүмкін болғанымен, бұрғылау навигациясы бар паук ұстағыштарын жасау оңайырақ. Веб негізінен бұл қалай жұмыс істейді және бұл Google іздеу және индекстеу сияқты керемет және тиімді жүйені жасады. Сондай-ақ, бұл Google-ге «ұнатпайтын» динамикалық сайттар үшін әділетсіз беделге ие болды.

Өрмекші-тұзақ және аралас хабарлар

URL мекен-жайы бойынша сұрақ белгісі енгізілгеннен кейін, сайт «динамикалық» деп есептеледі және сайт мәңгілікке созылуы мүмкін. Күнтізбе веб-бетін әрдайым «келесі күні» сілтемесін басу туралы ойланыңыз. Шынында да, паук ұстаушыны жасау өте оңай. Бұл сайттың динамикалық немесе нашар немесе Google-ге оқымайтын кез келген жолмен сұрақ белгісі болмайды. Бұл сұрақ белгісі Google сайттарының кейбір түрлеріне бір сәтте қоятыны туралы, сондай-ақ тексеріп шығатын сайттармен жұмыс істеуге мүмкіндік беретін сұрақ белгісі болып табылады. Немесе Google-дің барлық шексіз ресурстары бір кішкентай сайтқа қарапайым қарапайым шексіз күнтізбені тексеруге жұмсалады.

Динамикалық сайттар (немесе URL мекенжайлары) кейбіреулер өздерін жақсы сезінгендіктен жаман емес. Жаман емес, бұл кездейсоқ өрмекші тұзақтарды жасау қаншалықты оңай емес және сізде тіпті проблема бар екенін түсінбейді. Google тарапынан олар келесі сайтқа бірнеше шынайы жолмен кіріп жатыр, сондықтан олар өз уақыттарын дөңгелектеріне айналдырмайды. Google бүгінгі күні өрмекшілердің тұзақтарына батып, бірнеше миллион беттерін тартып, олар туралы ештеңе біле алмайтынын көру үшін әлдеқайда дайын.

Бұл мақалада біз навигациялық схема жиі қашықтан іздеу деп аталатын динамикалық URL спиртінің тұзағының нақты түріне назар аударамыз. Көңілді сөз, қыры. Сіз асыл тастардың кесілген беттерін ойлайсыз. Менің ойымша, электрондық коммерцияға қызмет ететін болсақ, біз әйгілі және параметрлік немесе салыстырмалы немесе көп өлшемді немесе өріс сүзгісі бойынша іздеуді айтудан гөрі оңай. Параметрлі іздеудің барлығы бірдей емес. Фасеттегі әртүрлі тапсырыстарды және шексіз өтпелермен айналысуға мүмкіндік береді - бұл олардың «қырлары» және сол сияқты ерекше пышақ тәрізді тұзақ.

Endeca және Lucene

Біз іздестіру сайттарымен жиі кездесетін проблемаларды байқап отырмыз, себебі оны қазір қолданатын сайттарды жасау оңайырақ. Бұл навигация әдісі, оны орнату үшін қажет шығындар мен сараптаманың арқасында айтарлықтай сирек кездеседі және масштабта бұл мүмкіндікті (дәл деректермен) жеткізудің сирек серверлік талаптары. Бұл өзгереді. Деректеріңіздің қандай бұғатталғанына қарамастан, Endeca (қазір, Oracle) немесе Lucene (Apache жобасы) сияқты кейбір өнім оны шолып, дерекқорды және индекстерді құрастыра алады, олар қабаттың сайтқа іздеу.

Endeca компаниясы бұрыннан келе жатқан коммерциялық-коммерциялық бағдарламалық қамтамасыз ету болып табылады, сондықтан бұл тақырып туындаған кезде олардың атын көп еститін. Әрине, бұл сенім үшін төлейсіз. Бірақ өзіңіздің сенімділігіңіз және күшті әзірлеушілер командаңыз бар болса, Lucene бағдарламалық жасақтамасының жеке меншік емес (еркін және ашық көзі) стека бар.

Lucene, мен айтқанымдай, бұл бағдарламалық жасақтама стекімен тәжірибелі әзірлеуші ​​емеспін - Endeca барлық деңгейде тіпті кәсіпорын деңгейіндегі өнімділікпен де, тегін де істейді. Endeca сияқты, шын мәнінде, бір экожүйеде бірге жұмыс істейтін жеке өнімдердің тұтас тұтқасы бар. Бұл экожүйенің жоғарғы жағы Apache Software Foundation (компания баламасы), содан кейін Lucene жобасы (өнімнің баламасы) болып табылады, содан кейін нақты веб-интерфейсін жасайтын бөлік - Solr немесе Elastic Search.

Осылайша, Lucene және Endeca-дың барлық материалдары, «The Cloud» -ның сізді ұстап қалудан және ескі мектеп DIY-сезімінің біраз бөлігінен тұратын АТ-инфрақұрылымының материалы екенін мойындайды. Егер сіз кішігірім компания болсаңыз немесе оны іске асырудың ауырсынуын қаламасаңыз және ең жақсы келісілген ең жақсы тәжірибелерді қораптан тыс пайдалануды қаласаңыз және бұрынғыдай кәсіпкерлік сынып деп есептесеңіз, әрқашан Талап ету бағдарламасы бар немесе Endeca / Lucene-дің экстремалды және WordPress-те WooCommerce-дың өзін-өзі қабылдаған данасы арасында никтерді толтыратын басқа да өнімдердің иесі.

Сонымен қатар, IBM, Microsoft және SAP секілді шын мәнінде үлкен технологиялық ойыншылар да Web-тің іздестірілу проблемасын шешу үшін бірдеңе ұсынады. Endeca және Lucene - осы проблемаларды шешуге арналған SEO болған кезде қайта-қайта есімдер болып табылатын атаулар, сондықтан бұл іздеуді талқылауды жеңілдететін әдіс болып табылады, бірақ, әрине, спектрдің әрқайсысында басқа адамдар бар екенін есте сақтаңыз, және олардың арасындағы сансыз көп. Егер, мысалы, бұл бұлт-Demandware-дің оңай болуын қаласаңыз, бірақ бір уақытта үйде біреудің бәсекелестік артықшылығы үшін экстремалды теңестіруді бастау үшін, күнделікті үйде қабылдау мүмкіндігімен жоғары деңгейдегі Hybris және төменгі деңгейдегі Magento бар.

Екі экстремалды сценарий

Бірақ, күннің аяғында, барлық осы инфрақұрылымдар кейбір іздестірулердің кейбір түріне ие және бірдей мәселелер жиынтығын шешуге тура келеді. Әдетте, іздеу екі санаттың біріне жатады. Мүмкін болатын беттердің барлығының миллиондағаны:

  1. Бір себептермен немесе басқа себептермен іздеу мүлдем көрінбейді
  2. Іздеуге болады, бірақ Googlebot ешқашан тексеріп шығуды және зерттеуді аяқтайтын сайтты жасайды

Бірінші сценарийде іздеуге болатын көрінбейтін іздеу сайттары не көрінбейді, себебі пайдаланушы интерфейсі ескі CGI-пішін элементтері арқылы жасалады және іздеуді орындау үшін JavaScript-ні жіберуді немесе орындауды талап етеді немесе шын мәнінде тексеріп шығады, бірақ сайт иелері Google-ді robots.txt немесе басқа механизмдер арқылы сайтты тексеріп / индекстеу мүмкіндігін «өшірді», себебі олар жағдайдың екіқабілісі болған.

Нөмірдің екінші жағында, бүкіл іздестіру сайтында және ол жасай алатын барлық ықтимал беттер Google арқылы өте жақсы тексеріледі. Дегенмен, беттер ешқашан аяқталмайды және 99% бұл аяқталмаған тексеріп шығу - қайталанатын мазмұн. Басқаша айтқанда, бұл паук-тұзақ. Google сіздің бүкіл сайтыңызды көреді, бірақ сіз алдында қойылған міндеттің күлкілі болуына байланысты ол келесі сайтқа көшеді.

Сайттағы сирек ойластырылған, бірақ сыни тұрғыдан алғанда, бұл паук ұстаушының сіздің сайтыңыздың оңай болуы үшін орналастырылуы мүмкін болатын маңызды беттердің «негізгі жиынтығын» сұйылту немесе толығымен жалаңаштау арқылы іздеу рейтингіге әсер етеді - табу жолдары (басты және қосымша навигация) және белгілі іздеуге және танымал кілт сөздерді сәйкестендіру үшін tweaked болуы керек.

Нағыз шынайы ағаштар туралы ойланыңыз

Мәселен, негізгі парақшалар мен ағаштың бұтақтары сияқты негізгі беттер жиынтығын жарықтандырады. Олар, мүмкін, алғашқы екі таңдаулы фрагменттерді немесе сіздің «кілт сөзіңіз» бойынша зерттеу жүргізілетінімен үйлестірілген «негізгі беттер жиынтығын анықтауға» арналған басқа механизмді білдіреді. Магистральдар мен бұтақтар негізгі болып табылады. Олар сіздердің мастер-классикалық емес қайталанбайтын беттер жиынтығы - нақты іздеу параметрлерін таңдау арқылы шын мәнінде шығарылған немесе шықпаған. (Сіздің негізгі беттеріңіз осыдан тура болуы мүмкін).

Тіпті егер сіздің сайтыңыз миллионнан көп беттерді шығара алса да, 100-ден 10 000-ға дейінгі кез келген бұл «ядро» сіздің шеберлік канондық жиынтығы болуы мүмкін. Көптеген басқа миллиондаған негізінен қайталанатын нұсқалар канондық тегтерді ядро ​​жиынтығынан ең жақын сәйкестендірілген URL-ке қайтара алады. Иә, егер мұнда сіздің жеке жұмысыңыз болса, онда сіздермен жұмыс жасай аласыз электрондық коммерция платформасы мұндай қораптан тыс үрдістерді қолдамайды.

Бұл паука торларын бақылауға алудың бірден-бір тәсілі. Бәрі индекстеуі керек ... паук ұстаушы өмір сүре берсін ... бірақ Google-ге не болып жатқаны туралы түсінік беріңіз, айқын ядро ​​/ маңызды жиынтық жоғары деңгейдегі және, мүмкін, қажетсіз жұмыс. Торапты модификаторымен бірге Google-іздестіруі сіз енді нақты жарнама жасайтын канондық негізгі беттер саны бар және сіз қабылдайтын қалған басымдықтар төмен басымдықтар болып табылмайды.

Үздік шешімдер әрдайым сайттан соңғы беттер саны ғана жасалуы мүмкін және Google бірнеше күннің ішінде олардың бәрін айналдыра алады. Жұмыс істеп көріңіз Саңырауқұлақ лағы сайтқа қарсы (көп жады бар). Егер ол ешқашан аяқталмаса, сізде паук тұзағы болуы мүмкін.

Бұл кез келген ағашқа ұқсайды, қиын болуы мүмкін, бірақ сіз шын мәнінде жапырақтарды санай аласыз! Мүмкін, бірақ сіз аяқтаңыз. Сондай-ақ, Шексіз лягушка дұрыс сайттан тексеріп шығады.

Сұранымдарды тапсыру - рұқсаттарды қысқарту

Фактілердің кейбір гибридизациясы жағдайды бақылап отыруға көмектеседі, мысалы, белгілі бір қырларға тек кейбір деректермен байланысты шектеулерді көрсету және орындау үшін кейбір басқа қырлармен бірге белсендіруге мүмкіндік береді. Бұны ең іздеуге болатын бұрғылау навигациясының схемасының тіркесімін қарастыруға болады. (Фассация нақты бұрғылау деңгейлерінде арнайы ұсынылған). Бұрғылау навигациясы сұрау жолының параметрлері үшін белгілі бір тапсырысты орындауды талап етеді (қалталар түрінде немесе жоқ).

Сондай-ақ, URL-мекен-жайыңызды фракцияларға белгілі бір тәртіппен мұқият құрастыруға болады, сондықтан сіз перестандарттардың орнына тек комбинациялармен айналысып жатырсыз. («Комбинацияларға қарсы перемеживтерді» іздеңіз.) Әсіресе, егер A факатын таңдасаңыз, содан кейін B фракциясы бар болса, содан кейін B факциясы, содан кейін A фракциясы басқа болса, URL әртүрлі болады, бірақ нәтижесінде бетті бірдей. Бұны әліпбилік ретпен немесе URL мекенжайында параметрлердің қалай пайда болатыны туралы алдын-ала анықталған ретпен пайдалану арқылы реттеуге болады.

Ақыр соңында, біз сайт-иерархия үшін ағаш-метафорамен тығыз байланыста екендігімізді еске түсіре отырып, ағаштың мақсаты - күн сәулесін ең тиімді түсіру үшін жапырақтары бар беткі аймақты құру үшін бұтақтарын, бұтақтарын және жапырақтарын тарату. Эволюция ағаштарды ең тиімді түрде жарық түсіретін нүктеден өткенше жалғастырмайтындай етіп қалыптастырды.

Сайтты көрнекі түрде пішімдеу

Осы мақаланың ашылуында айтылғандай, көптеген іздестіру сайттары немесе олардың сайтын іздеуге немесе мүмкін болмай-ақ тексеруге болатын негізгі жұмысты жасайды. Нақты жауап ортағасырлық көркемдік-пішінде. Роботтар.txt файлына түзетулерді Google Search Console (бұрынғы Webmaster Tools) параметрлеріне өзгерту үшін, сіздің көзқарас көзіңіздегі мета тегтерді өзгерту үшін, оны өшірудің бірнеше жолы бар.

Шешімдер әртүрлі болып табылады және бәрі кілтсөзді мақсатты іздеу стратегиясымен басқарылады және сіздің технологиялық платформаңыздың қолдауымен және сіздің командаңызға қолжетімді болып табылады. Табиғаттың шектеулері бойынша анықталған табиғи кескіндерден айырмашылығы, фасаттық веб-сайттар ешқашан Google-да жақсы жұмыс істемеген жағдайдан басқа ештеңе білмеуі мүмкін.