Faceted Search- ը գնացել է վայրի: Effecively օգտվում Endeca & Lucene համար SEO

Faceted որոնումը բավականին հազվադեպ է եղել: Հիմա, կարծես, ամենուր: Մանրամասների մանրամասներ ստանալու համար, թե ինչպես եք վախեցրել այս հնարավորությամբ կայքերի որոնման տեսանելիությունը այսօր ամենից հաճախ կոտրված է էլեկտրոնային առեւտրի կայքերում: Մենք Fight Point Digital- ում նույն խնդիրներն ենք կրում, եւ SEO- ի տեսանկյունից դա պարզապես «ավելի լավ կատեգորիայի էջեր» է: Թեեւ դա ամրագրման կարեւոր մասն է, դա միայն կես պատմությունն է:

Thanks, Կապիտան ակնհայտ է

Կա բավականաչափ վերահսկողություն կամ սխալ պատկերացում, թե ինչ է կատարվում հետամնաց որոնման հետ եւ որքանով է լավ այս կայքի նավարկության տեխնիկան SEO- ի համար, որ ժամանակն է, որ գրել ենք հոդված: Դա նույնն է, տարիքը, պատահական spider- թակարդի պատմությունը, բայց մի twist. Կամ, պետք է ասենք նոր չափորոշիչներով: Նրանց համար, ովքեր եղել են SEO- ի արդյունաբերության մի քանիսը, դա, հավանաբար, շատ տեղեկություններ է, այնպես էլ ներկառուցված եւ ամրագրել խնդիրը: Faceted որոնումը ստեղծում է spider- թակարդը, որքան հնարավոր է, քանի որ ձեր նավարկությունը «փնտրելու բարեկամ» է:

Խնդիրը որոշված ​​է: Լուծումներ անուղղակի: SEO- ի արդյունաբերական արդյունաբերության աղի հին շները կարող են հեռանալ: Նրանց համար, ովքեր պարզապես լսել կամ զբաղվել են առաջին անգամ, կարդացեք: Մենք ձեզ մի քիչ պատմության մեջ կմտնենք, այնպիսի վատ իրավիճակ, որը հաճախ առկա է նման կայքերում, եւ վերջապես վերջնականապես լուծելու մի լուծման մի քանի լայն հարված:

Խնդիրը որոշված ​​է:  Լուծումներ անուղղակի:  SEO- ի արդյունաբերական արդյունաբերության աղի հին շները կարող են հեռանալ:  Նրանց համար, ովքեր պարզապես լսել կամ զբաղվել են առաջին անգամ, կարդացեք:  Մենք ձեզ մի քիչ պատմության մեջ կմտնենք, այնպիսի վատ իրավիճակ, որը հաճախ առկա է նման կայքերում, եւ վերջապես վերջնականապես լուծելու մի լուծման մի քանի լայն հարված:

Միլիոն ապրանքատեսակների կատալոգներ

Այնտեղ, որտեղ կա էլեկտրոնային առեւտուր, միլիոնների կամ նույնիսկ տասնյակ հազարավոր ապրանքատեսակների խոշոր կատալոգներ, այնտեղ կառուցված տվյալները, ինչպես գինը եւ գույնը եւ չափը, նկարագրելու համար: Եվ այդպիսի արտադրանքի օգտագործողների միջոցով որոնման եւ զտման շուրջ ստեղծված ինտերֆեյսի նկարագրության համար ընտրված տերմինը մանրուք է:

Կատարված որոնումը ընդամենը բոլոր զտիչները կարող եք սեղմել ձեր որոնումը կատարելագործելու համար, առանց ավելորդ բանալիներ, կամ նավիգացիայի հորատման: Այստեղ կա որոշակի ֆորմալ սահմանումներ, եւ ենթադրյալ կարգի անտարբերություն (ինչը չի ներառում թմբիրի նավիգացիան): Հրամանատարության զգայուն մենյուների (օրինակ `վեբ հիպերտոնիկների) միջոցով հորատումը ենթադրում է որոշակի եզրակացություն ձեր ուսումնասիրության մեջ: Ամեն ինչ «գտնելու» նման է ծառի կոշտ սկավառակի կամ հանգույցների ֆայլերի հետ: Թեեւ դա հնարավոր է, ուղղակի դժվար է ստեղծել ծովագնացություն թակարդներ, որոնք խորը ցածր նավերով են ընթանում: Այսպիսով, Վեբը հիմնականում աշխատում է, եւ դա այն է, ինչ Google- ի որոնման-ինդեքսին նման փայլուն եւ արդյունավետ համակարգ է ստեղծում: Դա նաեւ այն է, ինչ Google- ին տվեց անբարեխիղճ հեղինակություն "դուր չգալով" դինամիկ կայքեր:

Spider- թակարդները եւ խառը հաղորդագրությունները

Կայքի URL- ին ներկայացվելիք հարցի նշանն այն է, որ կայքը համարվում է «դինամիկ», եւ կայքը կարող է շարունակվել: Մտածեք օրացույցի կայքէջի մասին, որտեղ միշտ կարող եք սեղմել «հաջորդ օրը» հղումը: Դա իսկապես պարզ է, որ ստեղծել է spider- թակարդը: Եվ դա ոչ մի հարցի առկայություն չէ, որը դարձնում է կայքի դինամիկ կամ վատ կամ անընթեռնելի Google- ին: Դա այն հարցադրման նշանն է, որ Google- ը պետք է որոշակի վայրում դնի որոշ կայքերի տեսակների վրա եւ ստանա բիզնեսի սողացող կայքերի գործերը, որոնք ոչ մի բան չարիք են դարձնում: Կամ էլ, Google- ի բոլոր թվացող անսահման ռեսուրսները կծախսվեն մեկ փոքրիկ կայքում մի պարզ անսահման օրացույց:

Դինամիկ կայքեր (կամ URL- ներ) բնորոշ չեն վատ, քանի որ որոշ մարդիկ զգում են: Վատն այն է, թե որքան հեշտ է պատահական spider- թակարդներ կատարել եւ երբեք չհասկանալ, որ դուք նույնիսկ խնդիր ունեք: Google- ի կողմից, նրանք պարզապես հասանելի են հաջորդ կայքում որոշակի իրատեսական ձեւով, այնպես որ նրանք չեն ծախսում իրենց ժամանակին, իրենց անիվները մղելով: Google- ն այս օրերին շատ ավելի պատրաստակամություն ունի, որպեսզի խստորեն սուզվելով spider- թակարդների մեջ, քաշեք մի քանի միլիոն էջ եւ տեսնեք, թե արդյոք նրանք չեն կարող դա անել:

Այս հոդվածում մենք ուշադրություն ենք դարձնում որոշակի տեսակի դինամիկ URL spider- թակարդի վրա, որը առաջ է բերվում նավիգացիոն սխեմայի կողմից, որը հաճախ կոչվում է որոնում: Զվարճացիր խոսք, առասպելներ: Պատկերացնում եք, որ մտածում եք զարդի կտրված դեմքերից: Կարծում եմ, որ էլեկտրոնային առեւտրին ծառայում ենք միայն լավ, եւ դա ավելի հեշտ է, քան կամայականորեն parameterized կամ վերագրելի կամ բազմաչափ կամ դաշտային ֆիլտրացված որոնում: Ոչ բոլոր պարամետրավորված որոնումը բոլորը չէ: Ֆասեթները հակված են թույլ տալ, որ նրանք գնան տարբեր կարգադրություններով եւ թվացյալ անսահման տեղաշարժերով, այնպես էլ այն, ինչը նրանց ստիպում է «ֆասեթներ» եւ նման հատկապես մռայլ սպայացնող թակարդ:

Endeca եւ Lucene

Մենք ավելի հաճախ հանդիպում ենք որոնման կայքերի հետ, քանի որ հիմա ավելի հեշտ է դարձնել այն կայքերը, որոնք օգտագործում են այն: Այս նավիգացիոն տեխնիկան զգալիորեն հազվադեպ է օգտագործվում այն ​​պատճառով, որ պահանջվում է ծախսերի եւ փորձաքննության համար անհրաժեշտ պահանջարկը, ինչպես նաեւ սահուն սերվերային պահանջները այս հատկությունը (ճշգրիտ տվյալները) հասցնելու համար: Դա փոխվում է: Անկախ նրանից, թե ձեր տվյալները փակված են, Endeca- ի (այժմ, Oracle- ից) կամ Lucene- ի (Apache- ի նախագծի) որոշ ապրանքներ կարող են շոշափել այն եւ կառուցել այն բազան եւ ինդեքսները, որոնք անհրաժեշտ են միանալու համար, որոնել կայքում.

Endeca- ն վաղուց արդեն եղել է գերիշխող ձեռնարկատիրության առեւտրային ծրագրային ապահովման համար, որն առաջարկում է որոնում, որն է պատճառը, որ դուք լսել եք նրանց անունը այնքան ժամանակ, երբ այս թեման ծագում է: Դուք այդ վստահության համար վճարում եք, իհարկե. Սակայն, եթե դուք ունեք ձեր սեփական վստահությունը եւ ուժեղ մշակող թիմ, կա ոչ գույքային (ազատ եւ բաց աղբյուր) Lucene ծրագրային փաթեթը այլընտրանք:

Լուչեն, ինչպես ես ասացի, քանի որ այս ծրագրաշարի բլոկով ես փորձառու ծրագրավորող չեմ, գրեթե ամեն ինչ անում է Endeca- ն, նույնիսկ գործարար մակարդակի կատարմամբ, բայց անվճար: Ինչպես Endeca- ի հետ, կա մի առանձին ապրանքի մի ամբողջ կողպեք պայուսակ, որը միատարր էկոհամակարգում աշխատում է: Այդ էկոհամակարգի գագաթը Apache Software Foundation- ը (ընկերության համարժեքը), ապա Lucene- ի նախագիծը (ապրանքի համարժեքը) եւ դրանից հետո այն հատվածը, որը դարձնում է իրական վեբ UI- ը, մենք խոսում ենք `կամ Solr կամ Elastic Search:

Այսպիսով, այս ամենը Lucene- ի եւ Endeca- ի իրերը խոստովանում են, որ ՏՏ ենթակառուցվածքի այն նյութերը, որոնք «The Cloud» - ը պետք է ձեզ պահպանի, չկորցնելով զբաղվել եւ ունենալ մի փոքրիկ DIY- զգացողություն: Եթե ​​դուք ավելի փոքր ընկերություն եք կամ պարզապես ցանկանում եք իրականացնել ցավերը եւ ուզում եք օգտագործել ամենաշատ համաձայնեցված լավագույն փորձը `դուրս-ի վանդակում եւ դեռեւս համարվում է ձեռնարկատիրական դաս, ապա միշտ պահանջարկ է պարունակում: հյուրընկալող այլ ապրանքատեսակները, որոնք լրացնում են Endeca / Lucene- ի միջեւ եղած շեղումները մեկ ծայրահեղության եւ WooCommerce- ի ինքնակամ հյուրընկալված օրինակով WordPress- ում:

Ընդ որում, բոլոր իսկապես մեծ տեխնոլոգիաների խաղացողները, ինչպիսիք են IBM- ը, Microsoft- ը եւ SAP- ը, առաջարկում են ինչ-որ բան լուծել ինտերնետային որոնման խնդիրը: Endeca- ի եւ Lucene- ը այն անուններն են, որոնք առաջ են գալիս այն ժամանակ, երբ դուք SEO- ն այս խնդիրները լուծող եք, այնպես որ սա հեշտ ճանապարհ է այս տեսանկյունից որոնման քննարկման համար, բայց հիշեք, որ այնտեղ, իրոք, ուրիշներն են սպեկտրի յուրաքանչյուր վերջում, եւ անհամար ավելի շատերի միջեւ: Օրինակ, եթե դուք ցանկանում եք, որ այս ամպը հեշտությամբ պահանջարկ լինի, սակայն այն ամենը, ինչ տանում է տանը, օր առաջ սկսելու է մրցակցային առավելությունների համար ծայրահեղ անհատականացման մեջ, այնտեղ Hybris- ը բարձր է, իսկ Magento- ն, ցածր վերջում:

Երկու ծայրահեղ սցենարներ

Բայց օրվա վերջում բոլոր այդ ենթակառուցվածքները որոշակի տեսք ունեն, եւ պետք է զբաղվեն միեւնույն խնդիրներով: Ընդհանրապես, որոնվածը ընկնում է երկու կատեգորիաներից մեկի մեջ: Բոլոր հնարավոր միլիոնավոր պոտենցիալ էջերը «հնարավոր է դարձել» են, կամ `

  1. Լիովին անտեսանելի է մի պատճառի կամ այլ պատճառով փնտրելու համար
  2. Տեսանելի է որոնումը, բայց ստեղծում է այնպիսի կայք, որը Googlebot- ը երբեք չի ավարտի սողուններ եւ հետազոտություններ

Առաջին սցենարում, որոնման անտեսանելի որոնման կայքերը կամ անտեսանելի են, քանի որ օգտագործողի ինտերֆեյսը կառուցված է հին մոդելի CGI ձեւի տարրերով եւ պահանջում է ներկայացնել կամ իրականացնել JavaScript- ի որոնումը կատարելու համար, կամ այն ​​իրականում հասանելի է, սակայն կայքի սեփականատերերը «անջատել» են Google- ի հնարավորությունը, որ կարողանան կայքի robots.txt- ի կամ այլ մեխանիզմների միջոցով ստուգել / մատնանշելը, սովորաբար այն պատճառով, որ նրանք տուժել են իրավիճակի ցավերը:

Երկրորդ իրավիճակում, ամբողջ որոնված կայքը եւ այն հնարավոր բոլոր էջերը, որոնք կարող են առաջացնել, կատարյալորեն հասանելի են Google- ի կողմից: Այնուամենայնիվ, էջերը երբեք չեն ավարտվում, եւ 99 տոկոսը այդ անսպառ սկավառակի կրկնօրինակ բովանդակություն է: Այսինքն, դա spider- թակարդ է: Google- ը տեսնում է ձեր ամբողջ կայքը, բայց այն առաջադրանքի ծաղրածու լինելու պատճառով, այն կթափի եւ շարժվեք հաջորդ կայքում:

Շատ հազվադեպ է մտածել, բայց չափազանց կարեւոր է, որ այս spider- trap- ը ազդեցություն կունենա ձեր որոնման աղյուսակում, թեթեւացնելով կամ ամբողջությամբ obfuscating կարեւոր էջերի «հիմնական փաթեթը» Ձեր կայքը կարող է / պետք է գեներացնող, որը կարող է տեղակայվել հեշտ է - բացահայտել սկավառակի ուղիները (հիմնական եւ երկրորդային նավարկություն) եւ tweaked- ը համընկնում է հայտնի որոնված եւ հայտնի կոնվերտարկվող հիմնաբառերի հետ:

Մտածեք իրական իրական կյանքի ծառերի պայմաններում

Այսպիսով, հնարքն այն է, որ լուսավորեն այդ հիմնական էջը, ինչպես ծառի հիմնական տողերը եւ ճյուղերը: Դրանք թերեւս ներկայացնում են առաջին երկու ընտրված կողմերը կամ որոշ այլ մեխանիզմ `« էջերի հիմնական փաթեթը սահմանելու համար », որը համակարգվում է ձեր բառապաշարի հետազոտության հետ: Խողովակներն ու ճյուղերը հիմնականում են: Դրանք ձեր վարպետն են կրոնական ոչ կրկնօրինակ էջերի վրա, անկախ այն հանգամանքից, թե արդյոք դրանք իրականում արտադրվում են, որոնելով տարբերակված որոնման պարամետրերը: (Ձեր հիմնական էջերը կարող են այդպիսին լինել):

Նույնիսկ եթե ձեր կայքը կարող է առաջացնել միլիոնավոր էջեր, քան այս էջը, 100-ից մինչեւ 10,000 էջերի ցանկացած «հիմքը» կարող է լինել ձեր տերը քրոնիկները: Մնացած բոլոր միլիոնավոր հիմնական կրկնօրինակ տատանումները կարող էին ունենալ կրկնօրինակի պիտակներ դեպի հիմնական հավաքածուի առավելագույնը համապատասխանող URL- ն: Այո, այստեղ կարող է լինել մաքսային զարգացման որոշ աշխատանքներ էլեկտրոնային առեւտրի հարթակ չի պաշտպանում նման դրսի տիպի հնարքները:

Եվ սա ուղղակի մեկն է, որ այս հրաձիգի թակարդները հսկողության տակ վերցնեն, թող ամեն ինչ իջնեն ... թող թողնեք թեւի թիրախը ... բայց պարզեք Google- ին այն մասին, թե ինչ է տեղի ունենում, եւ ինչպես, ակնհայտ հիմնական / կարեւորագույն հավաքածուը գերազանցող եւ թերեւս ավելորդ աշխատանք է: Կայքի փոփոխիչով Google- ի որոնումը պետք է վերադառնա մոտավորապես այն քանակով, որ դուք այժմ հստակորեն գովազդում եք, եւ մնացածը, որը դուք ընդունում եք, ցածրակարգ գերակայություններ են:

Լավագույն լուծումները մշտապես այնպիսին են, երբ էջի վերջնական քանակությունը կարող է առաջացնել կայքի կողմից, եւ Google- ը կարող է մի քանի օրվա ընթացքում շրջանցել դրանք: Փորձեք վազել Screaming Frog դեմ կայք (շատ հիշողությամբ): Եթե ​​դա երբեք չի ավարտվում, դուք կարող եք ունենալ spider թակարդը:

Դա նման է ցանկացած ծառի, դա դժվար է, բայց դուք կարող եք իրականում հաշվել տերեւները: Դա հնարավոր է, բայց դուք կավարտեք: Այսպիսով, Screaming Frog- ը կավարտի պատշաճ ձեւով վերջացած կայքը:

Պատվերների հարցերը `կտրելու թույլտվությունները

Առանձին հիբրիդիզացիաները կարող են օգնել վերահսկել իրավիճակը, օրինակ `որոշակի գործառույթների կատարումը, որոնք կարող են ակտիվացնել որոշակի այլ առումներով` արտացոլելու եւ կիրառելու տվյալների կապակցման սահմանափակումները: Կարող եք դա համարել ավելի շատ վերջավոր հարվածային նավիգացիոն սխեմայի համադրություն, որոնման ձեւերով: (Մասնակիցները ներկայացված են որոշակի հորատման մակարդակներում): Ուղղորդող նավարկումը ձգտում է կիրառել որոշակի պատվերի ձեր հարցման պարամետրերի պարամետրերին (obfuscated որպես թղթապանակներ, թե ոչ):

Դուք կարող եք նաեւ կառուցել ձեր URL- ների ուշադրությունը, որոշակի ուժի մեջ մտնել պատվերի հետ, այնպես, որ դուք միայն զբաղվում եք փոխարինումների փոխարեն: (Կատարեք «համադրություններ ընդդեմ permutations» - ի որոնումը): Մասնավորապես, եթե դուք ընտրեք ֆակուլտետ A, այնուհետեւ բասը B- ի մեկ դեպքում, ապա այն բասային B- ը, ապա ֆտակ Ա-ում, URL- ը տարբերվում է, բայց արդյունքում էջը նույնն է: Սա կարելի է որոշել միայն այբբենական կամ որոշ նախապես սահմանված կարգի համար, թե ինչպես պետք է պարամետրերը հայտնվեն URL- ում:

Եվ, վերջապես, հիշելով, որ մենք մնում ենք վայրի մետաֆորների հետ `կայքի հիերարխիայի համար, ծառի նպատակն է տարածել իր մասնաճյուղերը, ծնկներն ու տերեւները` տերեւներով մակերեւույթ տարածություն ստեղծելու համար, որն առավել արդյունավետ կերպով ներգրավելն է արեւի լույսը: Էվոլյուցիան ձեւավորել է ծառեր, որպեսզի նրանք շարունակեն աճել անցյալի կետը, որտեղ նրանք առավելագույն արդյունավետությամբ են գրավում լույսը:

Ստեղծագործական ձեւավորում կայք

Ինչպես նշվում է այս հոդվածի հրապարակման ժամանակ, ամենատարածված որոնման կայքերը կամ իրենց կայքէջը անտեսանելի են դարձնում որոնելու կամ անհնար է փնտրել: Իրական պատասխանը ինչ-որ տեղ միջինում `գեղարվեստական ​​ձեւավորմամբ: Կան բազմաթիվ եղանակներ, որպեսզի դրանք դուրս գան, ձեր robots.txt ֆայլում ճշգրտումներ կատարելու համար ձեր Google Search Console- ի (նախկինում Webmaster Tools) պարամետրերը փոխելու համար `ձեր դիտման աղբյուրի փոխանակման տառերը փոխելու համար:

Լուծումները բազմազան են, եւ բոլորը պետք է ուղղորդվեն համընդհանուր բառատեխնիկական նպատակային ռազմավարության հիման վրա եւ հիմնված այն բանի վրա, թե ինչն է աջակցում ձեր տեխնոլոգիական հարթակին եւ իրականացնելու ձեր թիմը: Ի տարբերություն բնության ծառերի, որոնց առավելագույն ձեւը բնութագրվում է բնության սահմանափակումներով, ճարպակալված կայքերը կարող են աճել անկանխատեսելի, եւ դուք երբեք չգիտեք այն, բացի այն ժամանակ, երբ Google- ում ոչ մի լավ կատարում: