Пландуу Search Gone Wild: окуурда Япондор Endeca & Lucene рычагдарын

Пландуу издөө абдан сейрек колдонулат. Эми, ал бардык жерде болуп саналат! маалымат бул өзгөчөлүгү менен сайттардын издөө-талапты талашып кантип туура алуу, адатта, бүгүн E-Commerce сайттарга талкаланды нерселердин бири болуп саналат. Биз Flying Пойнт Санарип боюнча жана бул жерде ошол эле маселелер жана SEO-көз, ал жөн гана "жакшы категория баракчаларды даярдагыла", жок эле туш болушат. Ошол жиберүү маанилүү бөлүгү болуп саналат да, ал жарым-жартылай гана окуясы.

Рахмат, капитан топ

Бул сайт багыттоо ыкмасы бул макаланы жазган убакыт келди деп, SEO үчүн болушу мүмкүн жетиштүү көзөмөл же пландуу издөө жана жакшылык менен болуп жаткан нерсени туура эмес болот. Ошондой эле, жаш-кары, кокусунан жөргөмүштүн-тузак окуя, бирок, күч сынашып жатат да. Же болбосо, биз жаңы өлчөмдөрү менен айтыш керек. бир аз SEO өнөр болгон адамдар үчүн, бул эки маселе тыянак жана чечүү үчүн маалымат көп болушу мүмкүн. Пландуу издөө сиздин меню "достук издөө" деп ушунчалык көпкө мүмкүн өзгөчөлүгү тандоону ар бир бириктирип, бир жөргөмүш-тузак сыяктуу чоң, жараткан.

Маселе аныкталат. Solutions толугу менен. SEO-өнөр Сиз туздуу эски иттерди болот. Ошол эле биринчи жолу бул тууралуу жасаган мамилеси же угуу үчүн, окудум. Биз биринчи жолу тарых бир аз сени жаратуучу, көп учурда андай сайттар бар, жаман кырдаал, анан акырында бир мүмкүн болгон чечүү бир нече жалпы балак алып жатты.

Биз биринчи жолу тарых бир аз сени жаратуучу, көп учурда андай сайттар бар, жаман кырдаал, анан акырында бир мүмкүн болгон чечүү бир нече жалпы балак алып жатты

Млн-Продукт Catalogs

миллиондогон чоң каталог менен электрондук соода, же жөн эле он-жылдын ми буюмдардын бар барбасын, ал бардык сүрөттөө үчүн баанын жана түсү жана өлчөм сыяктуу маалыматтарды структурасы бар. Ал эми, мисалы, продукт-describers менен издөө жана чыпкалоо айланасында курулган колдонмолорду сүрөттөө үчүн тандап мөөнөттүү нерселер болуп саналат.

Пландуу издөө баары чыпкалары Сиз издөөнү, ачкыч же багыттоо боюнча бургулоо-Ангел-ойлонбойбуз тышкары такшалууга, басып алат. кээ бир расмий түшүнүктөр бул жерде жана кыйыр тартиби иммунитет пайда болот (бул бургулоо-ылдый багыттоо жөнүндө эмес) бар. тартиби-сезгич менюда (Web Гипершилтемелердеги сыяктуу) аркылуу түшүп бургулап сиздин чалгындоо айрым акырын турат. Сен да "от" баары бир дарактын бир катуу дискке же бездери боюнча материалдар менен окшош болуп саналат. Ал мүмкүн, ал эми бургулоочу-ылдый багыттоо менен жөргөмүш-тузактарды түзүү үчүн жөн эле кыйын. Бул интернет негизинен кандай иштээрин, ал Google издөө-индекси мындай акылдуу жана натыйжалуу системасын түзүп эмне. Ошондой эле Google динамикалуу сайттарды "жакшы көрбөөсү" үчүн адилетсиз кадыр берген нерсе.

Spider-торлору жана Mixed Messages

Көп өтпөй эле бир суроо белгиси URL киргизилген эле, сайт "динамикалуу" деп эсептелинет, жана сайт түбөлүккө мүмкүн. Эгер дайыма "Эртеси күнү" шилтемесин басып алат календарлык баракка жөнүндө ойлонуп көрөлү. Ал жөргөмүштүн-тузак түзүү үчүн чынында эле жөнөкөй. Ал сайт динамикалуу же жаман же окулбайт кандайдыр бир жол менен Google кылат суроо белгиси бар эмес. Бул суроо белгиси Google бир тарапка коюп, баары бактысыз кылып эмес, сайттарды сойлоп бизнес менен ээ болушу керек сайттар түрлөрү боюнча ушул деп жатат. Же болбосо, Google бардык көрүнгөн чексиз ресурстар бир аз сайтында бир жөнөкөй чексиз календарын сойлоп сарпталмак.

Динамикалык сайттарды (же дер) кээ бир адамдар сезилет, табиятымдан эле жаман эмес. Ал кокусунан жөргөмүш-тузактарды жасап, силер да көйгөй бар экенин эч качан мүмкүн экенин эмне жаман болуп саналат. From Google тараптан, алар жөн гана кээ бир реалдуу жол менен кийинки сайттын көздөй алып, алар өздөрүнүн токуу бардык убакыт өткөрөөрүнө жатасыз. Google бул күндөр бир топ көп даяр элек тартынбай жөргөмүш-тузагына чумкуй турган, бир нече миллион бетти кайра чыгарып, алар аны эч кандай мааниси жок болсо керек.

Бул макалада биз көп кырдуу издөө аталган navigational схемасында түзүлгөн сыяктуу динамикалуу URL жөргөмүштүн-тузакка бир түрү боюнча басым жатасыз. Fun сөз беришкен. Эгер асыл тилкеси беттери ишендирет. Мен E-Commerce Биз жөн эле жакшы жана негизсиз параметрге салынбаган же таандык же көп кырдуу же талаа-чыпкаланган издөө мындай караганда жөнөкөйүрөөк кызмат кылат деп ойлойм. Бардык эле параметрге салынбаган издөө кырдуу. Жактары да ар кандай буйруктарды жана көрүнгөн чексиз санда бир-эки аларды түзөт "нерселер" менен барып, уруксат берүү үчүн, адатта, мындай өзгөчө жагымсыз жөргөмүш-тузак.

Endeca жана Lucene

Биз аны колдонууга сайттарды үчүн азыр кыйын, анткени, көп кырдуу издөө сайттар менен көйгөйлөрдү байкап жатабыз. Бул багыттоо ыкма колдонулат, аны орнотуу үчүн зарыл болгон, анткени наркынын жана экспертиза кыйла сейрек болот, жана масштабда Бул өзгөчөлүктү (так маалыматтар менен) жеткирүүгө кешпири Server талаптар. Бул өзгөрүп жатат. Кандай болбосун маалыматтарды түзүү кулпуланган эмне Endeca сыяктуу кээ бир продукт (азыр, Oracle тартып) же Lucene (бир Apache долбоору) аркылуу шыпырып, катмар ар т³рд³³ сайт-компоненттин туташуу үчүн зарыл болгон маалыматтар базасын жана индекстерин кура алат сайтка кирип, издөө.

Endeca чейин бул тема пайда болгондо, алардын аты-жөнү көп дуба угуп эмне үстөмдүк ишкана-класс соода программалык пландуу издөө-деген сунуш болду. Силер, албетте, ошол бекем ишеним менен төлөйм. Бирок сен өз ишеним бар болсо, ал катуу иштеп команда, мүлктүк эмес (эркин жана ачык код) Lucene программалык чөмөлө альтернатива жок.

Lucene, ал тургай, ишкана-деңгээл аткаруу менен, мен ишенем-мен тажрыйба иштеп чыгуучу менен бул программалык үймөк-кылат дээрлик баары Endeca кандай жок эле, ал эми акысыз. Endeca эле, чынында эле экосистеманын бир түрү менен бирге иштеген айрым буюмдарды бүтүндөй басып-баштык бар. Ошол Экосистеманын жогорку Apache Software Foundation (компаниянын барабар), анда Lucene долбоору (буюмдун барабар) жана андан кийин, биз-да Solr же чоюлма Издөө сөз жүзүндө Желе UI кылат бөлүгү.

Ошентип, бул Lucene жана Endeca массасы Албетте бул IT деп түркүк зат болуп саналат "Булут" менен күрөшүүгө болгон сени сактап, аларга эски мектепке DIY-сезими бир аз болушу керек. Эгер бир аз компания болсо, же жөн эле ишке чегип келген жок, жана ал көпчүлүк макулдашылган мыкты тажрыйбаларды чыккан Кутудагы жана дагы ишкана-класс болуп эсептелет, ар дайым Demandware бар менен болгум келет, же Endeca / Lucene ортосундагы боштуктарды бир экстремалдуу жана башка боюнча WordPress боюнча WooCommerce өзүн-өзү түйүндөгү Мисалы толтурууга башка азыктарын кабыл алуучу.

Plus, мисалы, IBM, Microsoft жана SAP, бардык эле чоң технологиялык оюнчулары да Желе ар т³рд³³ издөө маселесин чечүү үчүн бир нерсе сунуш. Endeca жана Lucene бул көйгөйлөрдү чечүү бир SEO болгондо үстүнө чыгып аттары, ошондуктан, бул пландуу издөө талкуу түзүү үчүн жеңил жолдор бар, бирок чындап эле спектрдин ар аягында Башкаларга эсибизде сактап, бар жана сансыз көп ортосунда. Мисалы, эгерде сиз Demandware ошол булут-эс келет, бирок атаандаштык артыкчылыгы үчүн өзгөчө төп бардык үйүндө бир күнү катмардуулук баштоо үчүн, аны алып, тандоосу менен, Hybris жогорку жыйынтыгы боюнча, ошондой эле төмөн-аягында Magento бар.

Эки Extreme божомолдору

Ал эми күндүн аягында, бүт бул объектилерди ар т³рд³³ издөөнүн бир нече түргө ээ жана көйгөйлөрдүн бир эле комплектине менен күрөшүүгө туура келет. Жалпысынан алганда, ар т³рд³³ издөө эки категориянын бирине кирет. мүмкүн болуучу баракчалардын ичиндеги баарын миллиондогон "мүмкүн" деген сөздөр да бар:

  1. Толугу менен улам бир себеп же бир издөө көрүнбөгөн
  2. Visible издөө, бирок Googlebot сойлоп жана чалгындоо аягына эч качан сайтка жаратат

Биринчи жагдайда, издөө көрүнбөгөн пландуу издөө сайттары колдонуучу эскирип CGI-түрү элементтери менен жана тапшыруу же издөө үчүн JavaScript аткаруу ишке ашыруу үчүн талап жасалган, анткени, же көзгө көрүнбөгөн болуп, же иш жүзүндө crawlable болуп саналат, бирок сайт ээлери, алар абал саны эки азабын тарткан, анткени, Google'дун / Index ачууну robots.txtке же кандайдыр бир механизм, адатта, башка менен сайтты жөргөлөп жөндөмдүү "өчүрүлгөн" болду.

абал саны эки-жылы пайда болот толугу менен пландуу издөө сайты менен бардык барактар ​​Google тарабынан кемчиликсиз crawlable болуп саналат. Бирок, эч качан беттерин-аяктап, ал эми бул эч качан түгөнбөгөн жөрмөлөп 99% дубликаттарын болуп саналат. Башка сөз менен айтканда, бул жөргөмүштүн-капкан. Google бүт сайтты көрөт, бирок, анткени силер анын алдында коюлган милдеттерди күлкүлүү, ал берген жана кийинки сайттын көздөй жылат.

Анда-санда тууралуу, бирок маанилүү, бул жөргөмүштүн-тузак сайттагы маанилүү беттер "негизги топтомун" тигил же бул толугу менен түртөт менен издөө рейтингине таасир / экенин келүүчү керек болот жеңил-жылы жайгашкан болот деп ойлошкон -discover чыкылдатып-жолдор (негизги жана орто багыттоо) жана белгилүү издөө-жана белгилүү айландыруу ачкыч менен аксакалдардай tweaked болот.

Анык Реал-Life дарактарды шарттары деп ойлойм

Ошондуктан, куулук бир дарактын негизги-бутактар ​​жана бутактары сыяктуу эле беттен турган негизги топтомун жарык болуп саналат. Бул, балким, силердин ачкыч изилдөө үчүн эмне болуп жатканын менен макулдашылат "беттердеги негизги топтомун аныктоо" үчүн алгачкы эки тандалып кырдуу же башка механизмин билдирет. Тулку бой жана бутактары негизги болуп саналат. Алар сенин чебер Алар канонго кирген эмес кайталанма беттеринде болобу, же болбосо иш жүзүндө пландуу издөө параметрлерин тандап өндүрүлгөн боюнча белгиленет. (Негизги беттер, ошондой эле ушул турат болушу мүмкүн).

Сиздин сайт мындан дагы миллиондогон баракчаларды пайда болот да, каалаган 100 10000 беттен чейин бул "негизги" башкы канондук топтому болушу мүмкүн. негизинен-запас-солкулугу жана башка миллиондогон кайра негизги топтомунун чейин жакын убакыт URL үчүн канондук теги ээ болот. Ооба, эгер бул жерде кээ бир салт боюнча иштер да болушу мүмкүн сенин E-Commerce платформа Мындай чыккан Кутудагы айла колдоого албайт.

Ошол эле баары индекси боюнча бул жөргөмүш торлоруна алуу үчүн ыкмалардын бири-көзөмөл болсун деген ... жөргөмүш-тузагы бар ... бирок эмне болуп жатат жөнүндө Google так болушу мындан ары да жол, жана eventually- акыркы бир сойлоп кантип айкын негизги / маанилүү топтому ашуун-жогорку, балким, керексиз иш алып баруу болуп саналат. Сайт-СЕМЫН менен Google-издөө аз артыкчылыктуу санда бар экенин мойнуна албай жатат канондук негизги беттерден сиз азыр эс ЭМЕС жана жарнама жатабыз, болжол менен суммасы менен кайрылууга туура келет.

эн жакшы жооптор ар дайым адамдар барактардын гана чектүү өлчөмү бир сайттын, жана Google алардын баары менен бир нече күндүн ичинде эле айланса болот тарабынан болот. аракет чуркап кыйкырыктан Бака сайтка каршы (эс-тутум ашыгы менен). ал эч качан бүтүп калса, жөргөмүш тузак болушу мүмкүн.

Бул ар бир даракка окшош, ал кыйын болот, бирок, чынында, жалбырагы санап чыгуу мүмкүн болмок! Ал мүмкүн, бирок бүтүрө аласыз. Ошондо да туура чектүү сайтты сойлоп Frog аяктайт Screaming болот.

Order маселелер-таштоо санда Down

Кээ бир өзгөчөлүктөрүнө гибриддештирүү бир башка аспектилерине менен айкалыштырып жандыруу үчүн гана кээ бир нерселер кылуу, мисалы, башкара алат кырдаалды ала ой жүгүртүү жана маалымат-байланыш чектөөлөрүн аткарууга жардам берет. Бул издөө кырдуу кыйла чектүү бургулоо-ылдый багыттоо схемасы жыйындысы карап мүмкүн. (Жактары айрым бургулоо-ылдый денгээлде атайын берилген). Drill-ылдый багыттоо, сиздин издөө сап параметрлери бир буйрук (папка эле митаам, же жок) ишке ашыруу үчүн түзүлөт.

Сен бир гана сөз айкаштарын ордуна санда менен күрөшүп жатабыз, ошондуктан да, тармактарында белгилүү бир ишке буйругу менен, жакшылап сайттардын курууга болот. (Үчүн издөө кылгыла "санда vs. айкаштарын.") Атап айтканда, сиз бир эле учурда бир өзгөчөлүгү: A, андан кийин бир өзгөчөлүгү B тандап берсе, ал эми башка бир өзгөчөлүгү Б жана өзгөчөлүгү А анда-дер ар кандай болуп жатат, бирок жыйынтыгы барак эле. Бул Alphabetizing же параметрлери URL пайда кантип үчүн кээ бир алдын-ала белгиленген тартипти колдонуу менен белгилениши мүмкүн.

Акыры сайт-иерархиядагы дарак-мисал менен дос жатасыз экенин эстен чыгарбай, бир дарактын максаты, анын бутактары, бутак жайып жатат жана натыйжалуу күндүн нурун басып жалбырактары менен бети-аймакты түзүү калтырат. Evolution алар абдан натыйжалуу жарыкты басып пунктунда өткөн өсүп мындан ары да эмес, ал бак калыптанып калган.

Көркөмдүк жактан бир Сайтты кемелине

Ушул берененин логикалык айтылгандай, көп кырдуу издөө сайттары же алардын сайт издөө көрүнбөгөн же мүмкүн сойлоп түйшүк түзөт. реалдуу жооп жерде орто-көркөм-калыптандырууда турат. сен-булакта мета тегдери өзгөртүү үчүн, Google Search консолу (мурунку Webmaster Tools) орнотууларды алымча сиздин robots.txt делосуна өзгөрүүлөрдү кабыл алып, бул өчүрүү жулуп көп жолдору бар.

чечимдер ар түрдүү, ар бир башкы ачкыч стратегиянын максат менен багытталууга тийиш, жана технология аянтча жана командасы тарабынан ишке ашырылуучу тарабынан колдоого алынган нерселерге негизделет. анын максималдуу түрүндө мүнөздөгү чектөөлөр менен аныкталат табигый дарактардын айырмаланып, кырдуу сайттар менен тушалып өстүрө аласыз, ошондой эле сиз эч качан Google жакшы аткаруу үчүн, аны башка эч качан биле албайбыз.