Гоо сайхны хайх талбарт: Төгсгөлд нь Endeca & Lucene SEO-ийг ашиглах боломжтой

Хялбар хайлт нь нэлээн ховор байсан. Одоо, энэ нь хаа сайгүй байх шиг байна! Энэ функцтэй сайтуудын хайлтын илэрцийг хэрхэн буруутгах талаар нарийвчилсан мэдээлэл авах нь өнөөдөр цахим худалдааны сайтууд дахь хамгийн нийтлэг эвдэрсэн зүйлсийн нэг юм. Бид Flying Point Digital дээр дахин нэг асуудал тулгардаг бөгөөд SEO-хэтийн төлөвөөс харахад энэ нь зөвхөн "ангиллын хуудсуудыг илүү сайн болгох" биш юм. Хэдийгээр энэ нь засварын чухал хэсэг боловч энэ нь зөвхөн түүхийн талыг л хэлдэг.

Баярлалаа, Ахмад Алдар

Интернетийн хайлтаар юу болж байгаа талаар хангалттай хэмжээний хяналт, буруу ойлголт байгаа бөгөөд энэ сайтын навигацийн арга нь SEO дээр хэр сайн байж болох талаар бид нийтлэл бичсэн цаг болсон цаг үе юм. Энэ бол хөгшин настай, санамсаргүй аалзны түүхтэй, гэхдээ зүгээр л эргэдэг. Эсвэл бид шинэ хэмжээсээр ярих ёстой. SEO салбарт ажиллаж байсан хүмүүсийн хувьд энэ нь аль аль нь асуудлыг шийдэж, асуудлыг шийдэхэд хангалттай мэдээлэл байж магадгүй юм. Нэвтрэх хайлт нь "хайлтанд ээлтэй" байхын хэрээр нүүрэн талыг хайж олохын тулд гадаргууг хайж олох боломжтой.

Асуудал тодорхойлогдсон. Шийдлүүд далд байна. SEO-аж үйлдвэрийн хуучин давстай нохойнууд алга болно. Энэ талаар анх удаа сонсох буюу түүнтэй ярьж байгаа хүмүүстээ уншаарай. Таныг эхлээд түүхэнд түрүүлж, ийм сайтууд дээр олонтоо тохиолддог муу нөхцөл байдал, дараа нь эцэст нь боломжит шийдлийн хэд хэдэн өргөн цар хүрээтэй гарч ирнэ.

Таныг эхлээд түүхэнд түрүүлж, ийм сайтууд дээр олонтоо тохиолддог муу нөхцөл байдал, дараа нь эцэст нь боломжит шийдлийн хэд хэдэн өргөн цар хүрээтэй гарч ирнэ

Сая-Бүтээгдэхүүний каталоги

Олон сая долларын том каталог бүхий цахим арилжаа байдаг, гэхдээ цөөн тооны хэдэн мянган бүтээгдэхүүн байдаг ч үнэ, өнгө, хэмжээ зэрэг бүтцийн мэдээлэл байдаг. Мөн бүтээгдэхүүний тайлбарлагчид ашиглан хайлт хийх, шүүлт хийх орчимд ашиглагдсан хэрэглэгчийн интерфэйсийг тодорхойлох сонгосон нэр томьёо нь талбар юм.

Сүлжээний хайлт бол та хайлтаа сайжруулахын тулд дарах бүх шүүлтүүрүүд юм. Энд зарим албан ёсны тодорхойлолтууд байдаг ба захиалгад мэдэгдэхүйц мэдрэмжгүй (өрөмдлөгөөр доош харагдахгүй). Захиалгат мэдрэмтгий цахим хуудсыг өрөмдөх (Вэб холбоос гэх мэт) нь хайгуулынхаа төгсгөлийг тодорхойлдог. Таны олох бүх зүйл нь мод доторх хатуу диск эсвэл зангилаанд файлуудтай адил юм. Хэдийгээр боломжтой ч гэсэн, аалзны занга үүсгэх нь өрөмдлөг доош чиглүүлэхэд хэцүү байдаг. Вэбийн ихэнх нь ажилладаг бөгөөд энэ нь Google-ийн хайлт-болон-индексийг ийм гайхамшигтай, үр дүнтэй систем болгосон юм. Энэ нь Google-ийн "дэндүү дургүй" динамик сайтуудын хувьд шударга бус нэр хүндийг өгсөн зүйл юм.

Spider-Traps болон Mixed Messages

URL-д асуулт асууж тэмдэглэсний дараа сайтыг "динамик" гэж үздэг бөгөөд энэ сайт мөнхөд үргэлжлэх болно. Та "дараагийн өдөр" линк дээр дарж болох календарийн вэб хуудасны талаар бод. Энэ бол аалз хураахад хялбар юм. Мөн энэ нь сайтад динамик, муу эсвэл Google-д ямар ч байдлаар унших боломжгүй болгож байгаа асуултанд тэмдэг тавих явдал биш юм. Асуудлын тэмдэг нь Google-ийн сайтуудын төрлүүдэд ямар нэгэн байдлаар байр сууриа алдаж, ямар нэгэн зүйл хийхгүй байгаа мөлхөгч сайтуудын үйл ажиллагаатай танилцах явдал юм. Эс бөгөөс Google-ийн бүх хязгааргүй нөөцүүдийг нэг бяцхан сайт дээрээ нэг хязгааргүй хуанли мөлхөх болно.

Динамик сайтууд (эсвэл URLs) нь зарим хүмүүс шиг сэтгэгдэлтэй биш юм. Алдааны адал явдалт үүсгэх нь амархан хэдий ч, та ч гэсэн асуудалтай тулгарах нь хэчнээн хэцүү болохыг хамгийн муу зүйл гэж үзнэ. Google-ийн талаас тэд дараагийн сайт руу зарим нэг бодитой аргаар очдог бөгөөд ингэснээр тэд өөрсдийн бүх дугуйг эргүүлэх цаг зарцуулдаггүй. Google өнөөдөр аалзны занга руу шумбаж, хэдэн сая хуудас буцааж авахыг хүсч байгаа бөгөөд тэд үүнийг ойлгож чадахгүй байна уу гэдгийг харах боломжтой болсон.

Энэ нийтлэлд бид нэг төрлийн динамик URL аалзны урхинд чиглэсэн хайлтын систем гэж нэрлэгддэг хөтөч схемээр үүсгэгдэж байна. Сайхан үг, талбар. Чулуун эдлэлийг тайрч авсан нүүрний талаар бодох болно. Энэ нь цахим худалдаа эрхэлж буй хүмүүст үйлчилдэг гэж үздэг бөгөөд дурын параметржүүлсэн, эсвэл олон янзын эсвэл талбараар шүүсэн хайлтыг хэлэхээс хялбар байдаг. Бүх параметржүүлсэн хайлт нь талбар биш юм. Facets өөр өөр захиалгад орохыг зөвшөөрдөг бөгөөд хязгааргүй зохимжгүй горимд шилжих хандлагатай байдаг. Тэд хоёулаа "талбар", иймэрхүү муухай аалзны цохилтыг хийдэг.

Endeca, Lucene нар

Бид олон талт хайлтын сайтуудтай байнга асуудалтай тулгардаг. Учир нь үүнийг ашиглаж байгаа сайтууд хийх нь илүү хялбар байдаг. Энэхүү навигацийн арга нь өртөг, нарийн мэргэжлийн мэдлэг шаарддаг, энэ функцийг (нарийн тоон өгөгдлөөр) хүргэх хүчтэй серверийн шаардлагыг хэмждэг. Энэ нь өөрчлөгдөж байна. Таны өгөгдөл түгжигдсэн зүйлээс үл хамааран Endeca (одоо Oracle-аас) эсвэл Lucene (Apache project) гэх мэт зарим бүтээгдэхүүнийг даван туулах боломжтой болох бөгөөд энэ нь давхардуулсан талбаруудыг бүтээх хэсгүүдийг холбоход шаардагдах мэдээллийн бааз, индексүүдийг үүсгэх боломжтой. сайт руу хайх.

Endeca нь олон жилийн давталттай аж ахуйн нэгжийн ангиллын арилжааны програм хангамж юм. Энэ нь тухайн сэдэвтэй холбоотой нэрийг нь сонсох шалтгаан болж байгаа юм. Мэдээж энэ итгэлийг та төлөх болно. Хэрэв та өөрийн гэсэн итгэлтэй, хүчтэй хөгжүүлэгч багтай бол Lucene програмын стекийн өөр хувилбар (үнэгүй, нээлттэй эх үүсвэр) байдаг.

Люсене, би энэ програмын стекээр туршлагатай хөгжүүлэгч биш, гэхдээ Endeca бүх зүйл, аж ахуйн нэгжийн түвшний гүйцэтгэл ч гэсэн үнэ төлбөргүй байдаг. Enda-ийн адилаар экосистемд хамтдаа ажилладаг бие даасан бүтээгдэхүүнийг бүтээдэг. Энэ экосистемийн дээд хэсэг нь Apache Software Foundation (компаний эквивалент), дараа нь Lucene төсөл (бүтээгдэхүүнтэй ижил) бөгөөд дараа нь бид Solr эсвэл Elastic Search гэх мэт бодит вэб UI-ийг үүсгэдэг хэсэг юм.

Тиймээс энэ бүх Lucene болон Endeca зүйлс нь "The Cloud" -ын МТ-ийн дэд бүтэц нь та нартай харьцахаас зайлсхийх ёстой бөгөөд тэдэнд хуучин-сургуулийн DIY мэдрэмж байдаг. Хэрэв та жижиг компани бол, эсвэл хэрэгжилтийн өвчинг хүсэхгүй байгаа бөгөөд хамгийн сайн тохирсон шилдэг туршлагуудыг ашиглахыг хүсч байгаа бөгөөд аж ахуйн нэгжийн ангилалд тооцогддог бол үргэлж Demandware эсвэл Endeca / Lucene хоёрын хоорондох зангилааг дүүргэх өөр бусад бүтээгдэхүүнүүдийн нэг нь WordPress дээр WooCommerce-ийн өөр нэг зохион байгуулалттай, өөрийгөө зохион байгуулдаг.

Plus, IBM, Microsoft, SAP зэрэг маш том технологийн тоглогчид Вэб талбар хайх гэсэн асуудлыг шийдэхийн тулд ямар нэг зүйл санал болгодог. Endeca, Lucene нар нь эдгээр асуудлуудыг шийдэх SEO бол дахин дахин давтагдах нэрүүд юм. Тиймээс энэ нь энэ талбарт хайх хэлэлцүүлгийг хялбарчлах арга юм, гэхдээ спектрийн төгсгөл бүрийг бусад хүмүүс, мөн тоо томшгүй олон юм. Жишээлбэл, та Demandware-ийн үүлдрийг хүсч байгаа боловч хэзээ нэгэн цагт өрсөлдөх давуу талыг хэт их өөрчлөн сайжруулахаар шийдсэн бол өндөр зэрэглэлийн Hybris, доод хэсэгт нь Magento байдаг.

Хоёр Extreme хувилбарууд

Гэвч эцэст нь эдгээр бүх дэд бүтцүүд нь зарим нэг нарийн хайлттай байдаг бөгөөд ижил асуудлуудыг шийдэх ёстой. Ерєнхийдєє, олон талт хайлт нь хоёр ангиллын аль нэгэнд ордог. Боломжтой бол сая сая боломжит хуудсууд нь:

  1. Нэг шалтгаанаас шалтгаалан хайхад бүрэн үл үзэгдэх
  2. Хайлт хийхэд харагдах боловч Googlebot нь мөлхөж, судлахаа больсон сайтыг бий болгодог

Эхний хувилбарт хайхад үл харагдах олон талт хайлтын сайтууд нь үл үзэгдэх юм. Учир нь хэрэглэгчийн интерфэйс нь хуучин CGI хэлбэрийн элементүүдээр бүтээгдсэн бөгөөд хайлт хийхэд Javascript-ийг оруулах буюу гүйцэтгэхийг шаарддаг, эсвэл энэ нь үнэхээр crawlable, харин сайтын эзэд нь Google-ийн робот.txt эсвэл бусад механизмаар мөлхөж, сайтар индексжүүлэх чадвартай болсон байна. Учир нь тэд нөхцөл байдлын хоёрдугаар бүлгийн өвчин зовлон амссан байдаг.

Хоёрдугаарт нөхцөл байдалд, бүхэлд нь хайж буй сайтууд болон үүсгэж болох бүх хуудсууд нь Google-ээр төгс crawlable байна. Гэсэн хэдий ч, хуудаснууд хэзээ ч дуусдаггүй, харин төгсгөлгүй мөлхөж буй 99% нь давхардсан агуулга юм. Өөрөөр хэлбэл энэ бол аалзны хураа юм. Google таны бүх сайтыг хардаг, гэхдээ өмнө нь өгсөн даалгаврын дэмийрлийн улмаас энэ нь бууж өгч, дараагийн сайт руу шилжих болно.

Энэ нь аалзны агууламжийг таны хайлтын зэрэглэлд нөлөөлж болох бөгөөд энэ нь хялбархан байх байр сууриа олоход чухал ач холбогдолтой чухал хуудаснуудын "үндсэн багц" -нэх дарааллын замууд (гол & хоёрдогч залуур) ба мэдэгдэж буй хайлт болон мэдэгдэж буй хөрвүүлэгч түлхүүр үгстэй зэрэгцэх болно.

Бодит амьдралын бодит модны тухай бод

Тэгэхээр энэ арга нь модны үндсэн гол, мөчрүүд гэх мэт үндсэн хэсгүүдийг гэрэлтүүлэх явдал юм. Эдгээр нь таны хоёр түлхүүр үг буюу "түлхүүр хуудаснуудаа тодорхойлох" гэсэн түлхүүр үгнүүдийн түлхүүр үг юм. Их бие, салбарууд нь гол юм. Тэдгээр нь олон талт хайлтын параметрүүдийг сонгох замаар боловсруулсан эсэхээс үл хамааран канон хуулбаргүй хуудасны мастер багц юм. (Таны үндсэн хуудсууд нь эдгээрээс бүрдэнэ).

Хэдийгээр таны сайт сая сая хуудсыг бий болгож чадсан ч гэсэн 100-аас 10,000 хуудас хүртэлх "цөм" нь таны master canonical set байж болно. Өөрөөр хэлбэл, сая сая давхраатай хувилбарууд нь үндсэн категориудаас хамгийн ойрын тохирох URL руу буцааж каноник хаягуудыг эзэмшиж болно. Yep, хэрэв та өөрийн хөгжүүлэлтийн зарим өөрчлөн тохируулсан ажил байж болох юм цахим худалдааны платформ энэ нь шинэ хайрцагны аргуудыг дэмждэггүй.

Зөвхөн эдгээр аалзны хавхлагыг хянахын тулд л бүгдийг нь индексжүүлье ... аалзны урхинд урсан гарахыг үргэлжлүүлээрэй ... гэхдээ юу болж байгаа талаар Google-ийн мэдэгдэж байгаа зүйл, Илүү чухал / чухал багц нь дээрээс дээш, магадгүй шаардлагагүй ажил юм. Google-хайлт нь сайтын-засварын ажилтай холбоотойгоор таны одоо тодорхой зар сурталчилгаа бүхий үндсэн хуудсуудын ойролцоогоор эргэж ирнэ.

Хамгийн сайн шийдлүүд нь сайтын зөвхөн хязгаарлагдмал тооны хуудас үүсгэх боломжтой үргэлж байдаг бөгөөд Google нь тэдгээрийг бүгдийг нь хэдэн өдрийн дотор эргүүлж чаддаг. Ажиллаж үзээрэй Frog-ийг хашгирах сайтын эсрэг (санах ой ихтэй). Хэрвээ хэзээ ч дуусахгүй бол аалз асгаруулагчтай байж болно.

Энэ нь ямар ч модод байгаа юм шиг, энэ нь хэцүү байж болох ч, та үнэхээр навч тоолж болно! Энэ бол боломжтой, гэхдээ та дуусна. Тиймээс Screaming Frog нь зөв төгсгөлөг сайтыг мөлхөж дуусах болно.

Эрэмбэлэх зүйлүүд - Permutations-г таслах

Хэлбэлзлийн зарим талбарууд нь нөхцөл байдалд хяналт тавихад туслах болно. Жишээлбэл, зарим талбарууд нь өгөгдөл-харилцааны хязгаарлалтыг тусгахын тулд бусад тодорхой талуудтай хослуулан идэвхжүүлэх боломжтой. Энэ нь хайлтын талбаруудтай илүү хязгаарлагдмал өрөмдлөгтэй навигацийн схемийн хослол юм. (Facets тодорхой р мдл гийн түвшинд тусгайлан танилцуулсан). Өрөмдөлт-навигацийн нь таны асуулгын мөрийн параметрийг тодорхой дарааллаар биелүүлэх хандлагатай байдаг (фолдеруудаар далдлагдсан).

Та мөн URL-уудыг сайтар бүтээж, сахиулахын оронд сахиулахын оронд зохицуулах тодорхой нэг тушаалыг ашиглаж болно. ("Хослолууд ба сонголтууд" гэсэн хайлтыг хайх хэрэгтэй.) Ялангуяа хэрэв нэг талыг сонгож, дараа нь нэг талыг B талбарт сонгож аваад дараа нь facet B, дараа нь A талбарт нөгөө талд нь URLууд өөр өөр байх болно, гэхдээ хуудасны адил. Үүнийг цагаан толгойн үсгийн дарааллаар засах эсвэл URL дээр параметрүүд хэрхэн харагдах зарим урьдчилан тохируулах аргыг ашиглаж болно.

Эцэст нь, бид модны зүйрлэлийг сайтын шатлалд нийцүүлэн хадгалж үлдээсэн нь модны гол зорилго нь нарны гэрлийг хамгийн үр дүнтэй болгохын тулд навч бүхий гадаргуугийн талбайг бий болгохын тулд салбар, мөчир, навчийг нь тараах явдал юм. Эволюцийн мод нь модыг хэлбэршүүлж, гэрэл нь хамгийн үр дүнтэй болох цэгийг урагшлуулсаар байна.

Бүтээлчээр Сайтыг бүтээх

Энэ нийтлэлд дурьдсанчлан, ихэнх талбарт хайлтын сайтууд нь өөрсдийн сайтыг хайлт хийх боломжгүй, эсвэл мөлхөх боломжгүй ажил хийдэг. Жинхэнэ хариулт нь дундад зууны дундуур уран сайхны дүрслэл юм. Үүнийг хийх олон арга замууд байгаа бөгөөд, таны хайж буй Google Мобайл консол (хуучин Webmaster Tools) тохиргоог өөрчлөхийн тулд өөрийн робот.txt файлын тохиргоонд тохируулан, өөрийн харагдах эх үүсвэр дэх мета тэмдэглэгээг өөрчлөх боломжтой.

Шийдлүүд нь хоорондоо ялгаатай бөгөөд бүгдийг нь чиглүүлэгч түлхүүр зорилтот стратеги дээр тулгуурлан, таны технологийн платформоор дэмжигддэг, таны багийн хэрэгжилтэнд тулгуурласан байх ёстой. Байгалийн хязгаарлалтын хамгийн дээд хэлбэрийг тодорхойлсон байгалийн модноос ялгаатай нь, вэбсайтууд нь үл хамааран ургадаг бөгөөд та хэзээ ч үүнийг мэдэхгүй байж магадгүй юм. Гэсэн хэдий ч Google хэзээ ч сайн ажиллаж чаддаггүй.