Faceted ძებნა წავიდა ველური: ეფექტურად Leveraging Endeca & Lucene ამისთვის SEO

Faceted ძებნა გამოიყენება საკმაოდ იშვიათია. ახლა, როგორც ჩანს, ყველგან! დეტალების მიღება არასწორია იმის შესახებ, თუ როგორ იმოქმედებთ ამ ფუნქციის ძიების ხილვადობა ერთ-ერთი ყველაზე გავრცელებული ელექტრონული კომერციის საიტებზე. ჩვენ იგივე პრობლემებს ვხვდებით ფრენების ციფრულ ციფრულზე და SEO- ს პერსპექტივაზე, ეს არ არის უბრალოდ "უკეთესი კატეგორიის გვერდები". მიუხედავად იმისა, რომ ეს არის მნიშვნელოვანი ნაწილი დაფიქსირება, ეს მხოლოდ ნახევარი ამბავი.

მადლობა, კაპიტანი აშკარაა

არსებობს საკმარისი ზედამხედველობა ან misconception რა ხდება ერთად faceted ძებნის და რამდენად კარგი ამ საიტზე ნავიგაციის ტექნიკა შეიძლება იყოს SEO, რომ დროა, რომ ჩვენ დავწერე სტატია. ეს არის იგივე, უძველესი, შემთხვევითი spider-trap ამბავი, მაგრამ ირონია. ან, უნდა ვთქვათ ახალი ზომები. მათთვის, ვინც SEO ინდუსტრიაში იყო, ეს ალბათ ბევრ ინფორმაციას აწვდის ორივე პრობლემას და პრობლემის გადასაჭრელად. Faceted ძებნა ქმნის spider- ხაფანგში როგორც დიდი როგორც ყველა კომბინაცია შესაძლო facet selections, სანამ თქვენი ნავიგაცია არის "ძებნის მეგობრული".

პრობლემა განსაზღვრულია. გადაწყვეტილებები დაფარული. თქვენ მარილიანი ძველი ძაღლების SEO- ინდუსტრიის შეუძლია წავიდეს. იმ პირთათვის, ვინც პირველად მოსმენაზე ან საქმეზე პირველად ჩაიარა, წაიკითხე. ჩვენ გვექნება პირველი ისტორია ცოტა ისტორიაში, ცუდი სიტუაცია, რომელიც ხშირად არსებობს ამ საიტებზე, და საბოლოოდ ჩამოყალიბდეს რამდენიმე ფართო პარალიზის ერთი შესაძლო გადაწყვეტა.

ჩვენ გვექნება პირველი ისტორია ცოტა ისტორიაში, ცუდი სიტუაცია, რომელიც ხშირად არსებობს ამ საიტებზე, და საბოლოოდ ჩამოყალიბდეს რამდენიმე ფართო პარალიზის ერთი შესაძლო გადაწყვეტა

მილიონი პროდუქტის კატალოგები

სად არის ელექტრონული კომერცია მილიონების დიდი კატალოგებით, ან თუნდაც მხოლოდ ათობით ათასი პროდუქტი, არსებობს სტრუქტურული მონაცემები, როგორიცაა ფასი და ფერი და ზომა აღწერს მას. და ამ ტერმინს იყენებს საძიებო და ფილტრაციის მომხმარებლის ინტერფეისის აღწერის დრო.

Faceted search მხოლოდ ყველა ფილტრები შეგიძლიათ დააწკაპუნეთ, რათა დახვეწა თქვენი ძებნა, გარდა ჩართვის- in საკვანძო ან საბურღი- down ნავიგაცია. არსებობს გარკვეული ფორმალური განმარტებები აქ, და ნაგულისხმევი მიზნით insensitivity (რომ არ არის წარმოდგენილი drill-down ნავიგაცია). გამარტივებულ მგრძნობიარე მენიუში (როგორც ვებ-ჰიპერბმულები) ჩათვლით გულისხმობს თქვენი ძიების გარკვეულ შედეგებს. ყველაფერი, რაც თქვენ "იპოვით" ანალოგიურია ფაილების ხისტი ან კვანძში. მიუხედავად იმისა, რომ ეს შესაძლებელია, უბრალოდ ძნელია შექმნა spider- ხაფანგები ერთად საბურღი ქვემოთ ნავიგაცია. ის, თუ როგორ მუშაობს ვებ ძირითადად მუშაობს და სწორედ ეს გააკეთა Google ძიებისა და ინდექსის ასეთი ბრწყინვალე და ეფექტური სისტემა. ასევე ის, რაც Google- მა არასწორი რეპუტაცია მისცა "არ მოსწონს" დინამიური საიტები.

Spider- ხაფანგები და შერეული შეტყობინებები

როგორც კი კითხვის ნიშნის გაცნობა URL- ს, საიტი განიხილება "დინამიური" და საიტი სამუდამოდ გაგრძელდება. იფიქროთ კალენდრის ვებ გვერდზე, სადაც ყოველთვის შეგიძლიათ დააწკაპუნოთ "მეორე დღეს" ლინკი. ეს მართლაც რომ მარტივი შექმნა spider-trap. და ეს არ არის კითხვის ნიშნის არსებობა, რომელიც საშუალებას აძლევს საიტზე დინამიური ან ცუდი ან არასწორი გახდეს Google- ში. ის არის, რომ კითხვის ნიშანია იმყოფება საიტების ტიპებზე Google- ზე რაღაც ეტაპზე გადასაწყვეტია და მობრუნებული საიტების ბიზნესთან ერთად, რომლებიც არ იტანჯებიან. ანუ, Google- ის ყველა უსასრულო რესურსი გაატარებდა ერთ პატარა ადგილზე ერთ უბრალო უსასრულო კალენდარს.

დინამიური საიტები (ან მისამართები) არ არის არსებითად ცუდი, რადგან ზოგიერთი ადამიანი გრძნობს. რა არის ცუდი, რა ადვილია, რომ შემთხვევითი ობობა მოაგვაროს და არასოდეს გააცნობიეროს, რომ პრობლემაც კი გაქვს. Google- ის მხრიდან, ისინი უბრალოდ რეალიზება ხდება მომდევნო საიტზე, ასე რომ მათ არ ატარებენ ყველა დროის დახარჯვას მათი ბორბლები. Google- ს ბევრი რამ აქვს ამ დღეებში, რათა spider- ის ხაფანგში ჩაეგდო, რამოდენიმე მილიონი გვერდის უკან დახევას და დაინახავ, თუ მათ ვერ გაიგებენ.

ამ სტატიაში, ჩვენ ყურადღებას ვაქცევთ დინამიური URL spider-trap- ში, როგორც სანავიგაციო სქემის მიერ წარმოქმნილი, რომელსაც ხშირად ეწოდება ფსევდო ძებნა. გართობა სიტყვა, facets. მოგეხსენებათ ძვირფასი ქვების სახეები. ვფიქრობ, რომ ემსახურება ელექტრონული კომერციის biz მხოლოდ ჯარიმა და ადვილია ვიდრე ამბობდა თვითნებურად parameterized ან მიეწერება ან მრავალგანზომილებიანი ან სფეროში გაფილტრული ძებნა. ყველა პარამეტრირებული ძებნა არ არის facets. Facets- ი, როგორც წესი, სხვადასხვა ბრძანებებს და უსასრულო permutations- ს, ისევე როგორც მათ "facets "- ს და, განსაკუთრებით, მწვავე spider-trap- ს.

ენდეკე და ლუკენი

ჩვენ უფრო ხშირად ვხვდებით პრობლემურ საძიებო საიტებზე, რადგან ახლა უფრო ადვილია, რომ გამოიყენოთ საიტები. ამ ნავიგაციის ტექნიკა გამოყენებული უნდა იყოს საკმაოდ იშვიათი გამო ღირებულებათა და გამოცდილების გამოსაყენებლად და ამ ფუნქციის (ზუსტ მონაცემებთან) მოცულობის სერვერული მოთხოვნების შესაბამისად. ეს იცვლება. რაც არ უნდა იყოს თქვენი მონაცემები დაბლოკილი, ზოგიერთ პროდუქტს, როგორიცაა ენდეკე (ახლა, Oracle) ან Lucene (Apache პროექტი), შეუძლია გააძევოს და ააშენოს მონაცემთა ბაზა და ინდექსები, რომლებიც დაკავშირებულია საიტის შენობის კომპონენტებთან, მოძებნეთ საიტი.

ენდეკო უკვე დიდი ხანია დომინანტი საწარმოს კლასის კომერციულ პროგრამას სთავაზობს, რათა გაეცნოთ ძიებას, რის გამოც ისიც მოისმენენ მათ სახელს, როცა ეს თემა წარმოიქმნება. რა თქმა უნდა. მაგრამ თუ თქვენ გაქვთ საკუთარი ნდობა და ძლიერი დეველოპერი გუნდი, აქ არის არაპროფესიონალური (თავისუფალი და ღია წყარო) Lucene პროგრამული უზრუნველყოფა დასტის ალტერნატივა.

Lucene, როგორც მე განუცხადა, როგორც მე არ ვარ გამოცდილება დეველოპერი ამ კონკრეტული პროგრამული დასტის- აკეთებს თითქმის ყველაფერი Endeca აკეთებს, თუნდაც საწარმოს დონის შესრულება, მაგრამ უფასოდ. როგორც Endeca- სთან ერთად, არსებობს მართლაც მთელი რიგი ინდივიდუალური პროდუქციის ჩანთა-ტომარა, რომელიც ერთობლივად მუშაობს ეკოსისტემაში. ეკოსისტემის ზედა ნაწილია Apache Software Foundation (კომპანიის ექვივალენტი), შემდეგ Lucene პროექტი (პროდუქტის ექვივალენტი) და ამის შემდეგ, რაც ხდის რეალურ ვებ UI- ს ვსაუბრობთ - Solr ან ელასტიური ძებნა.

ასე რომ, ეს ყველაფერი Lucene და Endeca პერსონალის არის აღიარებს, რომ IT ინფრასტრუქტურის პერსონალის, რომ "Cloud" უნდა შეინარჩუნოს თქვენ უნდა გაუმკლავდეთ და აქვს ცოტა ძველი სკოლა წვრილმანი- გრძნობენ მათ. თუ თქვენ უფრო პატარა კომპანიას, ან უბრალოდ არ გვინდა აღსრულების ტკივილი, და უნდა გამოიყენოთ საუკეთესო შეთანხმებული საუკეთესო პრაქტიკის გარეთ- of-the-box და მაინც განიხილება საწარმოს კლასის, ყოველთვის Demandware, ან მასპინძელი სხვა პროდუქტები, რომელიც შეავსებს ნიშებს შორის Endeca / Lucene ერთი უკიდურესი და თვითმმართველობის მასპინძელი მაგალითად WooCommerce on WordPress მეორეს.

Plus, ყველა მართლაც დიდი ტექნიკური მოთამაშე, როგორიცაა IBM, Microsoft და SAP, ვთავაზობთ რაღაც მოსაგვარებლად ვებ faceted ძებნა პრობლემა ძალიან. Endeca და Lucene არიან სახელები, რომ ამუშავება მეტი და მეტი როდესაც თქვენ SEO ბრძოლა ეს პრობლემები, ასე რომ ეს არის მარტივი გზა ჩარჩო ამ faceted ძებნის დისკუსია, მაგრამ გახსოვდეთ იქ ნამდვილად სხვები თითოეულ ბოლოს სპექტრი, და უთვალავი მეტი. მაგალითად, თუ გსურთ, რომ Cloud- ის გამორთვა Demandware, მაგრამ ვარიანტი აღების ეს ყველაფერი სახლში someday დაიწყოს layering უკიდურესი დაკონფიგურირება კონკურენტუნარიანი უპირატესობა, არსებობს ჰიბრიზს მაღალი დონის და Magento დაბალ ბოლომდე.

ორი ექსტრემალური სცენარი

მაგრამ დღის ბოლოს, ყველა ამ ინფრასტრუქტურის აქვს გარკვეული ფორმა faceted ძებნა და უნდა გაუმკლავდეთ იგივე კომპლექტი პრობლემები. ზოგადად, განმსაზღვრელი ძებნა ერთ-ერთ ორ კატეგორიად იქცევა. ყველა მილიონი პოტენციური გვერდია "შესაძლებელი"

  1. სრულიად უხილავი ძიება ერთი მიზეზის გამო ან სხვა
  2. ხილული მოძებნის, მაგრამ ქმნის საიტზე, რომ Googlebot არასდროს დაასრულებს მცოცავი და შეისწავლოს

პირველ სცენარში, ძიების უხილავი საძიებო საიტები ან უხილავია, რადგან მომხმარებლის ინტერფეისი აგებულია ძველი CGI- ფორმა ელემენტებთან და მოითხოვს JavaScript- ს შესრულებას, რათა შეასრულოს საძიებო სისტემა, ან რეალურად crawlable, მაგრამ საიტის მფლობელები "გამორთული" Google- ის შესაძლებლობები, რომლებიც robots.txt- ის მეშვეობით საიტების გადასატანად / ინფორმირებას ახდენენ, ან სხვა მექანიზმი, როგორც წესი, განიცდიან სიტუაციის ორი ნომრის ტკივილს.

სიტუაციის მეორე ნომერზე, მთლიანი საძიებო საიტი და პოტენციური გვერდები შეიძლება გენერირებდეს Google- ის მიერ კარგად გაჯანსაღებული. თუმცა, გვერდები არასდროს დამთავრებულადაა და ამ უწყვეტი ჩამოსვლის 99% დუბლიკატიანია. სხვა სიტყვებით, ეს არის spider- ხაფანგში. Google ხედავს თქვენს მთელ საიტზე, მაგრამ იმის გამო, რომ სასაცილოა ის ამოცანა, რომელიც თქვენს წინაშეა, ის მისცემს და გადავა მომდევნო საიტზე.

არადამაინც ფიქრობდა, მაგრამ კრიტიკულად მნიშვნელოვანია ის, რომ ამ ობობის ტრაპზე გავლენას მოახდენს თქვენს საძიებო გრაგნილებზე გავლენის მოხდენა ან სრულიად გაუგებარია მნიშვნელოვანი გვერდების "ძირითადი კომპლექტი" თქვენი საიტისთვის / უნდა იყოს გენერირება, რომელიც შეიძლება ადვილად განთავსდეს -აღრიცხვიანი ბილიკები (ძირითადი და საშუალო სანავიგაციო საშუალებები) და უნდა იყოს tweaked გასწორება ცნობილი ჩხრეკა და ცნობილი კონვერტაცია სიტყვა.

დაფიქრდით ფაქტობრივ ფაქტობრივ ცხოვრებაზე

ასე რომ, შეასრულა ის, რომ ძირითადი გვერდების ძირითადი ნაწილი, როგორიცაა ხე-ტყეები და ფილიალები. ეს შეიძლება წარმოადგენდეს პირველი ორი შერჩეული facets ან სხვა მექანიზმი "განსაზღვრავს ძირითადი კომპლექტი გვერდები", რომელიც კოორდინირებული რა თქვენი სიტყვით კვლევის აპირებს. მაგისტრალური და ფილიალი ძირითადი. ისინი არიან თქვენი სამაგისტრო ნაკრები არაკორექტული დუბლიკატების გვერდებზე - თუ არა ისინი რეალურად წარმოდგენილ საძიებო პარამეტრების არჩევის გზით. (თქვენი ძირითადი გვერდები შეიძლება შედგებოდეს ამით).

მაშინაც კი, თუ თქვენს საიტზე შეიძლება მილიონობით გვერდის უფრო მეტი გვერდის შექმნა, ამ "ბირთვზე" 100- დან 10,000-მდე გვერდისგან შეიძლება იყოს თქვენი სამაგისტრო კანონიკა. ყველა სხვა მილიონობით უმეტესობა დუბლიკატი ვარიაციები შეიძლება ჰქონდეს კანონიკური tags დაბრუნება უახლოეს-შესაბამისი URL საწყისი ძირითადი კომპლექტი. Yep, შეიძლება იყოს გარკვეული საბაჟო განვითარება აქ თუ თქვენი ელექტრონული კომერციის პლატფორმა არ უჭერს მხარს ასეთი out-of-the-box tricks.

და ეს მხოლოდ ერთი მიდგომაა იმისათვის, რომ ამ spider ხაფანგები დაიცვას კონტროლის ნება ყველაფერი ნება ... ნება spider- ხაფანგში კვლავაც არსებობს ... მაგრამ ნათელია Google შესახებ რა ხდება და როგორ ნებისმიერი მცოცავი წარსულში საბოლოოდ- აშკარა ძირითადი / მნიშვნელოვანი კომპლექტი არის ზედმეტად- top და ალბათ ზედმეტი მუშაობა. Google- ის ძიება საიტის მოდიფიკატორთან უნდა დაბრუნდეს დაახლოებით კანონიკური ბირმის გვერდების ოდენობით, რომლებიც ახლა აშკარად რეკლამირდებიან და არა დანარჩენი, რომელიც თქვენ აღიარებთ დაბალი პრიორიტეტულ ნებართვას.

საუკეთესო გადაწყვეტილებები ყოველთვის არის, სადაც გვერდის მხოლოდ ფინალური რაოდენობა შეიძლება გენერირებული იყოს საიტით, და Google- ს შეუძლია რამდენიმე დღის განმავლობაში ყველა მათგანის მეშვეობით. სცადეთ გაშვებული ყვირილი ბაყაყი წინააღმდეგ საიტი (უამრავი მეხსიერება). თუ ეს არასდროს არ დასრულდება, თქვენ შეიძლება ჰქონდეთ spider ხაფანგი.

ეს მოსწონს ნებისმიერ ხეზე, შეიძლება რთული იყოს, მაგრამ სინამდვილეში შეიძლება ითქვას ფოთლების დათვლა! შესაძლებელია, მაგრამ დასრულდება. ასე რომ, ყრილობა ყრიან დასრულდება მცოცავი სათანადოდ სასრული საიტი.

ორდენი თემა-შეღწევა ქვევით

ცალკეული ფაქტორების ჰიბრიდიზაცია ხელს შეუწყობს სიტუაციის კონტროლს, როგორიცაა გარკვეული ფორმების გაკეთება, რომელთაც შეუძლიათ მხოლოდ გაააქტიურონ გარკვეული სხვა ფაქტორებთან კომბინაციაში, რათა შეიმუშავონ და აღასრულონ მონაცემთა ურთიერთობის შეზღუდვები. თქვენ შეიძლება განიხილონ ეს კომბინაცია ბევრად უფრო სასრული საბურღი ქვემოთ ნავიგაცია სქემა ძებნა facets. (Facets წარმოდგენილია კონკრეტულად გარკვეული საბურღი ქვემოთ დონეზე). საბურღი ქვემოთ ნავიგაცია ცდილობს შეასრულოს გარკვეული ბრძანება თქვენი შეკითხვის სიმებიანი პარამეტრების (obfuscated როგორც ფოლდერები თუ არა).

თქვენ ასევე შეგიძლიათ დააგემოვნოთ თქვენი მისამართები ფრთხილად, გარკვეული გააქტიურებული ბრძანებით, რათა თქვენ მხოლოდ კომბინაციები ნაცვლად permutations. (შეარჩიეთ "კომბინაციები წინააღმდეგ permutations.") კერძოდ, თუ თქვენ აირჩიეთ facet და შემდეგ facet B ერთ შემთხვევაში, მაგრამ შემდეგ facet B და შემდეგ facet სხვა, URLs ვაპირებთ იყოს განსხვავებული, მაგრამ შედეგად გვერდზე იგივე. ეს შეიძლება დაფიქსირდეს მხოლოდ დამწერლობის ან წინასწარ დადგენილი წესის გამოყენებით, თუ როგორ ხდება პარამეტრების URL- ზე.

და ბოლოს, გვახსოვდეს, რომ ხე-მეტაფორა, რომელიც ხე-მემორანდუმს უკავშირდება, ხის მიზანს წარმოადგენს მისი ფილიალები, შუბები და ფოთლების გავრცელება, რათა ზედაპირის არეალის შექმნა ფოთლების მზის ყველაზე ეფექტურად გადაღებაა. ევოლუციამ ხეები ჩამოაყალიბა ისე, რომ ისინი არ იზრდებიან წარსულის წერტილში, სადაც მათ სინათლეს ყველაზე ეფექტურად იღებენ.

Artistically ჩამოყალიბებაში საიტის

როგორც აღინიშნა ამ სტატიის გახსნისას, ყველაზე ხშირად ძებნა საიტები ან მათი საიტი უხილავი ძიება ან შეუძლებელი მცოცავი chore. რეალური პასუხი სადღაც შუაშია მხატვრობის ჩამოყალიბებაში. არსებობს ბევრი გზა, რომ გაიყვანოს ეს off, მიღების კორექტირებას თქვენი robots.txt ფაილი tweaking თქვენი Google Search Console (ყოფილი Webmaster Tools) პარამეტრები, შეცვალოს მეტა tags თქვენი აზრით წყარო.

გადაწყვეტილებები მრავალფეროვანია და ყველა უნდა იყოს მიმართული საკვანძო სიტყვის სამიზნე სტრატეგიით და ეფუძნება თქვენს ტექნოლოგიურ პლატფორმას და განახორციელებს თქვენს გუნდს. ბუნებრივი ხეებისგან განსხვავებით, რომელთა მაქსიმალური ფორმა განისაზღვრება ბუნების შეზღუდულობით, ვებ-გვერდებს შეუძლიათ იზრდებიან უნაყოფო და შეიძლება არასოდეს იციან, გარდა Google- ში არასდროს შესრულებული.