Yönlü Arama Vahşi Yaptı: Endeca ve Lucene'i SEO için Etkin Bir Şekilde Kullanmak

Yönlü arama oldukça nadirdi. Şimdi, her yerde gibi görünüyor! Bu özelliğe sahip sitelerin arama görünürlüğünü nasıl azalttığınızla ilgili ayrıntıları yanlış anlamak, günümüzde e-ticaret sitelerinde en sık rastlanan şeylerden biridir. Aynı noktalarda tekrar tekrar Flying Point Digital'de karşılaşıyoruz ve SEO açısından bakıldığında, sadece "daha iyi kategori sayfaları oluşturmak" değil. Bu düzeltmenin önemli bir parçası olmasına rağmen, hikayenin sadece yarısı.

Teşekkürler, Kaptan Açık

Yönlendirilmiş arama ile neler olup bittiğini ve bu site navigasyon tekniğinin SEO için ne kadar iyi olabileceğine dair yeterince gözetim veya yanlış anlama var, bir makale yazmamızın zamanı geldi. Aynı, eski, kazara örümcek tuzağı hikayesi, ancak bir bükülme ile. Ya da yeni boyutlarla söylemeliyiz. Bir süredir SEO endüstrisinde bulunmuş olanlar için, muhtemelen hem çıkarıp hem de sorunu çözmek için yeterli miktarda bilgi bulunuyor. Yönlü arama, navigasyonunuz "arama dostu" olduğu sürece, mümkün olan her yüz seçimi seçiminin bir kombinasyonu kadar büyük bir örümcek tuzağı oluşturur.

Tanımlanmış problem. Örtülü çözümler. Sen SEO-sanayi tuzlu yaşlı köpekleri uzaklara gidebilirsin. Sadece bunu ilk kez duyanlar veya bununla ilgilenenler için okumaya devam edin. İlk önce sizi biraz tarihin içine sokacağız, şu anda bu tür sitelerde sık sık mevcut olan kötü durum ve sonunda olası bir çözümden birkaç geniş vuruş ortaya koyacağız.

İlk önce sizi biraz tarihin içine sokacağız, şu anda bu tür sitelerde sık sık mevcut olan kötü durum ve sonunda olası bir çözümden birkaç geniş vuruş ortaya koyacağız

Milyon Ürün Katalogları

Her ne kadar büyük milyonlarca katalog içeren bir e-ticaret, ya da sadece onbinlerce üründen oluşuyorsa, hepsini tanımlamak için fiyat, renk ve boyut gibi yapısal veriler var. Ve bu tür ürün tanımlayıcıları kullanarak arama ve filtreleme etrafında oluşturulan kullanıcı arayüzlerini tanımlamak için seçilen terim yönlerdir.

Yönlü arama, aramanızı hassaslaştırmak için, anahtar kelimeleri ekleme veya navigasyonda delme işlemlerinin ötesinde arama yapmak için tıklayabileceğiniz tüm filtrelerdir. Burada bazı resmi tanımlamalar ve zımni bir sipariş duyarsızlığı var (detaylandırma navigasyonunda mevcut değil). Siparişe duyarlı menüler arasında gezinmek (Web köprüleri gibi), araştırmanızın kesinliğini gösterir. "Bulduğunuz her şey", bir sabit sürücüdeki dosyalara veya bir ağaçtaki düğümlere benzer. Mümkün olsa da, aşağıya doğru gezinme özelliğine sahip örümcek tuzakları oluşturmak daha zordur. Web çoğunlukla çalışır ve Google’ı bu kadar mükemmel ve etkili bir sistemde arama ve dizine sokan şey budur. Aynı zamanda, Google’a dinamik siteleri “beğenmeme” için haksız bir üne kazandıran şeydir.

Örümcek Tuzakları ve Karışık Mesajlar

URL'ye bir soru işareti getirildiğinde, sitenin "dinamik" olduğu kabul edilir ve site sonsuza dek devam edebilir. "Ertesi gün" bağlantısını her zaman tıklayabileceğiniz bir takvim web sayfasını düşünün. Örümcek tuzağı oluşturmak gerçekten çok basit. Ayrıca siteyi dinamik veya kötü ya da Google’a hiçbir şekilde okunamayan kılan soru işaretinin varlığı değildir. Soru işaretinin, Google’ın bir noktada bir kenara bırakmak zorunda kaldığı türlerin türlerinde mevcut olması ve işleri berbat etmeyen tarama sitelerinin işine devam etmesi. Veya, Google’ın görünüşte sonsuz olan bütün kaynaklarını, küçük bir sitedeki basit bir sonsuz takvimi taramak için harcayacaksınız.

Dinamik siteler (veya URL'ler) bazılarının hissettiği gibi doğal olarak kötü değildir. Kötü olan şey, tesadüfi örümcek tuzakları yapmanın ve problemin bile olduğunun farkında olmanın ne kadar kolay olduğu. Google’dan bir sonraki siteye gerçekçi bir şekilde giriyorlar, bu yüzden zamanlarını tekerleği döndürerek geçirmiyorlar. Google'ın, bugünlerde örümcek tuzaklarına dalmadan dalmaya, birkaç milyon sayfayı geri çekmeye ve bir anlam ifade edip edemediklerini görmeye daha fazla istekli olması.

Bu yazıda, genellikle yönlü arama olarak adlandırılan gezinme şeması tarafından oluşturulan belirli bir dinamik URL örümcek tuzağı türüne odaklanıyoruz. Eğlenceli kelime, yönler. Bir mücevherin kesilmiş yüzleri hakkında düşünmenizi sağlar. Sanırım bu e-ticarete gayet iyi hizmet ediyor ve keyfi olarak parametreleştirilmiş veya atfedilen veya çok boyutlu veya alan filtreli arama demekten daha kolay. Parametreli aramanın tümü faset değildir. Yönler, kendilerine farklı yönlerde ve görünüşte sınırsız permütasyonlarda izin verme eğilimindedir; hem onları "yönler" yapar, hem de böyle kötü bir örümcek tuzağı.

Endeca ve Lucene

Yönlü arama sitelerinde daha sık karşılaşılan sorunları fark ediyoruz, çünkü bunu kullanan siteleri yapmak artık daha kolay. Bu navigasyon tekniği, ayarlamak için gereken maliyet ve uzmanlıktan ve bu özelliği (doğru verilerle) ölçeklendirmede sağlamanın zayıf sunucu gereksinimleri nedeniyle oldukça nadirdi. Bu değişiyor. Verileriniz ne kadar kilitlenirse kilitlensin, Endeca (şimdi, Oracle'dan) veya Lucene (bir Apache projesi) gibi bazı ürünler, bunları tarayabilir ve katmanı hazırlayan site oluşturma bileşenlerine bağlanmak için gereken veritabanı ve dizinleri oluşturabilir bir siteye araştırın.

Endeca uzun zamandan beri, çok yönlü bir arama sunan kurumsal sınıf ticari yazılım olmuştur - bu yüzden bu konu ortaya çıktığında adlarının çok fazla kullanıldığını duyarsınız. Bu güven için elbette ödersiniz. Ancak kendi güveninize ve güçlü bir geliştirici ekibine sahipseniz, tescilli olmayan (ücretsiz ve açık kaynaklı) Lucene yazılım yığını alternatifi var.

Lucene, bana söylendiği gibi - bu özel yazılım yığınına sahip bir deneyim geliştiricisi olmadığım için - Endeca'nın yaptığı her şeyi, şirket düzeyinde performansla bile, ancak ücretsiz olarak yapıyor. Endeca'da olduğu gibi, bir tür ekosistemde birlikte çalışan bir sürü özel ürün çantası da var. Bu ekosistemin başında Apache Software Foundation (şirketin eşdeğeri), ardından Lucene projesi (ürünün eşdeğeri) ve bundan sonra bahsettiğimiz asıl Web Kullanıcı Arayüzünü yapan kısım (Solr veya Elastic Search).

Bu yüzden tüm bu Lucene ve Endeca olayları, "Bulut" un sizi uğraşmaktan alıkoyamaması ve onlara eski bir okul hissi vermesi gereken BT altyapısı olacağı kabul edildi. Daha küçük bir şirketseniz veya yalnızca uygulama sancıları istemiyorsanız ve en iyi kararlaştırılan en iyi uygulamaları kullanıma hazır kullanmak ve hala kurumsal sınıf olarak kabul etmek istiyorsanız, her zaman Demandware veya Endeca / Lucene arasındaki boşlukları bir uçta dolduran diğer ürünleri barındıran, diğerinde WordPress'teki WooCommerce’in kendi kendine barındırılan bir örneği.

Ayrıca, IBM, Microsoft ve SAP gibi tüm gerçekten büyük teknoloji oyuncuları, Web yönlü arama sorununu da çözmek için bir şeyler sunar. Endeca ve Lucene, bu problemleri çözen bir SEO olduğunuzda üst üste gelen isimlerdir, bu yüzden bu yönlü arama tartışmasını çerçevelemek için kolay bir yoldur, ancak gerçekten spektrumun her iki ucunda başkalarının da olduğunu unutmayın. ve arada sayısız daha fazla. Örneğin, Demandware'in bulut kolaylığını istiyor, ancak rekabet avantajı için aşırı kişiselleştirme konusunda katmanlaşmaya başlamak için bir gün hepsini eve götürmek seçeneğiyle, en üstte Hybris ve en düşük noktada Magento var.

İki Aşırı Senaryo

Ancak günün sonunda, tüm bu altyapıların bir çeşit yönlü arama şekli var ve aynı problemlerle uğraşması gerekiyor. Genellikle, yönlü arama iki kategoriden birine girer. "Mümkün olan" milyonlarca potansiyel sayfanın ikisi de:

  1. Bir sebep veya başka bir sebeple arama yapmak için tamamen görünmez
  2. Arama yapılabilir, ancak Googlebot’un tarama işlemini ve araştırmayı asla tamamlamayacağı bir site oluşturur

İlk senaryoda, arama için görünmeyen yönlü arama siteleri ya görünmezdir, çünkü kullanıcı arayüzü eski moda CGI form öğeleriyle oluşturulmuştur ve aramanın yürütülmesi için JavaScript gönderilmesini veya yürütülmesini gerektirir, ya da gerçekten taranabilir. ancak site sahipleri, Google’ın siteyi robots.txt veya başka bir mekanizma üzerinden tarama / dizine alma yeteneğini "kapattı" (genellikle iki numaralı durumun sıkıntısı çektiği için).

İki numaralı durumda, tüm yönlü arama sitesi ve oluşturabileceği tüm potansiyel sayfalar Google tarafından mükemmel şekilde taranabilir. Ancak, sayfalar hiç bitmez ve asla bitmeyen taramanın% 99'u kopya içeriktir. Başka bir deyişle, bu bir örümcek tuzağı. Google tüm sitenizi görür, ancak ondan önce belirlediğiniz görevin saçma olması nedeniyle vazgeçip bir sonraki siteye geçecektir.

Nadiren düşünülmüş, ancak kritik öneme sahip olan bu örümcek tuzağının , sitenizin oluşturabileceği / oluşturması gereken önemli sayfaların "çekirdek kümesini" incelterek veya tamamen şaşırtarak arama sıralamanızı etkileyeceğidir. - Tıklama yollarını keşfet (ana ve ikincil gezinme) ve bilinen aranan ve bilinen dönüşüm anahtar kelimelerle aynı hizada olacak şekilde ayarlandı.

Gerçek Hayatta Gerçekleşen Ağaçlar Açısından Düşünün

Yani, işin püf noktası, bir ağacın ana gövdesi ve dalları gibi o çekirdek sayfa kümesini aydınlatmaktır. Bunlar belki de seçilen ilk iki yüzü veya anahtar kelime araştırmanızın ne için çalıştığını koordine eden "çekirdek sayfa kümesini tanımlamak" için başka bir mekanizmayı temsil eder. Gövde ve dalları çekirdektir. Bunlar, gerçek yönlü yinelenmeyen sayfalar kümenizdir - gerçekte, yönlü arama parametreleri seçilerek üretilip üretilmediklerine bakılmaksızın. (Çekirdek sayfalarınız bunlardan oluşmuş olabilir).

Siteniz bundan daha fazla milyonlarca sayfa üretse bile, 100 ila 10.000 sayfanın herhangi birindeki bu "çekirdek" ana kanonik kümeniz olabilir. Çoğunlukla yinelenen çeşitlemelerin diğer bütün milyonları, çekirdek kümeden en yakın eşleşen URL'ye giden kanonik etiketlere sahip olabilir. Evet, eğer burada bazı özel geliştirme çalışmaları olabilir e-ticaret platformu kullanıma hazır püf noktalarını desteklemiyor.

Ve bu örümcek tuzaklarının kontrol altına alınmasına yönelik yaklaşımlardan sadece biri - her şeyin endekslenmesine izin verin ... örümcek tuzağının varlığını sürdürmesine izin verin ... ama Google’da neler olup bittiği ve sonunda ne kadar süründükleri konusunda net olun. bariz çekirdek / önemli set, baştan sona ve belki de gereksiz bir iştir. Site değiştiricisine sahip bir Google araması, şu anda açıkça reklamını yaptığınız yaklaşık kanon çekirdek sayfalarının miktarıyla geri dönmelidir - ve kabul ettiğiniz geri kalanlar düşük öncelikli izinler değildir.

En iyi çözümler her zaman, bir site tarafından yalnızca sınırlı miktarda sayfa üretilebildiği ve Google’ın birkaç gün içinde bu sayfalarda dolaşabileceği çözümlerdir. Koşmayı dene Kurbağa çığlık bir siteye karşı (bol miktarda bellek ile). Asla bitmezse, bir örümcek tuzağınız olabilir.

Herhangi bir ağaçta olduğu gibi, zor olabilir, ama aslında yaprakları sayarsınız! Mümkün, ama bitireceksin. Bu yüzden Screaming Frog da uygun şekilde sonlandırılmış bir siteyi taramaya son verecek.

Sipariş Meseleleri - Permütasyonları Kesmek

Bazı fasetlerin hibridizasyonu, durumun kontrol altına alınmasına yardımcı olabilir - bazı fasetlerin sadece veri ilişkisi kısıtlamalarını yansıtmak ve uygulamak için diğer bazı fasetlerle kombinasyon halinde aktif hale gelmesini sağlamak gibi. Bunu, daha çok sonlu detaylandırma navigasyon şeması ile arama yönleri arasında bir kombinasyon olarak düşünebilirsiniz. (Yönler özellikle belirli detaylandırma seviyelerinde sunulmuştur). Aşağıya doğru gezinme seçeneği, sorgu dizesi parametrelerinize belirli bir siparişi zorlama eğilimindedir (klasörler olarak gizlenir veya gizlenmez).

Ayrıca URL'lerinizi, belirli bir zorunluluk düzenine göre, dikkatlice oluşturabilirsiniz, böylece yalnızca izinler yerine kombinasyonlarla başa çıkabilirsiniz. ("Kombinasyonlar ve permütasyonlar" için bir arama yapın.) Özellikle, bir durumda Faset A ve ardından B fasetini seçerseniz, ancak daha sonra Faset B ve ardından A faset A'yı başka bir durumda seçerseniz, URL'ler farklı olacaktır, ancak sonuç sayfa aynı. Bu, parametrelerin URL’de nasıl görüneceği konusunda sadece alfabetik olarak veya önceden ayarlanmış bazı sıralar kullanılarak düzeltilebilir.

Ve son olarak, site hiyerarşisi için ağaç metaforuna sadık kaldığımızı hatırlatan bir ağacın amacı, güneş ışığını en verimli şekilde yakalamak için yüzey alan oluşturmak için dallarını, dallarını ve yapraklarını yaymaktır. Evrim ağaçları şekillendirdi, böylece ışığı en verimli şekilde yakaladıkları noktadan sonra büyümeye devam etmeyeceklerdi.

Bir Siteyi Sanatsal Şekillendirme

Bu makalenin açıklamasında belirtildiği gibi, çok yönlü arama siteleri, sitelerini arama için görünmez hale getirir veya tarama işini imkansız hale getirir. Asıl cevap ortada bir yerde - sanatsal bir şekillendirici. Bunu robots.txt dosyanızda ayarlamalar yapmaktan, Google Arama Konsolu'nu (eski adıyla Web Yöneticisi Araçları) ayarlarınızı değiştirmek ve görünüm kaynağınızdaki meta etiketleri değiştirmek için kullanmanın birçok yolu vardır.

Çözümler çeşitlilik gösterir ve tümü kapsamlı bir anahtar kelime hedefleme stratejisi ile yönetilmeli ve teknoloji platformunuz tarafından desteklenen ve ekibiniz tarafından uygulanabilir olana dayanarak yönlendirilmelidir. Maksimum şekli doğanın kısıtlamaları ile tanımlanan doğal ağaçların aksine, faceted web siteleri engellenemez hale gelebilir ve Google'da asla iyi performans göstermemesi dışında asla bilemeyebilirsiniz.