ذهب البحث الأوجه البرية: الاستفادة الفعالة من Endeca ولوسين لكبار المسئولين الاقتصاديين
ذهب البحث الأوجه البرية: الاستفادة الفعالة من Endeca ولوسين لكبار المسئولين الاقتصاديين
البحث الأوجه المستخدمة لتكون نادرة جدا. الآن ، يبدو أنه في كل مكان! يعد الخطأ في التفاصيل حول كيفية تجاذب رؤية مواقع البحث مع هذه الميزة أحد أكثر الأشياء شيوعًا في مواقع التجارة الإلكترونية اليوم. إننا نواجه نفس المشكلات مرارًا وتكرارًا في Flying Point Digital ، ومن منظور SEO ، لا يقتصر الأمر على "إنشاء صفحات فئة أفضل". رغم أن هذا جزء مهم من الإصلاح ، إلا أنه نصف القصة فقط.
شكرا ، الكابتن واضح
هناك ما يكفي من الرقابة أو الاعتقاد الخاطئ لما يجري مع البحث ذي الأوجه ومدى جودة تقنية التنقل في الموقع بالنسبة لكبار المسئولين الاقتصاديين ، وقد حان الوقت لنكتب مقالًا. إنها نفس قصة حبس العنكبوت العارضة القديمة ، ولكن مع تطور. أو ، يجب أن نقول بأبعاد جديدة. بالنسبة لأولئك الذين شاركوا في صناعة تحسين محركات البحث (SEO) ، من المحتمل أن يكون هذا هو الكثير من المعلومات لاستنتاج المشكلة وحلها. ينشئ البحث ذي الأوجه مصيدة عنكبوتية كبيرة مثل كل مجموعة من التحديدات الممكنة للوجه ، طالما أن التنقل الخاص بك "سهل البحث".
مشكلة محددة. حلول ضمنية. يمكنك المالح الكلاب القديمة من كبار المسئولين الاقتصاديين والصناعة يمكن أن تذهب بعيدا. بالنسبة لأولئك الذين يسمعون عن هذا أو يتعاملون معه لأول مرة ، تابع القراءة. سنغرقك أولاً في القليل من التاريخ ، وهو الموقف السيئ الذي غالبًا ما يوجد حاليًا في مثل هذه المواقع ، ثم نضع أخيرًا بضع ضربات واسعة لحل واحد ممكن.
كتالوجات مليون منتج
أينما كانت التجارة الإلكترونية مع كتالوجات كبيرة من الملايين ، أو حتى عشرات الآلاف من المنتجات ، هناك بيانات منظمة مثل السعر واللون والحجم لوصفها كلها. والمصطلح الذي تم اختياره لوصف واجهات المستخدم المبنية حول البحث والتصفية باستخدام أدوات وصف المنتج هذه هو الأوجه.
يمثل البحث ذي الأوجه مجرد كل المرشحات التي يمكنك النقر عليها لتحسين بحثك ، بما في ذلك توصيل الكلمات الرئيسية أو التنقل في التنقل. هناك بعض التعاريف الرسمية هنا ، وعدم حساسية الطلب الضمني (غير موجود في التنقل لأسفل). يتضمن التنقل لأسفل من خلال القوائم الحساسة للطلب (مثل الارتباطات التشعبية على الويب) خاتمة معينة لاستكشافك. كل ما تجده "مشابه" للملفات الموجودة على القرص الصلب أو العقد الموجودة في شجرة. في حين أنه من الممكن ، إلا أنه من الصعب إنشاء مصائد عنكبوت مع التنقل لأسفل. هذه هي الطريقة التي تعمل بها الويب في الغالب ، وهذا ما جعل بحث Google وفهرسته نظامًا رائعًا وفعالًا. إنه أيضًا ما أعطى Google سمعة غير عادلة للمواقع الديناميكية "غير المرغوب فيها".
مصائد العنكبوت والرسائل المختلطة
بمجرد تقديم علامة استفهام إلى عنوان URL ، يعتبر الموقع "ديناميكيًا" ، ويمكن أن يستمر الموقع إلى الأبد. فكر في صفحة ويب التقويم حيث يمكنك دائمًا النقر فوق رابط "اليوم التالي". انها حقا بهذه البساطة لإنشاء فخ العنكبوت. وليس وجود علامة استفهام تجعل الموقع ديناميكيًا أو سيئًا أو غير قابل للقراءة بأي شكل من الأشكال. إن علامة الاستفهام موجودة على أنواع المواقع التي يتعين على Google وضعها جانباً في مرحلة ما ، والاستمرار في أعمال الزحف إلى المواقع التي لا تجعل الأمور بائسة. وإلا ، سيتم إنفاق جميع موارد Google التي لا حصر لها على ما يبدو على الزحف إلى تقويم بسيط لا حصر له على موقع واحد صغير.
المواقع الديناميكية (أو عناوين URL) ليست سيئة بطبيعتها ، كما يشعر بعض الناس. ما هو سيء هو أنه من السهل جعل مصائد العنكبوت عرضية وعدم إدراك أن لديك مشكلة حتى. من جانب Google ، إنهم يصلون فقط إلى الموقع التالي بطريقة واقعية ، لذلك لا يقضون كل وقتهم في تدوير عجلاتهم. لدى Google الكثير من الاستعداد في هذه الأيام لتغوص بجدية في مصائد العنكبوت ، وتراجع بضع ملايين من الصفحات ، ومعرفة ما إذا كانت لا تستطيع فهمها.
في هذه المقالة ، نركز على نوع معين من فخ العنكبوت لعناوين URL الديناميكية كما تم إنشاؤه بواسطة المخطط الملاحي الذي يُطلق عليه غالبًا البحث الأوجه. كلمة مرحة ، جوانب. يجعلك تفكر في الوجوه المقطوعة في الجوهرة. أعتقد أن هذا يخدم بيز التجارة الإلكترونية على ما يرام ، وأنه أسهل من قول تعسفي أو معلمة أو متعددة الأبعاد أو تصفية البحث الميداني. ليست كل عمليات البحث ذات المعلمات هي جوانب. تميل الأوجه إلى السماح لنفسها بالترتيب بأوامر مختلفة وبتعابير غير متناهية على ما يبدو - مما يجعلها "جوانب" ومثل هذا العنكبوت الشرير بشكل خاص.
اينديكا ولوسين
نلاحظ مشاكل في مواقع البحث الأوجه أكثر من مرة ، لأنه من الأسهل الآن إنشاء مواقع تستخدمها. كانت تقنية التنقل هذه نادرة إلى حد كبير نظرًا للتكلفة والخبرات المطلوبة لإعداده ، ومتطلبات الخادم السيئة لتقديم هذه الميزة (مع بيانات دقيقة) على نطاق واسع. هذا يتغير. بغض النظر عن البيانات التي يتم تأمينها ، يمكن لبعض المنتجات مثل Endeca (الآن ، من Oracle) أو Lucene (مشروع Apache) من خلاله وبناء قاعدة البيانات والفهارس المطلوبة للاتصال بمكونات بناء الموقع التي تتميز بأوجه البحث في الموقع.
لطالما كان Endeca هو البرنامج التجاري المهيمن على مستوى المؤسسات لتقديم بحث ذي أوجه ، وهذا هو السبب في سماع اسمك الذي يتم استدعاؤه كثيرًا عند ظهور هذا الموضوع. سوف تدفع ثمن هذه الثقة ، بالطبع. ولكن إذا كانت لديك ثقتك بنفسك ، وفريق مطور قوي ، فهناك بديل مكدس برنامج Lucene (مجاني ومفتوح المصدر).
لوسين ، كما قيل لي - لأنني لست مطورًا للتجربة مع مجموعة البرامج هذه - يعمل كل ما تقوم به Endeca تقريبًا ، حتى مع الأداء على مستوى المؤسسة ، ولكن مجانًا. كما هو الحال مع Endeca ، هناك حقًا مجموعة كاملة من المنتجات الفردية التي تعمل معًا في نوع من النظام البيئي. الجزء العلوي من هذا النظام البيئي هو مؤسسة Apache Software Foundation (أي ما يعادل الشركة) ، ثم مشروع Lucene (ما يعادل المنتج) ، وبعد ذلك ، الجزء الذي يجعل واجهة مستخدم الويب الفعلية التي نتحدث عنها — إما Solr أو Elastic Search.
لذلك ، من المسلم به أن كل هذه الأشياء من Lucene و Endeca تُقر بأن البنية التحتية لتكنولوجيا المعلومات التي يُفترض أن "The Cloud" تمنعك من الاضطرار إلى التعامل معها ، وأن تشعر بها قليلاً من المدرسة القديمة. إذا كنت شركة أصغر ، أو ببساطة لا ترغب في الحصول على آلام في التنفيذ ، وتريد أن تستخدم أفضل الممارسات المتفق عليها خارج نطاقها ولا تزال تعتبر على مستوى المؤسسات ، فهناك دائمًا برنامج Demandware ، أو مجموعة من المنتجات الأخرى التي تملأ المنافذ بين Endeca / Lucene في أحد الأطراف ومثيل WooCommerce المستضاف ذاتيًا على WordPress من جهة أخرى.
بالإضافة إلى ذلك ، فإن جميع مشغلي التكنولوجيا الكبار حقًا ، مثل IBM و Microsoft و SAP ، يقدمون شيئًا ما لحل مشكلة البحث ذي الأوجه على الويب أيضًا. إن Endeca و Lucene هما الاسمان اللذان يظهران مرارًا وتكرارًا عندما تكون أحد مُحسّنات محرّكات البحث (SEO) يعالج هذه المشكلات ، لذا فهذه طريقة سهلة لوضع إطار لمناقشات البحث الأوجه ، لكن تذكر أن هناك بالفعل آخرين في كل نهاية الطيف ، وعدد لا يحصى من بين. على سبيل المثال ، إذا كنت ترغب في الحصول على هذه الميزة السحابية من Demandware ، ولكن مع خيار أخذ كل شيء في المنزل في يوم من الأيام لبدء التصفيف في التخصيص الشديد للميزة التنافسية ، فهناك Hybris في النهاية الراقية ، و Magento في النهاية المنخفضة.
اثنين من السيناريوهات المتطرفة
ولكن في نهاية اليوم ، كل هذه البنى التحتية لديها شكل من أشكال البحث الأوجه وعليها التعامل مع نفس مجموعة المشاكل. بشكل عام ، البحث الأوجه يقع في واحدة من فئتين. كل الملايين من الصفحات المحتملة التي أصبحت "ممكنة" هي إما:
- غير مرئي تمامًا للبحث بسبب سبب أو آخر
- مرئي للبحث ، ولكنه ينشئ موقعًا لن ينتهي Googlebot من الزحف والاستكشاف
في السيناريو الأول ، تكون مواقع البحث الأوجه غير المرئية للبحث إما غير مرئية لأن واجهة المستخدم مبنية بعناصر نموذج CGI القديمة وتتطلب إرسال أو تنفيذ JavaScript لتطبيق البحث ، أو أنه يمكن الزحف إليه فعليًا ، لكن مالكي الموقع "أوقفوا" قدرة Google على الزحف / فهرسة الموقع من خلال ملف robots.txt أو آلية أخرى — عادةً لأنهم عانوا من آلام الموقف الثاني.
في الحالة الثانية ، فإن موقع البحث الأوجه بالكامل وجميع الصفحات المحتملة التي يمكن أن ينشئها يمكن الزحف إليها تمامًا بواسطة Google. ومع ذلك ، فإن الصفحات لا تنتهي أبدًا ، و 99٪ من عملية الزحف التي لا تنتهي هي محتوى مكرر. بمعنى آخر ، إنه مصيدة عنكبوتية. ترى Google موقعك بالكامل ، ولكن بسبب سخافة المهمة التي قمت بتعيينها قبلها ، فسوف تستسلم وتنتقل إلى الموقع التالي.
نادراً ما يتم التفكير في هذا العنكبوت ، ولكنه مهم للغاية ، هو أن هذا العنكبوت سيكون له تأثير على تصنيفات البحث الخاصة بك عن طريق التخفيف أو الغموض التام لـ "المجموعة الأساسية" للصفحات المهمة التي يمكن / يجب أن ينشئها موقعك والتي يمكن وضعها في مواقع يسهل الوصول إليها -اكتشف مسارات النقر (التنقل الرئيسي والثانوي) وأن يتم تعديلها لمحاذاة الكلمات الرئيسية المعروفة التي يتم البحث عنها والمحوّلة.
فكر في شروط الأشجار الحقيقية
لذلك ، تتمثل الحيلة في تضييق هذه المجموعة الأساسية من الصفحات ، مثل الجذع الرئيسي وفروع الشجرة. ربما تمثل هذه الجوانب الأولى والثانية المختارة أو آلية أخرى "لتحديد مجموعة الصفحات الأساسية" التي يتم تنسيقها مع ما تبحث عنه كلماتك الرئيسية. الجذع والفروع الأساسية. إنها مجموعتك الرئيسية للصفحات الأساسية غير المكررة - سواء تم إنتاجها بالفعل أم لا من خلال اختيار معلمات البحث الأوجه. (قد تتألف صفحاتك الأساسية من هذه).
حتى إذا كان موقعك يمكنه إنشاء ملايين من الصفحات أكثر من ذلك ، فإن هذا "الأساس" في أي مكان من 100 إلى 10000 صفحة يمكن أن يكون مجموعتك الرئيسية المتعارف عليها. يمكن لجميع الملايين الأخرى من الصيغ المكررة في الغالب امتلاك العلامات الكنسية مرة أخرى إلى عنوان URL الأقرب المطابق من المجموعة الأساسية. نعم ، قد يكون هناك بعض أعمال التطوير المخصصة هنا إذا كان لديك منصة التجارة الإلكترونية لا يدعم هذه الحيل خارج الصندوق.
وهذا مجرد واحد من الطرق للسيطرة على مصائد العنكبوت هذه - دع كل شيء يدرس ... دع مصيدة العنكبوت تستمر في الوجود ... لكن كن واضحًا لـ Google بشأن ما يجري ، وكيف تجاوز أي زحف في النهاية - المجموعة الأساسية / المهمة الواضحة هي عمل أكثر أهمية وربما غير ضروري. يجب أن يعود بحث Google باستخدام معدِّل الموقع بكمية تقريبية من الصفحات الأساسية التي تعلن عنها الآن بشكل واضح - وليس الباقي الذي تعترف به هو عبارة عن رموز منخفضة الأولوية.
أفضل الحلول هي دائمًا الحلول التي لا يمكن إنشاء سوى عدد محدود من الصفحات من خلال موقع ما ، ويمكن أن تدور Google عبرها جميعًا في غضون أيام قليلة. حاول الجري يصرخ الضفدع ضد موقع (مع الكثير من الذاكرة). إذا لم ينتهي ، فقد يكون لديك مصيدة عنكبوتية.
إنه مثل أي شجرة معينة ، قد يكون الأمر صعبًا ، لكن يمكنك فعلاً حساب الأوراق! هذا ممكن ، لكنك ستنتهي. كذلك سينتهي Screaming Frog من الزحف إلى موقع محدد بشكل صحيح.
ترتيب المسائل - خفض التباديل
يمكن أن يساعد تهجين بعض الجوانب في السيطرة على الموقف — مثل جعل بعض الوجوه قادرة فقط على التنشيط مع جوانب أخرى معينة لعكس وفرض قيود علاقة البيانات. قد تعتبر هذا مزيجًا من نظام التنقل لأسفل المحدود مع جوانب البحث. (يتم تقديم الجوانب على وجه التحديد في مستويات معينة لأسفل). يميل التنقل لأسفل إلى فرض ترتيب معين على معلمات سلسلة الاستعلام (المظلمة كمجلدات أم لا).
يمكنك أيضًا إنشاء عناوين URL الخاصة بك بعناية ، مع ترتيب معين مفروض على الجوانب ، بحيث تتعامل فقط مع المجموعات بدلاً من التباديل. (قم بالبحث عن "المجموعات مقابل التباديل".) على وجه التحديد ، إذا قمت بتحديد الوجه A ثم الوجه B في حالة واحدة ، ولكن بعد ذلك الجانب B ثم الوجه A في حالة أخرى ، ستكون عناوين URL مختلفة ، ولكن النتيجة الصفحة نفسها. يمكن إصلاح ذلك عن طريق الترتيب الأبجدي أو باستخدام بعض الترتيب المحدد مسبقًا لكيفية ظهور المعلمات على عنوان URL.
وتذكر أخيرًا أننا نلتزم باستعارة الأشجار من أجل التسلسل الهرمي للموقع ، والغرض من هذه الشجرة هو نشر أغصانها وأغصانها وأوراقها لإنشاء مساحة سطح بأوراق لالتقاط أشعة الشمس بكفاءة أكبر. شكل التطور الأشجار بحيث لا تستمر في النمو خارج النقطة التي تلتقط فيها الضوء بكفاءة أكبر.
تشكيل فني الموقع
كما هو مذكور في بداية هذه المقالة ، فإن معظم مواقع البحث الأوجه إما تجعل موقعها غير مرئي للبحث أو عمل روتيني مستحيل الزحف. الجواب الحقيقي هو في مكان ما في الوسط - تشكيل فني. هناك العديد من الطرق لإيقاف هذا الأمر ، من إجراء تعديلات على ملف robots.txt إلى تغيير إعدادات Google Search Console (أدوات مشرفي المواقع سابقًا) ، إلى تغيير علامات التعريف في مصدر العرض الخاص بك.
الحلول متنوعة ، ويجب أن يتم توجيهها جميعًا من خلال إستراتيجية شاملة لاستهداف الكلمات الرئيسية ، وبناءً على ما يدعمه النظام الأساسي للتكنولوجيا الخاص بك وقابل للتنفيذ بواسطة فريقك. على عكس الأشجار الطبيعية التي يتم تحديد أقصى شكل لها بواسطة قيود الطبيعة ، يمكن أن تنمو مواقع الويب ذات الأوجه دون أي قيود ، وقد لا تعرفها أبدًا - باستثناء عدم الأداء الجيد في Google.