חיפוש גנון: יעיל מינוף Endeca & Lucene עבור SEO

  1. חיפוש גנון: יעיל מינוף Endeca & Lucene עבור SEO

חיפוש גנון: יעיל מינוף Endeca & Lucene עבור SEO

חיפוש פנים היה אמור להיות די נדיר. עכשיו, זה נראה בכל מקום! קבלת הפרטים שגויים על איך אתה wrangle את החשיפה של אתרי אינטרנט עם תכונה זו היא אחד הדברים הנפוצים ביותר שבור באתרי מסחר אלקטרוני היום. אנו נתקלים באותן בעיות שוב ושוב ב- Flying Point Digital, ומפרספקטיבה של SEO, זה לא פשוט "לעשות דפים טובים יותר". אמנם זה חלק חשוב של תיקון, זה רק חצי הסיפור.

תודה, קפטן ברור

יש מספיק פיקוח או misconception של מה קורה עם חיפוש פנים וכמה טוב זה טכניקה ניווט באתר עשוי להיות עבור SEO, כי הגיע הזמן שכתבנו מאמר. זה אותו סיפור ישן, מלכודת עכביש מקרית, אבל עם טוויסט. או, צריך לומר עם ממדים חדשים. עבור אלה שהיו בתעשיית SEO זמן מה, זה כנראה הרבה מידע הן להסיק ולתקן את הבעיה. חיפוש מובנה יוצר מלכודת עכביש גדולה כמו כל שילוב של בחירות פנים אפשריות, כל עוד הניווט שלך הוא "ידידותי החיפוש".

הבעיה הוגדרה. פתרונות מרומזים. אתה כלבים מלוחים הישן של תעשיית SEO יכול ללכת. עבור אלה רק לשמוע על זה או להתמודד עם זה בפעם הראשונה, המשך לקרוא. אנחנו נצלול אותך קצת לתוך ההיסטוריה, את המצב הרע, כי לעתים קרובות קיים כיום באתרים אלה, ולאחר מכן לבסוף להוציא כמה שבץ רחב של פתרון אפשרי אחד.

קטלוגים למיליון מוצרים

בכל מקום שבו יש מסחר אלקטרוני עם קטלוגים גדולים של מיליונים, או אפילו רק עשרות אלפים של מוצרים, יש נתונים מובנים כמו מחיר וצבע וגודל לתאר את כל זה. ואת המונח שנבחר כדי לתאר את ממשקי המשתמש שנבנו סביב חיפוש וסינון באמצעות מתוארים מוצר כזה הוא היבטים.

חיפוש פנים הוא רק כל המסננים שאתה יכול ללחוץ על כדי לחדד את החיפוש שלך, מעבר לחיבור מילות מפתח או קידוח למטה על ניווט. יש כאן כמה הגדרות פורמאליות, ואת חוסר רגישות סדר משתמעת (זה לא קיים על ניווט לקדוח למטה). קידוח למטה דרך תפריטים רגישים סדר (כמו היפר אינטרנט) מרמז על סופיות מסוימת לחקירה שלך. כל מה שאתה "מוצא" מקביל קבצים על כונן קשיח או צמתים בעץ. למרות שזה אפשרי, זה פשוט יותר ליצור מלכודות עכביש עם ניווט למטה לקדוח. זה איך האינטרנט פועל בעיקר, וזה מה שעשה חיפוש ב- Google ואינדקס כזה מערכת מבריק ויעיל. זה גם מה שנתן ל- Google מוניטין לא הוגן עבור אתרים דינמיים "לא אוהבים".

מלכודות עכביש והודעות מעורבות

מיד עם סימן שאלה הוא הציג את כתובת האתר, האתר נחשב "דינמי", והאתר יכול להימשך לנצח. חשוב על דף אינטרנט של יומן שבו תוכל תמיד ללחוץ על קישור "יום הבא". זה באמת כל כך פשוט ליצור מלכודת עכביש. וזה לא את קיומו של סימן שאלה שהופך את האתר דינמי או רע או בלתי קריא ל- Google בכל דרך שהיא. זה סימן שאלה קיים על סוגי אתרים Google יש לשים בצד בשלב מסוים, ולהמשיך עם העסק של זוחל אתרים שאינם עושים דברים אומללים. אחרת, כל המשאבים האינסופיים לכאורה של Google יוצאו לסרוק את לוח השנה האינסופי הפשוט הזה באתר קטן אחד.

אתרים דינמיים (או כתובות אתרים) אינם רעים מטבעם, כפי שמרגישים אנשים מסוימים. מה רע זה כמה קל לעשות מלכודות עכביש בשוגג ולא מבינים שיש לך אפילו את הבעיה. מצד גוגל, הם פשוט לעלות על האתר הבא באופן ריאליסטי, ולכן הם לא מבלים את כל הזמן שלהם מסתובב הגלגלים שלהם. גוגל יש הרבה יותר נכונות בימים אלה כדי לצלול לתוך מלכודות עכביש, למשוך כמה מיליוני דפים, ולראות אם הם לא יכולים להבין את זה.

במאמר זה, אנו מתמקדים בסוג מסוים של מלכודת עכביש דינמית URL כפי שנוצר על ידי ערכת הניווט המכונה לעתים קרובות חיפוש פנים. מילה מהנה, היבטים. גורם לך לחשוב על פרצופים חתוכים של תכשיט. אני מניח שמשרת את biz מסחר אלקטרוני בסדר גמור וזה יותר קל מאשר לומר באופן שרירותי פרמטר או לייחס או רב ממדי או שדה מסונן החיפוש. לא כל החיפושים פרמטרים הם היבטים. הפאטים נוטים להרשות לעצמם ללכת בהזמנות שונות ובתמורות אינסופיות לכאורה - הן מה שהופך אותם ל"צדדים "והן למלכודת עכביש מרושעת במיוחד.

אנדקה ולוקן

אנו מבחינים בבעיות עם אתרי חיפוש מובחנים לעתים קרובות יותר, שכן כעת קל יותר ליצור אתרים המשתמשים בו. טכניקת הניווט הזו הייתה נהוגה במידה ניכרת בגלל העלות והמומחיות הנדרשות כדי להגדיר אותה, ואת דרישות השרתים הבשירות של אספקת תכונה זו (עם נתונים מדויקים) בקנה מידה. זה משתנה. לא משנה מה הנתונים שלך נעולים מעלה, מוצר כמו Endeca (עכשיו, מאורקל) או Lucene (פרויקט Apache) יכול לטאטא את זה ולבנות את מסד הנתונים ואת האינדקסים הנדרשים כדי להתחבר אל האתר בניית רכיבים כי שכבת פנים חפש באתר.

Endeca כבר זמן רב הדומיננטי ברמה ארגונית תוכנה מסחרית להציע חיפוש פנים - ולכן אתה שומע את שמו הופעל כל כך הרבה כאשר הנושא הזה עולה. אתה תשלם על הביטחון הזה, כמובן. אבל אם יש לך את הביטחון העצמי שלך, וכן צוות מפתחים חזקה, יש לא קניינית (חופשית וקוד פתוח) לוקה תוכנה מחסנית חלופה.

לוצ'ן, כפי שאומרים לי - מכיוון שאני לא מפתחת ניסיון עם תוכנה זו מחסנית מסוימת - עושה כמעט כל דבר Endeca עושה, אפילו עם ביצועים ברמת הארגון, אבל בחינם. כמו עם Endeca, יש באמת שקית שלמה של מוצרים בודדים שפועלים יחד במעין מערכת אקולוגית. החלק העליון של מערכת אקולוגית זו הוא קרן התוכנה של אפאצ'י (המקבילה לחברה), ולאחר מכן לפרויקט Lucene (שווה ערך למוצר) ולאחר מכן, החלק שמייצר את ממשק המשתמש המקוון שאנו מדברים עליו - או Solr או Elastic Search.

אז כל זה Lucene ו Endeca דברים הוא הודה כי תשתיות IT דברים כי "ענן" הוא אמור למנוע ממך להתמודד עם, ויש להם קצת של בית הספר הישן מרגיש DIY. אם אתה חברה קטנה יותר, או פשוט לא רוצה כאבי ביצוע, וברצונך להשתמש בשיטות המומלצות ביותר שיושגו מחוץ למערכת, ועדיין להיחשב ברמה ארגונית, תמיד יש Demandware, או שורה של מוצרים אחרים הממלאים את הנישות בין Endeca / Lucene בקיצוניות אחת לבין מופע מתארח של WooCommerce על WordPress מצד שני.

בנוסף, כל השחקנים טק גדול באמת, כגון יבמ, מיקרוסופט ו- SAP, מציעים משהו כדי לפתור את בעיית החיפוש באינטרנט. Endeca ו- Lucene הם השמות שמופיעים שוב ושוב כאשר אתה מתמודד עם הבעיות הללו, כך שזו דרך קלה למסגרת הדיון הזה, אבל זכור שיש באמת אחרים בכל קצה של הספקטרום, ועוד אינספור ביניהם. אם למשל אתה רוצה את זה קל ענן של Demandware, אבל עם אפשרות לקחת את כל זה בבית יום אחד להתחיל שכבת התאמה אישית קיצוניים עבור יתרון תחרותי, יש Hybris ב high-end, ו Magento בקצה התחתון.

שני תרחישים קיצוניים

אבל בסופו של דבר, כל התשתיות האלה יש צורה כלשהי של חיפוש פנים צריך להתמודד עם אותה סדרה של בעיות. בדרך כלל, חיפוש פנים נופל לתוך אחת משתי קטגוריות. כל מיליוני הדפים הפוטנציאליים "מתאפשרים" הם:

  1. לגמרי בלתי נראה לחפש בגלל סיבה זו או אחרת
  2. גלוי לחיפוש, אך יוצר אתר ש- Googlebot לעולם לא יסיים לסרוק ולחקור

בתרחיש הראשון, אתרי חיפוש מובחנים שאינם נראים לחיפוש הם בלתי נראים, משום שממשק המשתמש בנוי עם אלמנטים מסוג CGI-form מיושנים ודורש שליחת או ביצוע של JavaScript עבור החיפוש לביצוע, או שהוא למעשה ניתן לסריקה, אך בעלי האתר "כיבו" את היכולת של Google לסרוק / לאינדקס את האתר באמצעות robots.txt או מנגנון אחר - בדרך כלל משום שהם סבלו מכאבים במצב מספר שתיים.

במצב מספר שתיים, כל אתר החיפוש המוטבע וכל הדפים הפוטנציאליים שהוא יכול להפיק ניתנים לסריקה מושלמת על ידי Google. עם זאת, הדפים אינם נגמרים, ו -99% מהסריקה הבלתי פוסקת הזו הם תוכן כפול. במילים אחרות, זוהי מלכודת עכביש. גוגל רואה את כל האתר שלך, אבל בגלל מגוחך של המשימה שאתה מגדיר לפני זה, זה יוותר ולעבור אל האתר הבא.

לעתים רחוקות חשבו, אבל חשוב ביותר, היא כי מלכודת עכביש תהיה השפעה על דירוג החיפוש שלך על ידי דילול או לחלוטין לערפל את "הליבה להגדיר" של דפים חשובים האתר שלך יכול / צריך להיות שנוצר כי ניתן למקם בקלות -Discover נתיבי קליקים (ניווט ראשי & משני) ו להיות tweaked ליישור עם חיפושים ידועים ו ידועים מילות מפתח המרה.

תחשוב במונחים של בפועל Real-Life עצים

אז, הטריק הוא להדליק את הליבה של הדפים, כמו גזע הראשי וענפי עץ. אלה אולי מייצגים את שני היבטים הראשונים שנבחרו או מנגנון אחר עבור "הגדרת הליבה של הדפים", כי הוא מתואם עם מה מחקר מילות המפתח שלך הולך. גזע וענפים הם הליבה. הם ערכת המאסטר שלך של דפים קנוניים שאינם כפולים - בין אם הם באמת הופקו על ידי בחירת פרמטרים החיפוש פנים. (דפי הליבה שלך עשויים להיות מורכבים מאלה).

גם אם האתר שלך יכול ליצור מיליוני דפים יותר מזה, זה "הליבה" של מקום בין 100 ל 10,000 עמודים יכול להיות סט הקאנון הראשי שלך. כל שאר המיליונים האחרים - וריאציות כפולות - יכולים להחזיק תגים קנוניים בחזרה לכתובת האתר התואמת הקרובה ביותר ממערכת הליבה. כן, ייתכן שיש כאן כמה עבודות פיתוח מותאמות אישית אם שלך פלטפורמת מסחר אלקטרוני אינו תומך כאלה טריקים מחוץ לקופסה.

וזו רק אחת הגישות להשגת מלכודות עכביש אלה תחת שליטה - תן לאינדקס הכל ... להניח למלכודת העכביש להמשיך להתקיים ... אבל להיות ברור ל- Google לגבי מה שמתרחש, וכיצד כל זחילה מעבר לסוף- ברור הליבה / חשוב להגדיר הוא מעל- the-top ואולי עבודה מיותרת. חיפוש ב- Google עם אתר משנה צריך לחזור עם כמות הדפים הליבה הקנונית שאתה מפרסם כעת בבירור - ולא את השאר, שאותו אתה מודה הם תמורות בעדיפות נמוכה.

הפתרונות הטובים ביותר הם תמיד אלה שבהם רק כמות מוגבלת של דפים יכול להיות שנוצר על ידי האתר, ו- Google יכול לסובב את כולם בתוך כמה ימים. נסה לרוץ צרחה צפרדע נגד האתר (עם הרבה זיכרון). אם זה לא ייגמר, אולי תהיה לך מלכודת עכביש.

זה כמו על כל עץ נתון, זה יכול להיות קשה, אבל אתה באמת יכול לספור את העלים! זה אפשרי, אבל תסיים. כך גם צרחה צפרדע לסיים לסרוק אתר סופית כראוי.

סדר עניינים - קיצוץ ההנחות

היברידיזציה מסוימת של היבטים יכולה לסייע בשליטה על המצב, כגון הפיכת היבטים מסוימים לפעילים בשילוב עם היבטים מסוימים אחרים על מנת לשקף ולאכוף את אילוצי היחסים בין הנתונים. אתה יכול לשקול את זה שילוב של הרבה יותר סופית מטהר את הניווט ניווט עם היבטים החיפוש. (פאות מוצגים באופן ספציפי ברמות מסוימות). ניווט מטה-מטה נוטה לאכוף סדר מסוים לפרמטרים של מחרוזת השאילתה שלך (מטושטש כתיקיות או לא).

ניתן גם לבנות את כתובות האתרים שלך בזהירות, עם סדר מסוים נאכף על היבטים, כך שאתה רק להתמודד עם שילובים במקום תמורות. (בצע חיפוש אחר "שילובים לעומת תמורות"). באופן ספציפי, אם אתה בוחר את הפן A ולאחר מכן פקט B במקרה אחד, אבל אז פייס B ולאחר מכן פגש A אחרת, כתובות האתרים יהיו שונים, אבל התוצאה דף זהה. זה יכול להיות קבוע רק על ידי אלפבדיזציה או באמצעות כמה מראש להגדיר סדר כיצד הפרמטרים הם להופיע בכתובת האתר.

ובסופו של דבר נזכר שאנחנו דבקים במטאפורה של עץ עבור היררכיה של האתר, מטרתו של עץ היא להפיץ את ענפיו, זרדים ועלים כדי ליצור שטח שטח עם עלים ללכוד את אור השמש בצורה היעילה ביותר. האבולוציה עיצבה עצים, כך שהם לא ממשיכים לצמוח מעבר לנקודה שבה הם ללכוד את האור בצורה היעילה ביותר.

באמנות עיצוב אתר

כאמור, במאמר זה, רוב אתרי החיפוש הנבדלים או להפוך את האתר שלהם בלתי נראה לחיפוש או מטלה זוחלת בלתי אפשרי. התשובה האמיתית היא אי שם באמצע - עיצוב אמנותי. יש דרכים רבות למשוך את זה, החל לבצע התאמות בקובץ robots.txt שלך כדי לשנות את ההגדרות של Google Search Console (בעבר כלי מנהלי האתרים), כדי לשנות את המטא-תגים במקור התצוגה שלך.

הפתרונות הם מגוונים, וכל זה צריך להיות מכוון על ידי אסטרטגיית מיקוד מילות מפתח כוללת, ועל סמך מה נתמך על ידי פלטפורמת הטכנולוגיה שלך מיושם על ידי הצוות שלך. שלא כמו עצים טבעיים שצורתם המקסימלית מוגדרת על ידי אילוצי הטבע, אתרי אינטרנט חיצוניים יכולים לצמוח ללא מעצורים, וייתכן שלעולם לא תדע זאת - פרט לכך שמעולם לא הביאה ביצועים טובים ב- Google.