매력적인 검색 결과 : SEO를위한 효과적인 Endeca & Lucene 활용

면 처리 된 검색은 꽤 드물었습니다. 자, 그것은 어디 에나있는 것처럼 보입니다! 이 기능을 사용하여 사이트의 검색 가시성을 어떻게 다룰 지에 대한 세부 사항을 잘못 이해하는 것은 오늘날 전자 상거래 사이트에서 가장 일반적으로 발생하는 문제 중 하나입니다. 우리는 Flying Point Digital에서 동일한 문제를 반복하고 SEO 관점에서 볼 때 단순히 "카테고리 페이지를 개선"하는 것이 아닙니다. 그것이 수정의 중요한 부분이지만, 단지 절반의 이야기 일뿐입니다.

감사합니다, Captain Obvious

파셋 형 검색으로 진행되는 작업에 대한 충분한 감독 또는 오해와이 사이트 탐색 기술 SEO 용으로 얼마나 좋은지, 그것이 기사를 쓸 때입니다. 그것은 오래된, 우연한 거미 함정 이야기지만, 비꼬아 있습니다. ���니면 새로운 차원으로 이야기해야합니까? 잠시 동안 SEO 업계에 종사 한 사람들에게는 문제를 추론하고 수정하는 데 필요한 많은 정보가있을 것입니다. 면 탐색은 네비게이션이 "검색 친화적 인"경우 가능한 패싯 선택의 모든 조합만큼 거미 함정을 만듭니다.

정의 된 문제. 해결책은 함축적입니다. 당신은 SEO 산업의 짠 오래된 개를 떠날 수 있습니다. 이것을 처음 듣거나 듣는 사람들을 위해, 계속 읽어보십시오. 우리는 먼저 약간의 역사에 빠지게 될 것입니다. 현재는 그러한 사이트에 종종 존재하는 나쁜 상황입니다. 그런 다음 마침내 한 가지 가능한 해결책에 대해 몇 가지 큰 획을 그었습니다.

그런 다음 마침내 한 가지 가능한 해결책에 대해 몇 가지 큰 획을 그었습니다

백만 가지 제품 카탈로그

수백만의 큰 카탈로그 또는 심지어 수십만 개의 제품이있는 전자 상거래가있는 곳이라면 어디서나 가격을 설명 할 수있는 가격과 색상 및 크기와 같은 구조화 된 데이터가 있습니다. 그리고 그러한 product-Descriptor를 사용하여 검색 및 필터링을 기반으로 구축 된 사용자 인터페이스를 설명하는 용어는 패싯입니다.

면 처리 된 검색은 키워드를 플러그인하거나 탐색을 드릴 다운하는 것 이상의 검색을 구체화하기 위해 클릭 할 수있는 모든 필터입니다. 여기에 공식 정의가 몇 가지 있습니다. 암묵적인 주문 무감각 (드릴 다운 탐색에는 없습니다). 주문에 민감한 메뉴 (웹 하이퍼 링크와 같은)를 통해 드릴 다운하면 특정 최종 결과가 탐구됩니다. "찾을 수있는 모든 것"은 하드 드라이브의 파일 또는 트리의 노드와 유사합니다. 가능한 경우 드릴 다운 탐색 기능을 사용하여 스파이더 트랩을 만드는 것이 더 어렵습니다. 웹이 대부분 작동하는 방식이며 Google 검색 및 색인을 이렇게 훌륭하고 효과적인 시스템으로 만들었습니다. 또한 Google은 역동적 인 사이트를 "좋아하지 않는"것으로 부당한 평판을 얻었습니다.

거미 함정과 혼합 된 메시지

URL에 물음표가 삽입되면 사이트는 "동적"으로 간주되어 사이트가 영원히 계속 될 수 있습니다. "다음 날"링크를 클릭 할 수있는 캘린더 웹 페이지를 생각해보십시오. 스파이더 함정을 만드는 것은 정말 간단합니다. 어떤 방식 으로든 Google에 사이트를 역동적으로 또는 악의적으로 또는 읽을 수 없도록 만드는 것은 물음표가 아닙니다. Google이 어느 시점에 버려야하는 사이트 유형에 물음표가 있으며, 비참하게 만들지 않는 사이트를 크롤링하는 비즈니스에 착수하는 것입니다. 그렇지 않으면 구글의 모든 무한한 자원은 하나의 간단한 사이트에서 하나의 간단한 무한 일정을 크롤링하는 데 소비됩니다.

동적 사이트 (또는 URL)는 일부 사람들이 느끼는 것처럼 본질적으로 나쁨이 아닙니다. 나쁜 점은 우발적 인 스파이더 함정을 만드는 것이 얼마나 쉽고 문제가 있다는 것을 결코 깨닫지 못하는 것입니다. 구글 측에서부터 그들은 현실적인 방법으로 다음 사이트로 진출하고 있기 때문에 바퀴를 돌리는 데 모든 시간을 소비하지 않습니다. 구글은 스파이더 - 함정에 대담하게 뛰어 들며, 수백만 페이지를 되 돌리고, 그것들을 이해할 수 없는지를보기 위해, 요즘에는 훨씬 더 많은 의지를 가지고있다.

이 기사에서는 종종면 처리 된 검색이라고하는 탐색 체계에 의해 생성 된 동적 URL 스파이더 - 트랩의 특정 유형에 초점을 맞추고 있습니다. 재미있는 단어, 패싯. 보석의 절단면을 생각하게합니다. 나는 전자 상거래 분야에서 좋은 성과를 거두었으며, 임의적으로 매개 변수화되었거나 귀속되거나 다차원 또는 필드 필터링 된 검색을 말하는 것보다 쉽습니다. 모든 매개 변수화 된 검색이 패싯이 아닙니다. 패싯은 자신을 다른 주문과 겉으로는 무한한 순열에 빠지게하는 경향이 있습니다. 둘 다 "패싯"과 특히 거미의 함정이되는 것입니다.

Endeca와 Lucene

우리는 더 이상 자주 사용하는 사이트를 만들기 때문에 측면 검색 사이트에 문제가 있음을 눈치 채고 있습니다. 이 탐색 기술은 설정에 필요한 비용과 전문 지식 및 규모에 따른 (정확한 데이터와 함께)이 기능을 제공하기위한 서버 요구 사항이 매우 까다 롭기 때문에 상당히 드문 경우가있었습니다. 그것은 변화하고 있습니다. 데이터가 잠겨 있더라도 Endeca (현재는 Oracle) 또는 Lucene (Apache 프로젝트)와 같은 일부 제품이이를 통해 스윕하고, 패싯으로 층을 이루는 사이트 구축 구성 요소에 연결하는 데 필요한 데이터베이스와 색인을 작성할 수 있습니다 사이트를 검색하십시오.

Endeca는 오랫동안 패싯 검색을 제공하는 주요 엔터프라이즈 급 상용 소프트웨어였습니다. 따라서이 주제가 발생할 때 이름을 너무 많이 들었습니다. 물론 자신감을 지불해야합니다. 그러나 자신감과 강력한 개발자 팀이 있다면 비 독점 (무료 및 오픈 소스) Lucene 소프트웨어 스택 대안이 있습니다.

Lucene은 내가 말했듯이,이 특별한 소프트웨어 스택을 가진 경험 개발자가 아니기 때문에 Endeca는 엔터프라이즈 수준의 성능으로도 거의 모든 것을 수행하지만 무료입니다. Endeca와 마찬가지로 일종의 생태계에서 함께 작동하는 개개의 제품을 포함하고 있습니다. 그 생태계의 최상위는 Apache Software Foundation (회사와 동등), Lucene 프로젝트 (제품과 동등), 그리고 그 후 우리가 말하는 Solr 또는 Elastic Search의 실제 웹 UI를 만드는 부분입니다.

그래서 Lucene과 Endeca의 모든 것들은 "The Cloud"가 당신을 다루지 않아도된다는 IT 인프라 스트럭쳐의 것들이며, 그들에게 오래된 DIY 느낌이 약간 있습니다. 소기업이거나 구현상의 어려움을 원치 않는다면 가장 동의 한 모범 사례를 즉시 사용할 수 있고 엔터프라이즈 급으로 간주되기를 원한다면 항상 Demandware 또는 하나의 극단에서 Endeca / Lucene 사이의 틈새를 채우는 다른 제품과 WordPress의 WooCommerce 인스턴스를 다른 호스트에서 채우는 호스트.

또한 IBM, Microsoft 및 SAP와 같은 모든 기술 전문가는 웹 패싯 검색 문제를 해결할 수있는 방법을 제공합니다. Endeca와 Lucene은 이러한 문제를 해결하는 SEO 사용자가 계속해서 등장하는 이름이기 때문에 이러한 측면의 검색 토론을 구성 할 수있는 쉬운 방법이지만 스펙트럼의 각 끝에 실제로 다른 것들이 있다는 것을 명심하십시오. 그리고 그 사이에는 셀 수없이 많습니다. 예를 들어 Demandware의 클라우드 용이성을 원하지만 언젠가 집안에서 경쟁 우위를 위해 극단적 인 맞춤 설정을 시작하기로 선택할 수있는 옵션이있는 경우 Hybris가 하이 엔드에, Magento가 로우 엔드에 있습니다.

두 가지 극한 시나리오

그러나 하루가 끝나면 이러한 모든 인프라는 일종의 패싯 검색을 가지며 동일한 일련의 문제를 처리해야합니다. 일반적으로 패싯 탐색은 두 가지 범주 중 하나로 분류됩니다. 잠재적 인 페이지의 수백만 개를 "가능하게"만들 수 있습니다 :

  1. 하나의 이유 또는 다른 이유로 인해 검색에 완전히 보이지 않음
  2. 검색시 표시되지만 Googlebot이 크롤링 및 탐색을 완료하지 않는 사이트를 만듭니다.

첫 번째 시나리오에서는 사용자 인터페이스가 구식 CGI 양식 요소로 작성되고 검색을 실행하기 위해 JavaScript를 제출하거나 실행해야하기 때문에 검색에 표시되지 않는 패싯 된 검색 사이트가 보이지 않거나 실제로 크롤링 할 수 있습니다. 하지만 사이트 소유자는 robots.txt 또는 기타 메커니즘을 통해 사이트의 크롤링 / 색인 기능을 "해제"했습니다. 대개 상황 2의 고통을 겪었 기 때문입니다.

두 번째 상황에서는 측면 검색 사이트 전체와 생성 할 수있는 모든 잠재 페이지가 Google에서 완벽하게 크롤링 할 수 있습니다. 그러나 페이지는 끝이 없으며 그 끝이없는 크롤링의 99 %는 중복 된 콘텐츠입니다. 다른 말로하면, 그것은 거미 함정입니다. Google은 귀하의 전체 사이트를 보지만 이전에 설정 한 작업이 우스꽝 스럽기 때문에 포기하고 다음 사이트로 이동합니다.

이 스파이더 함정 사이트가 쉽게 만들 수있는 / 생성해야하는 중요한 페이지의 "핵심 집합"을 희석하거나 완전히 모호하게하여 검색 순위에 영향을 미칠 것이라고 거의 생각하지 않지만 매우 중요합니다. 클릭 경로 (주 및 보조 탐색)를 발견하고 알려진 검색 및 알려진 변환 키워드와 정렬되도록 조정할 수 있습니다.

실제 실생활 나무를 생각해 보라.

따라서 트릭은 주 트렁크와 트리의 가지와 같은 핵심 페이지 집합을 밝히는 것입니다. 이것은 아마도 키워드 연구가 진행될 때 조정되는 처음 두 개의 선택된 패싯 또는 "핵심 페이지 집합 정의"를위한 다른 메커니즘을 나타냅니다. 몸통과 가지가 핵심입니다. 실제로는 패싯 검색 매개 변수를 선택하여 생성되었는지 여부에 관계없이 표준이 아닌 복제 페이지의 마스터 세트입니다. (귀하의 핵심 페이지가 이들로 구성 될 수도 있습니다).

귀하의 사이트가 이보다 수백만 페이지를 더 많이 생성 할 수 있다고하더라도, 100 페이지에서 10000 페이지에 이르는 "핵심"이 마스터 표준 세트가 될 수 있습니다. 수백만 개의 대부분 중복 된 유사 콘텐츠는 핵심 태그와 가장 일치하는 URL로 정식 태그를 다시 소유 할 수 있습니다. 그래, 여기에 맞춤 개발 작업이있을 수 있습니다. 전자 상거래 플랫폼 이러한 out-of-the-box 트릭을 지원하지 않습니다.

그리고 그것은 이러한 거미 함정을 통제 할 수있는 접근법 중 하나 일뿐입니다. 모든 것이 색인화되도록 ... 거미 함정이 계속 존재하게하십시오 ...하지만 Google에 무슨 일이 일어나고 있는지, 명백한 핵심 / 중요 세트는 꼭대기에 있고 아마도 불필요한 작업입니다. 사이트 수정자를 사용하는 Google 검색은 현재 명확하게 광고하고있는 정규 핵심 페이지의 양과 함께 돌아와야하며 나머지는 그렇지 않습니다. 우선 순위가 낮은 순열이 허용됩니다.

가장 좋은 솔루션은 항상 사이트에서 한정된 양의 페이지 만 생성 할 수있는 사이트이며, Google은 며칠 만에이를 모두 돌릴 수 있습니다. 실행 해보기 비명 소리 개구리 사이트에 대해 (충분한 메모리가있는). 끝나지 않으면 거미 함정이 생길 수 있습니다.

그것은 어떤 주어진 나무와 같아서, 어려울지도 모르지만, 당신은 실제로 잎을 셀 수있었습니다! 가능하지만 끝낼 것입니다. 너무 비명을 지르는 개구리는 제대로 유한 사이트를 크롤링합니다.

주문 사항 - 순열 절단

패싯의 특정 하이브리드 화는 특정 패싯을 특정 다른 패싯과 함께 활성화하여 데이터 관계 제약을 반영하고 적용하는 것과 같이 상황을 제어 할 수 있도록 도와줍니다. 검색 패싯과 함께 훨씬 더 유한 한 드릴 다운 탐색 체계의 조합으로 간주 할 수 있습니다. (면은 특정 드릴 다운 레벨에서 특별히 제공됩니다.) 드릴 다운 탐색은 쿼리 문자열 매개 변수에 특정 순서를 적용하는 경향이 있습니다 (폴더로 또는 불투명하게).

패싯에 대한 특정 시행 순서로 URL을 신중하게 구성 할 수 있으므로 순열 대신 조합 만 처리 할 수 ​​있습니다. ( "조합 대 순열"을 검색하십시오.) 특히, A면을 선택하고 B면을 선택하고 B면을 선택하고 A면을 다른면에서 선택하면 URL은 달라 지지만 결과는 같은 페이지. URL에 매개 변수를 표시하는 방법에 대해 알파벳순으로 정렬하거나 사전 설정된 순서로 수정하면 해결할 수 있습니다.

그리고 마지막으로 우리가 사이트 계층에 대한 나무 - 은유를 고수한다는 것을 기억하면서, 나무의 목적은 햇빛을 가장 효율적으로 포착 할 수있는 나뭇잎이있는 표면 영역을 만들기 위해 가지, 나뭇 가지 및 잎을 펼치는 것입니다. 진화론은 나무를 형성하여 빛을 가장 효율적으로 포착하는 지점을지나 계속 자라지 않게합니다.

예술적 스타일로 사이트 만들기

이 기사의 설명에서 언급했듯이, 대부분의 측면 검색 사이트는 사이트를 검색 할 수 없게하거나 불가능한 크롤링 작업으로 만듭니다. 진정한 대답은 중간에 있습니다 - 예술적 형성입니다. robots.txt 파일을 조정하여 Google Search Console (이전의 웹 마스터 도구) 설정을 조정하고보기 소스의 메타 태그를 변경하는 등 여러 가지 방법을 사용할 수 있습니다.

솔루션은 다양하며 포괄적 인 키워드 타겟팅 전략과 기술 플랫폼이 지원하고 팀이 구현할 수있는 것을 기반으로 모든 조치를 취해야합니다. 최대 모양이 자연의 제약으로 정의 된 자연 나무와는 달리,면 처리 된 웹 사이트는 성장할 수 없으며 Google에서 잘 수행하지 못하는 경우를 제외하고는 결코 알 수 없습니다.

?�니면 새로운 차원으로 이야기해야합니까?