Выявление мертвых ссылок для более эффективного анализа ссылок

  1. URL Profiler:
  2. Kerboo:
  3. Кричащая лягушка:
  4. Наш пример:
  5. Шаблон регулярного выражения:
  6. Принимая вещи дальше

Проекты анализа ссылок могут быть трудными и трудоемкими, особенно для веб-сайтов с большими профилями ссылок, поэтому оптимизация вашего рабочего процесса и повышение целостности ваших данных так важны.

За последние пару лет мне посчастливилось работать с веб-сайтами, на которые указывают десятки тысяч доменов, и с учетом временных ограничений было крайне важно ограничить размер набора данных, чтобы рекомендации были даны как можно более действенными. И один из самых простых способов сделать это - удалить ссылки, которые больше не работают.

Два крупнейших сторонних исследователя ссылок (Majestic и Ahrefs) имеют как свежие, так и исторические базы данных, которые могут помочь уменьшить количество URL-адресов, обрабатываемых с самого начала. Тем не менее, несмотря на все их усилия, довольно большая часть все еще атрофировалась.

В краткой справке Majestic: «нет API для Интернета». Необходимо сканировать сеть, чтобы открывать новые страницы, и на это нужно время. На самом деле две крупнейшие базы данных ссылок, Ahrefs и Majestic, имеют несколько триллионов обратных ссылок - это 1 000 000 000 000+, которые необходимо регулярно сканировать, чтобы поддерживать актуальность и актуальность своих баз данных.

В этом посте я расскажу о нескольких различных методах, которые вы можете использовать для определения неработающих ссылок, прежде чем начинать анализ. По моему опыту, это может уменьшить размер вашего набора данных на 30-60%.

URL Profiler:

Одним из самых простых и доступных инструментов для фильтрации ссылок является URL Profiler. Стоимость лицензии относительно низкая, и она способна обрабатывать большие объемы данных.

Чтобы определить неработающие ссылки, загрузите список URL и добавьте домен, который вы хотите проанализировать.

Проверьте в разделе «Анализ ссылок» и нажмите «Запустить Profiler».

Проверьте в разделе «Анализ ссылок» и нажмите «Запустить Profiler»

После завершения сканирования результаты можно просмотреть в стандартном экспорте. Чтобы быть конкретным, столбец Link Status, выделенный ниже.

Чтобы быть конкретным, столбец Link Status, выделенный ниже

Если вы сталкиваетесь с большим количеством ошибок на сервере, вы можете рассмотреть возможность замедления сканирования или изменения агента пользователя на GoogleBot.

Kerboo:

Еще один отличный вариант, и инструмент, который мы обычно используем для аудит ссылок Кербу. Kerboo - это специализированный инструмент для анализа обратных ссылок, который действительно полезен, независимо от того, проводите ли вы аудит существующих ссылок или ищете новые возможности.

Kerboo автоматически объединяет данные профиля ссылки, которые можно импортировать через API-интерфейсы Majestic, Ahrefs и Search Console на постоянной основе или вручную загружать в виде списка URL-адресов. Поскольку он основан на облаке, Kerboo не потребляет всю вычислительную мощность вашего ПК, что может потребовать нескольких дней для работы с большими профилями.

В приведенном выше примере 70% полного профиля ссылки, полученного от Majestic, Ahrefs, Search Console и MOZ, больше не были активны.

Одним из преимуществ Kerboo над другими инструментами является то, что он позволяет сканировать несколько доменов. Это может пригодиться, если в прошлом ваш веб-сайт проходил миграцию домена, и вы хотели бы также сканировать ссылки, указывающие на устаревшую версию.

Кричащая лягушка:

Идентификация страниц со ссылками, которые больше не существуют, также возможна через швейцарский армейский нож SEO - Screaming Frog. Используя пользовательскую функцию извлечения Screaming Frog и относительно простое правило RegEx, можно установить, содержит ли просканированная страница ссылку на рассматриваемый сайт.

Приведенное ниже правило RegEx, как только оно будет вставлено в поле извлечения в Screaming Frog, перечислит любую страницу с действительной ссылкой, указывающей на builtvisible.com. Он будет отфильтровывать ссылки с неправильным синтаксисом HTML и искать ссылки, также указывающие на субдомены («www.», «Testing.» И т. Д.).

Наш пример:

(? Я). А {1} \ с * HREF = \ s * ( "|) \ S * (HTTP: \ / \ / | https: \ / \ / |) ([а-z0-9] { 1} + \ |.) builtvisible \ .com

com

Шаблон регулярного выражения:

(? Я). А {1} \ с * HREF = \ s * ( "|) \ S * (HTTP: \ / \ / | https: \ / \ / |) ([а-z0-9] { 1,} + \. |) [Пример домена] \. [Домен TLD]

Обратите внимание, что для поддержания правильного синтаксиса регулярных выражений символы «.» Необходимо экранировать, вставляя перед ними знак «\» при входе в домен верхнего уровня.

Чтобы получить максимально точные результаты, рекомендуется также выполнить обходы со следующими настройками:

  • Всегда следовать перенаправлениям
  • 5xx повторных попыток ответа (изменено с 0 на 5)
  • Скорость сканирования (изменено на 5 URL / с с неограниченной)
  • Пользовательский агент (изменен на Google-бот с Screaming Frog Bot)

После завершения сканирования Screaming Frog результаты на вкладке извлечения должны выглядеть следующим образом:

После завершения сканирования Screaming Frog результаты на вкладке извлечения должны выглядеть следующим образом:

Если заполнено поле «Link Status Check 1», это означает, что была обнаружена ссылка, указывающая на определенный домен.

Важно помнить, что, в отличие от предыдущих инструментов, Screaming Frog требует значительного объема памяти при использовании режима хранения по умолчанию. Если вы сканируете несколько тысяч ссылок, стоит переключить режим памяти на внутреннюю память (HDD / SSD). Это поможет снизить нагрузку на систему в обмен на скорость.

Принимая вещи дальше

Хотя этот пост в основном посвящен рассмотрению статуса ссылки для целей аудита, существует множество других применений этого подхода. Например, при попытке восстановить баланс потерянных ссылок знание о том, что ссылки являются действующими, может значительно сократить ваш список рекомендуемых перенаправлений.

Независимо от того, для чего вы используете это, я надеюсь, что методы, обсуждаемые в этом посте, сэкономят вам время - так что вы сможете сосредоточиться на анализе важных ссылок.

Похожие

Пост-пингвинские стратегии построения ссылок - обрезка ссылок
... ссылок напрямую связаны с обновлением алгоритма Пингвина, что делает важным очистку или «удаление» вашего профиля ссылок. Обновление Penguin направлено на очистку веб-сайтов, которые нарушают правила Google для веб-мастеров, путем снижения рейтинга нарушителя в поисковых системах. Однако сокращение ссылок - это процесс, о котором все компании всех размеров, SMB или предприятия должны постоянно думать и реализовывать. Если обновление и штраф Пингвина отправили ваш веб-сайт в нижнюю часть
Ценность внутреннего SEO
... наша работа заключается в достижении истинного сотрудничества. Мы можем управлять всем трафиком, который вы хотите, но это не очень ценно, если клиент не конвертирует! Будь то пикник компании или экскурсия в отдел, мы должны сосредоточиться на установлении личных отношений в масштабах всей компании. Пример 1 Я хотел выяснить, как улучшить качество обслуживания клиентов на шаблоне страницы без необходимости изменения кода. Я заметил заметный раздел, к которому наша
6.4. Пометьте подписанные изображения с помощью и
Вы находитесь в: добро пожаловать > AcceDe Web records > Руководство по доступности HTML, CSS и JavaScript > 6. Изображения и значки > 6.4. Помечать подписанные изображения тегами <figure role
Лучшая стратегия внутренних ссылок 2017-Syscomm International
Наш блог видео: Основы подобны активам, которые вы можете использовать для инвестирования в трудные времена, я имею в виду, когда что-то требует вашей логики и понимания. Итак, чтобы начать с основ, нам нужно сначала сосредоточиться на определении внутренней ссылки. О чем это все? Внутренние ссылки - это ссылки, которые идут с одной страницы домена на другую страницу в том же домене. Они обычно используются в основной навигации.
Инструмент поисковой оптимизации для анализа веб-сайтов
За последние несколько лет взорвалась поисковая оптимизация и стремление попасть в топ поисковых рейтингов Google и других поисковых систем. Все компании, предприниматели, художники и т. Д. Осознают важность интернет-рейтинга.
SEO модули для Drupal
... ссылок Если у нас есть неработающие ссылки, мы увидим, как наша страница падает в поисковых системах, и, следовательно, у нас меньше посещений. Никто не хочет иметь неработающие ссылки на несуществующую страницу. С помощью этого инструмента мы будем периодически получать информацию о том, какие ссылки не работают на нашей странице, и мы сможем решить эту проблему. Благодаря модулю
Отчетность и оценка через наш SEO отчет
... наши выводы в отчете SEO. Мы будем периодически информировать вас и регулярно будем просматривать SEO-отчет. Мы даем вам информацию о поисковой оптимизации и обсуждаем с вами, как вы можете реализовать улучшения. SEO отчет содержит следующие компоненты: Анализ ключевых слов Конкурентный анализ техника содержание Профиль ссылки Google Analytics (конверсии, лиды)
Стратегия линкбилдинга 2015
Ссылки необходимы для более высоких позиций в Google, но как их получить? 26 экспертов представили свою лучшую стратегию на предстоящий год. Оптимизация движка Zoom вращается - очень просто - вокруг 3 вещей: техника содержание Слева Вы оказываете большое влияние на первые 2. С необходимой программой SEO, как Кричащая лягушка Вы можете обнаружить и исправить
Понимание ссылок DoFollow и Nofollow: основы SEO
Всякий раз, когда мы говорим об оптимизации поисковых систем, некоторые из общих слов - это noindex, doindex, nofollow, dofollow, мета-роботы и так далее. Все слова имеют одинаковое значение в книге SEO. В этом посте я буду объяснять о Nofollow и Dofollow. Этот пост будет полезен специально для новичков, которые плохо знакомы с SEO или людьми, которые еще не совсем понимают, что такое Nofollow или dofollow. Вы знали? Nofollow
21 инструмент SEO анализа, который вам нужно знать
Я давно собирался взглянуть на инструменты, доступные в Интернете, которые поддерживают процесс позиционирования. Их было так много, что я решил разделить их по функциям. Я начну с аналитических инструментов, потому что в конце концов вам нужно знать, что происходит с нашим сайтом, чтобы наметить дальнейшие действия, верно? НазваниеОписаниеФункциястоимости SiteLiner
Унамо | SEO Советы
... ссылок в черной шляпе Заработок ссылок - это искусство получения обратных ссылок для вашего веб-сайта, конечной целью которого является повышение рейтинга в поисковой выдаче. Получив как можно больше высококачественных обратных ссылок, сканеры поисковых систем смогут быстрее обнаружить ваш сайт, посчитать ваш сайт более ценным и актуальным для поисковиков и , следовательно, повысить его рейтинг. Методы SEO «черной шляпы» не

Комментарии

И какой хостинг мы должны использовать для более мощных сайтов или с большим количеством посещений, то есть для более профессиональных сайтов?
И какой хостинг мы должны использовать для более мощных сайтов или с большим количеством посещений, то есть для более профессиональных сайтов? Если, с другой стороны, у вас уже есть более консолидированная веб-страница с несколькими важными веб-посещениями или вы хотите создать более профессиональный веб-сайт, лучшим вариантом будет Webempresa, который, хотя они и стоят дороже, скорость ваших серверов впечатляет Служба поддержки клиентов через тикет также поможет вам установить ваш
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены? Мы не говорим об отдельных сайтах, которые могут быть отфильтрованы или имеют ручные действия, а целые результаты поиска, которые кажутся странными. Ниже вы можете увидеть вырез из результатов поиска, который на мой взгляд сломан во многих отношениях. Обычно мы занимаем 3-4 места с сайтом, который я спешно создал
Для получения более подробной информации о работе обратных ссылок Назад Что такое обратная ссылка?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены? Мы не говорим об отдельных сайтах, которые могут быть отфильтрованы или имеют ручные действия, а целые результаты поиска, которые кажутся странными. Ниже вы можете увидеть вырез из результатов поиска, который на мой взгляд сломан во многих отношениях. Обычно мы занимаем 3-4 места с сайтом, который я спешно создал
Более описательный первый пример или второй?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены? Мы не говорим об отдельных сайтах, которые могут быть отфильтрованы или имеют ручные действия, а целые результаты поиска, которые кажутся странными. Ниже вы можете увидеть вырез из результатов поиска, который на мой взгляд сломан во многих отношениях. Обычно мы занимаем 3-4 места с сайтом, который я спешно создал
Консолидация сигналов: поощряются ли поисковые системы к релевантности вашей страницы и авторитет URL по содержанию URL и ссылкам?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены? Мы не говорим об отдельных сайтах, которые могут быть отфильтрованы или имеют ручные действия, а целые результаты поиска, которые кажутся странными. Ниже вы можете увидеть вырез из результатов поиска, который на мой взгляд сломан во многих отношениях. Обычно мы занимаем 3-4 места с сайтом, который я спешно создал
Директивы, такие как канонический URL, метароботы - разрешено ли отслеживание этой страницы и ее ссылок?
Директивы, такие как канонический URL, метароботы - разрешено ли отслеживание этой страницы и ее ссылок? И поэтому мы могли бы продолжить с большим количеством функций. Правда в том, что это очень полный инструмент, который предоставляет много информации. Есть и другие, такие как веб-сайт Auditor или SiteBulb, но это было навязано другим, возможно, из-за его высокой стоимости. В дополнение к этому инструменту также важно, чтобы у нас был доступ к инструменту Google
Для получения дополнительной информации о SEO и ссылках, я отсылаю вас к этому посту: Создание ссылок или зарабатывание ссылок?
Директивы, такие как канонический URL, метароботы - разрешено ли отслеживание этой страницы и ее ссылок? И поэтому мы могли бы продолжить с большим количеством функций. Правда в том, что это очень полный инструмент, который предоставляет много информации. Есть и другие, такие как веб-сайт Auditor или SiteBulb, но это было навязано другим, возможно, из-за его высокой стоимости. В дополнение к этому инструменту также важно, чтобы у нас был доступ к инструменту Google
Более того, каковы преимущества для вашего бизнеса?
Более того, каковы преимущества для вашего бизнеса? Некоторые из этих вопросов, должно быть , звучали у вас в голове. Когда вы выполняете поиск в поисковых системах, таких как Google, Bing, Yahoo и другие, ваш сайт появляется на первой странице поисковых систем, поэтому сайт почти наверняка может оптимизировать SEO . Но это все еще не актуально. Есть и другие вещи, которые могут доказать, что сайт был оптимизирован для SEO. Основываясь на кратком объяснении выше,
Какой из следующих фрагментов вы считаете более привлекательным?
Какой из следующих фрагментов вы считаете более привлекательным? Первый с скучным названием или другой с хорошими иконками? Конечно, вам больше нравится второй. Это потому, что изображение коррелирует все лучше, чем простые слова. Объединение названий с иконками и структурирование данных в Инструментах Google для веб-мастеров может значительно улучшить ваш
Какие факторы рейтинга становятся более важными?
Какие факторы рейтинга становятся более важными? Rankbrain - новейшая разработка в определении наиболее важных факторов в рейтинге Google в поисковых системах. Какие факторы рейтинга становятся менее важными? По Бэклинко главный фактор ранжирования, который становится все менее важным, - это размещение точного ключевого слова в теге заголовка страницы. Считаете ли вы, что вы должны иметь
При создании контента для веб-сайта отеля, вы обычно используете эти слова "длинный хвост" или вы концентрируетесь на более общих ключевых словах с высоким уровнем поиска?
При создании контента для веб-сайта отеля, вы обычно используете эти слова "длинный хвост" или вы концентрируетесь на более общих ключевых словах с высоким уровнем поиска? Я надеюсь, что этот пост побудил вас сделать еще один шаг в исследовании ключевых слов к этим ключевым словам, и вы получите отличные результаты .... И я жду ваших комментариев.

О чем это все?
Вы знали?
Я начну с аналитических инструментов, потому что в конце концов вам нужно знать, что происходит с нашим сайтом, чтобы наметить дальнейшие действия, верно?
И какой хостинг мы должны использовать для более мощных сайтов или с большим количеством посещений, то есть для более профессиональных сайтов?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены?
Что вещи, которые действительно не должны занимать ранжирование, занимают верхние позиции, а вещи, которые должны быть там, вообще не включены?
Директивы, такие как канонический URL, метароботы - разрешено ли отслеживание этой страницы и ее ссылок?
Директивы, такие как канонический URL, метароботы - разрешено ли отслеживание этой страницы и ее ссылок?