Трепет крошечных крыльев развязал колибри кажется, предвещает начало новой эры в том, как мы общаемся с поисковыми системами. Хотя идея семантической сети существует дольше, чем думает большинство людей, каждый год рождая новый патент или подход, который приближает нас к тому, чтобы предоставить поисковым системам хотя бы какое-то понимание концепций, с которыми им приходится иметь дело. Именно Колибри создал среду, в которой эти патенты и подходы могут раскрыть весь свой потенциал. Семантическая сеть и принципы, лежащие в ее основе, больше не являются просто эзотерическими понятиями, которые вы можете игнорировать, по крайней мере, если вы хотите утверждать, что понимаете работу поисковых систем.
Тем не менее, некоторые идеи семантической сети скрывались в тени ключевых слов, массового контента, гостевых блогов и других идолов прошлого так долго, что их неясность стала скорее чертой характера, чем временным состоянием. Они неуклонно растут, их поддерживают энтузиазм и усилия людей с достаточным предвидением и стремлением найти способы улучшить существующий подход к поиску, поэтому, если вы какое-то время игнорировали их развитие, вы можете быть немного ошеломлены тем, как Многое они прогрессировали за это время.
Основной движущей силой семантической паутины, которую мы надеемся когда-нибудь достичь, является переход от простого индексирования данных к тому, чтобы поисковые системы могли его максимально полно понять. Подход описан в боевом кличе семантических веб-апостолов - вещи, а не строки , где «вещи» обозначают объекты поиска (подробнее о них позже), в то время как термин «строки» относится к традиционному способу соединения данных через строки ссылок. ,
Хотя срочно необходимо, чтобы поисковые системы лучше понимали те понятия, которые они возвращают в качестве результатов, возможно, усилилось за счет увеличения использования голосового поиска на мобильных устройствах и типа запросов, используемых в таких обстоятельствах (напоминающих традиционные вопросы, которые вы задали бы для человека более, чем запросы старой школы с парой ключевых слов, измененных для определения местоположения или других факторов), эта проблема - лишь капля в океане великолепия, который является семантической сетью. Такой подход к структурированию и извлечению данных обеспечивает лучший, более полный поиск, который включает в себя гораздо больше, чем просто поиск правильного ключевого слова в индексе.
Чтобы лучше понять, как это работает, вы должны понимать разницу между явными и неявными сигналами. Это сигналы, которые анализирует поисковая система, пытаясь ответить на ваш запрос. Ключевые слова и другой прямой ввод от поисковика являются явными сигналами, в то время как термин неявные сигналы относится к контексту поиска. Это включает в себя все, начиная с момента, когда был выполнен поиск, ваше текущее местоположение и ваши предыдущие поиски, до всего остального, что поисковая система может узнать о ваших привычках поиска и текущей ситуации.
Со временем поисковые системы получили доступ к растущему числу этих неявных сигналов, в результате чего они могли предлагать более релевантные предложения для ваших запросов. Желание предоставить им еще больше этих сигналов привело к разработке структурированных данных и семантической разметки, однако, прежде чем мы углубимся в это, мы должны сначала взглянуть на базовую единицу семантической сети - поисковый объект.
Когда-то у вас были ключевые слова и домены, на которых их можно было найти. Чем авторитетнее и уважаемее домен, тем больше шансов, что он появится в результате вашего запроса. Хотя эта система была лучшей из того, что мы могли сделать в то время, любой, кто хотя бы немного интересовался SEO был более чем осведомлен о его многочисленных недостатках. Семантическая сеть пытается покончить с ключевыми словами в качестве основных единиц поиска и заменить их поисковыми объектами.
Объектом поиска может быть что угодно, от местоположения или человека до школы мысли. Колибри, граф знаний и многие другие факторы, влияющие на нынешний ландшафт всемирной паутины, опираются на сбор и структурирование знаний об этих объектах, рассматривая их как единое целое, а не только как то, что может иметь отношение к ключевым словам, в которые вы ввели панель поиска. База поисковых объектов постоянно расширяется, каждый из которых имеет уникальный идентификатор и является уникальным семантическим объектом.
Это позволяет поисковым системам лучше понять контекст вашего поиска и получать более качественные, релевантные и полные результаты. Вот почему, если вы хотите повысить свою видимость в новой системе, вам необходимо быть признанным как субъект. Забудьте о упоминании ключевых слов или синонимов и надеясь, что это само по себе сделает вас более актуальным, вам нужно подумать немного больше, чем это.
Существует множество способов заявить о себе как об объекте, лучший из которых - превосходство в том, что ты делаешь, то есть признание людьми до того, как тебя узнают поисковые системы. Со всеми сигналами, которые учитывают их алгоритмы, они могут получить довольно четкое представление о том, что вы все из себя представляете, например, ваши социальные действия, по крайней мере, так же показательны, как ключевые слова на вашей домашней странице. Однако вместо того, чтобы пытаться манипулировать поисковыми системами, чтобы увидеть вас под определенным углом и в определенном свете, вы можете просто сказать им, что вы делаете, структурируя свои данные с помощью семантической разметки.
В темные века Интернета куски неструктурированных данных кружились в пустоте безразличия, лишь изредка вырываясь из хаоса и забвения, когда кто-то печатал их симулякр в строке поиска. После осмотра они были возвращены в небытие, чтобы бродить до следующего призыва. Но свет порядка пришел, то, что было ключевым словом, стало сущностью, и вместо того, чтобы быть просто суммой их букв, они стали понятиями и идеями, каждым развивающимся персонажем, личными чертами и множеством модификаций, которые делали их особенными. Данные были классифицированы, разработаны и даны сущность.
Структурирование данных позволило поисковым системам понять, что они не должны возвращать тот же результат для слова «кошки» кому-то, чья история поиска проявляет интерес к театру, так же, как и кому-то, кто часто ищет «самый дешевый корм для кошек». Структурирование данных позволяет нам уточнить роль и тип данных, поэтому они легко распознаются поисковой системой и возвращаются при необходимости. Это достигается с помощью семантической разметки.
Проще говоря, семантическая разметка позволяет вам изменять ваши данные с помощью метаданных (информации об информации), чтобы их свойства и значение, стоящие за ними, были понятны для поисковых систем. Используемый язык легко понимается машинами и легко реализуется веб-разработчиками, которые хотят структурировать свои данные.
Этот вид структурирования зависит от ряда вещей, словарного запаса, формата разметки или синтаксиса, а также от троек, поэтому давайте попробуем объяснить каждый из них.
Тройки - это наборы данных, организованные в соответствии с их ролью в конкретном случае. Они основаны на семантических понятиях субъекта, глагола и объекта. Субъект и объект - это разные поисковые объекты, а глагол - это связь между ними, их взаимодействие и, в основном, объяснение их связи друг с другом. Огромные наборы троек хранятся в триплетах, и их можно легко найти, когда появится запрос.
Важность троек заключается в том, что они позволяют поисковым системам подбирать контекст из нашего поиска, разумным образом связывать уже сформированные поисковые объекты, понимать их взаимодействие и возвращать соответствующий результат.
Как и в языке, словарь в семантическом поиске обозначает набор произвольных символов, предназначенных для представления определенных понятий. Schema.org предоставляет нам огромный словарь для структурирования данных, и, поскольку он был принят крупными поисковыми системами, он стал стандартным средством структурирования ваших данных.
Хотя это принятие единого синтаксиса наложило некоторые ограничения, оно также позволило стандартизировать структурирование данных, что необходимо для продолжения работы над семантической сетью. Естественно, есть еще другие, более специфические словари, используемые для структурирования различных типов данных, но лучше всего делать это с Schema, если у вас есть такая возможность.
Синтаксис относится к языку, используемому для разметки наших данных. Это включает микроданные, микроформаты и RDF (структура определения ресурса). Каждый из этих подходов имеет свои достоинства и недостатки, при этом RDF является наиболее расширяемым и полагается на атрибуты для уточнения сущности; микроформаты, используемые для тематической атрибуции HTML / XHTML, и микроданные, представляющие собой набор спецификаций, которые позволяют добавлять семантические модификаторы в код страницы.
Схема решила сосредоточиться на микроданных, поскольку она обеспечивает достаточную широту и объемность, и, в отличие от микроформатов, не имеет тенденции мешать CSS-атрибутам страницы. Естественно, эта стандартизация и фокусировка на одном языке не очень подходили тем, кто использовал другой синтаксис для маркировки своих данных, но, к счастью, все еще поддерживаются другие языки, хотя настоятельно рекомендуется использовать микроданные только в будущем. , Даже если некоторые ваши страницы уже содержат некоторые другие языки, если вы не используете два или более типов синтаксиса на одной странице, вы сможете избежать любых конфликтов.
Теперь, когда вы (надеюсь) немного лучше знакомы с некоторыми основными терминами, давайте попробуем взглянуть на то, как все это работает.
При создании веб-страницы вы стараетесь дать как можно больше подсказок о ваших данных с помощью микроданных или альтернативного синтаксиса. Если вы публикуете рецепт, вы будете обозначать его так, чтобы он отображался в богатых фрагментах; если вы пишете о музыке, вы найдете в словаре Schema.org соответствующий знаменатель и примените их соответствующим образом, и так далее. Делая это, вы предоставляете поисковым системам дополнительный контекст, который они могут использовать, чтобы лучше понять, о чем ваши данные и с какими объектами они имеют дело.
Когда кто-то вводит запрос, кроме поиска других контекстных подсказок, поисковые системы учитывают предоставленные вами триплеты и метаданные, и на основе этого ввода они могут сузить область действия сущностей, в которых они заинтересованы, и вернуть соответствующий результат. Это не только вопрос удобства, но и подход, который позволяет осуществлять более полный, эффективный сбор, хранение и поиск данных с возможностью поиска.
Естественно, что поскольку мы дошли до разработки семантической паутины, нас все еще ждет много проблем.
Например, хотя определение сущностей как таковых делает их более универсальными, чем когда-либо были простые ключевые слова, попытка расширить конкретный словарь на другие языки (разговорные языки, а не веб-синтаксис) является одной из проблем, с которыми мы сталкиваемся. Это означает, что хотя сущность на одном языке - это то же самое на другом языке, помочь поисковым системам распознать ее как таковую на самом деле не так просто. Эта проблема достаточно четко выражена на самом базовом, лексическом уровне, если учесть тот факт, что одно слово языка может быть переведено несколькими разными словами другого языка на основе контекста, стиля, формата и ряда других влияний, но когда вы вводите идиомы и вводите фразы в уравнение, все снова превращается в хаос.
Однако, даже если мы сталкиваемся с некоторыми препятствиями, которые кажутся непреодолимыми (например, объясняя тонкости стиля для машин), мы должны быть воодушевлены тем фактом, что мы уже продвинулись дальше, чем кто-либо мог предположить, всего пару лет назад, и что исследования в семантической сети только набирают обороты с каждым днем. По мере того как собирается больше данных, исследуются новые способы структурирования, совершенствуются наши привычки и знания, эта область исследований, похоже, обещает совершенно иной опыт, когда речь идет о способе поиска и результатах, которые нам дают.
Copyleft © 2017 . www.info-center.od.ua Информационный центр - Всегда в центре событий