Як змагацца з памылкамі сканавання ў Google Search Console (Webmaster Tools)

  1. змест
  2. Не панікуйце!
  3. Па-першае, адзначце ўсе памылкі сканавання, як фіксаванай
  4. Праверце вашыя памылкі сканавання паведаміць адзін раз у тыдзень
  5. Класічная памылка 404 поўзаць
  6. 404 памылкі, выкліканыя няспраўных спасылак з іншых сайтаў
  7. 404 памылкі, выкліканыя няспраўных ўнутраных спасылак або карта сайта запісаў
  8. 404 памылкі, выкліканыя Google поўзаць JavaScript і песціцца яго 😉
  9. Таямніца памылкі 404
  10. Што такое «Soft 404» памылкі?
  11. Што рабіць з 500 памылкі сервера?
  12. Іншыя памылкі сканавання: 400, 503 і г.д.
  13. Спіс усіх памылак сканавання я сутыкнуўся ў «рэальным жыцці»
  14. Crawl пікавай памылкі пасля міграцыі вэб-сайта
  15. рэзюмэ

Мае гэта здарылася з вамі? Вы правяраеце «Памылкі сканавання» справаздачы ў Google Search Console (раней вядомы як для вэб - майстроў) , і вы ўбачыце так шмат памылак сканавання , што вы не ведаеце , з чаго пачаць. Грузы, 500s 404 - х, «мяккія», 404 - 400s, і многае іншае ... Вось як я маю справу з вялікімі аб'ёмамі памылак сканавання.

Заўвага: Гэта кіраўніцтва было ўпершыню апублікавана на rebelytics.com ў 2015 годзе і з таго часу быў абноўлены некалькі разоў і пераехаў у гэты блог.

Калі вы не можаце знайсці рашэнне вашай праблемы ў гэтым артыкуле, ня саромейцеся пакінуць мне каментар у у ніжняй частцы гэтай старонкі , Я звычайна адказ на працягу некалькіх дзён.

змест

Вось кароткі агляд таго, што вы знойдзеце ў гэтым артыкуле:

Такім чынам, давайце пачнем. Перш за ўсё:

Не панікуйце!

Памылкі сканавання з'яўляюцца тое, што вы звычайна не могуць пазбегнуць, і яны не абавязкова маюць непасрэднае негатыўны ўплыў на прадукцыйнасць SEO. Тым не менш, яны з'яўляюцца праблемай, вы павінны вырашаць. Маючы нізкую колькасць памылак сканавання ў Search Console з'яўляецца пазітыўным сігналам для Google, так як яна адлюстроўвае добрае агульны стан здароўя сайта. Акрамя таго, калі бот Google сустракае менш памылак сканавання на старонцы, карыстальнікі, менш верагодна, каб убачыць сайт і сервера памылак.

Па-першае, адзначце ўсе памылкі сканавання, як фіксаванай

Гэта можа здацца дурной кавалак саветаў на першым, але гэта сапраўды дапаможа вам вырашыць вашы памылкі пры сканаванні ў больш структураваным выглядзе. Пры першым поглядзе на справаздачы пра памылкі сканавання, вы можаце ўбачыць сотні і тысячы памылак сканавання з шляху назад, калі. Гэта будзе вельмі цяжка для вас, каб знайсці свой шлях праз гэтыя доўгія спісы памылак.

Гэта будзе вельмі цяжка для вас, каб знайсці свой шлях праз гэтыя доўгія спісы памылак

Ці робіць гэта скрыншот Вы адчуваеце сябе лепш? Іду ў заклад, што ты лепш, чым гэта вэбмайстар 😉


Мой падыход пазначыць усе як фіксаванай, а затым пачаць з лому: Непатрэбныя Памылкі сканавання не будуць адлюстроўвацца зноў і тыя, якія сапраўды маюць патрэбу ў фіксацыі ў хуткім часе вярнуцца ў справаздачу. Такім чынам, пасля таго як вы ачысцілі сваю справаздачу, вось як паступіць:

Праверце вашыя памылкі сканавання паведаміць адзін раз у тыдзень

Абярыце фіксаваны дзень кожны тыдзень і перайсці да справаздачы пра памылкі сканавання. Цяпер вы знойдзеце кіраванае колькасць памылак сканавання. Паколькі яны не былі там тыдзень раней, вы будзеце ведаць, што яны ў апошні час сутыкнуліся з ботам Google. Вось як змагацца з тым, што вы знойдзеце ў вашых памылках сканавання паведаміць адзін раз у тыдзень:

Класічная памылка 404 поўзаць

Гэта, верагодна, самая распаўсюджаная памылка поўзаць праз вэб-сайтаў, а таксама лягчэй за ўсё выправіць. Для кожных 404 памылак у бот сустрэчах Google, Google дазваляе даведацца, дзе ён звязаны з: іншы сайт, іншы URL на вашым сайце, ці вашы Sitemaps. Проста націсніце на памылкі сканавання ў справаздачы і ў лайтбокс, як гэта будзе адкрыць:

Звярніце ўвагу, што інфармацыя ў раздзеле «Звязаныя з» ўкладкі не заўсёды актуальнай. Ён можа ўтрымліваць URL-адрасы, якія больш не існуюць ці якія не ўтрымліваюць спасылак на URL памылкі больш. Гэта адбываецца таму , што ў гэтай ўкладцы, Google дазваляе нам ведаць , дзе ён знайшоў URL памылкі, не там , дзе ён у цяперашні час звязаны (як імя можа прапанаваць).

Ці ведаеце вы , што вы можаце загрузіць справаздачу з усімі сваімі памылкамі сканавання і дзе яны звязаны з? Такім чынам , вы не павінны правяраць кожную памылку сканавання ўручную. правяраць гэтая спасылка да API Google даследчыка. Большасць палёў ўжо папярэдне запоўненыя, таму ўсе , што вам трэба зрабіць , гэта дадаць свой адрас вэб - сайта (дакладны адрас аб'екта нерухомасці Search Console вы маеце справу з) і націсніце кнопку «аўтарызаваныя і выканаць». Дайце мне ведаць , калі ў вас ёсць якія - небудзь пытанні па гэтай нагоды!

Зараз давайце паглядзім, што вы можаце зрабіць аб розных тыпах памылак 404.

404 памылкі, выкліканыя няспраўных спасылак з іншых сайтаў

Калі ілжывы URL звязаны з іншага сайта, вы павінны проста ўстанавіць пераадрасацыю 301 ад фальшывага URL да правільнай мэты. Вы можаце быць у стане звярнуцца да вэб-майстру якая спасылаецца старонкі, каб задаць для карэкціроўкі, але ў большасці выпадкаў гэта не будзе каштаваць выдаткаваных высілкаў.

404 памылкі, выкліканыя няспраўных ўнутраных спасылак або карта сайта запісаў

Калі ілжывы URL, які выклікаў памылку 404 для бота Google звязаны з адной з вашых старонак або з картай сайта, вы павінны выправіць спасылку або запіс карты сайта. У дадзеным выпадку гэта таксама добрая ідэя 301 перанакіраваць 404 URL да патрэбнага месца прызначэння, каб зрабіць яго знікнуць з індэкса Google і перадаць уладу сувязі ён можа мець.

404 памылкі, выкліканыя Google поўзаць JavaScript і песціцца яго 😉

Часам вы сутыкнецеся з фантастычнымі 404 памылак, якія, на думку Google Search Console, некалькі або ўсе старонкі спасылаюцца на. Пры пошуку спасылак у зыходным кодзе, вы ўбачыце, што яны на самой справе адносныя URL-адрасы, якія ўключаны ў сцэнарах, як гэты (проста выпадковы прыклад я бачыў у адным са сваіх уласцівасцяў Google Search Console):

Па словах Google, гэта не праблема наогул, і гэты тып памылкі 404 можа быць проста праігнараваныя. Прачытайце пункт 3) гэты пост Google Джон Мюлер для атрымання дадатковай інфармацыі (а таксама астатняй частцы гэтага, так як гэта вельмі карысна):

Таямніца памылкі 404

У некаторых выпадках крыніца спасылкі застаецца загадкай. Дадзеныя, якія Google падае ў справаздачах пра памылкі сканавання не заўсёды 100% надзейным. Напрыклад, інфармацыя ў раздзеле «Звязаныя з» ўкладак не заўсёды актуальным і можа ўтрымліваць URL-адрас, якія не існавалі ўжо на працягу многіх гадоў ці не ўтрымліваюць спасылкі на URL, памылак больш. У такіх выпадках, вы можаце наладзіць пераадрасаванне 301 для фальшывага URL.

Не забывайце заўсёды адзначаць усе памылкі 404 абыходаў, што вы паклапаціліся аб тым, як фіксуюцца ў справаздачы пра памылку поўзаць. Калі ёсць памылкі 404 поўзаць, што вы не ведаеце, што рабіць, вы можаце пазначыць іх як фіксаваныя і сабраць іх у «спіс таямніцы». У выпадку, калі яны працягваюць з'яўляцца зноў, вы ведаеце, вы павінны капаць глыбей у праблему. Калі яны не з'яўляюцца зноў, тым лепш.

Калі ў вас ёсць выпадак таямніца 404 памылак, не саромейцеся пакінуць мне каментар у канцы гэтага артыкула. Я буду шчаслівы, каб праверыць вашу праблему.

Давайце паглядзім на дзіўных відах «Soft 404 памылак» у цяперашні час.

Што такое «Soft 404» памылкі?

Гэта тое, што Google прыдумаў, ці не так? Прынамсі, я ніколі не чуў пра памылкі «Soft 404» у любым іншым месцы. А «Soft 404» памылка пустая старонка, на якой бот Google сутыкнуўся, што вярнуў код статусу 200.

Так што гэта ў асноўным старонка, Google ЛІЧЫЦЬ павінен быць 404 старонкі, але гэта не так. У 2014 годзе, вэб-майстры пачалі атрымліваць «Soft 404» памылкі для некаторых з іх рэальных старонак. Гэта шлях ад Google, каб дазволіць нам ведаць, што ў нас ёсць «тонкае ўтрыманне» на нашых старонках.

Праца з «Soft 404» памылак так жа проста, як справа з нармальнымі 404 памылак:

  • Калі URL у «Soft 404» памылкі не павінен існаваць, 301 перанакіраваць яго на існуючую старонку. Таксама пераканайцеся, што вы вырашыць праблему неіснуючых URL, не аддаючы належнага код памылкі 404.
  • Калі URL у «Soft 404» з'яўляецца адным з вашых рэальных змястоўных старонак, гэта азначае, што Google разглядае яго як «тонкае змест». У гэтым выпадку, пераканайцеся, што вы дадалі каштоўны кантэнт для вашага сайта.

Пасля працы праз вашы «Soft 404» памылак, не забудзьцеся пазначыць іх як фіксаваныя. Далей, давайце паглядзім на лютых відах 500 памылак сервера.

Што рабіць з 500 памылкі сервера?

500 памылкі сервера, верагодна, адзіны тып памылак сканавання вы павінны быць трохі занепакоены. Калі бот Google сустракае памылку сервера на старонцы рэгулярна, гэта вельмі моцны сігнал для Google нешта не так з вашай старонкай, і гэта ў канчатковым выніку прывядзе да горшага рэйтынгу.

Гэты тып памылкі сканавання можа з'явіцца па розных прычынах. Часам гэта можа быць пэўны субдомен, каталог або пашырэнне файла, які выклікае ваш сервер, каб вярнуць код 500 стану замест старонкі. Ваш вэб-сайт распрацоўніка зможа гэта выправіць, калі вы дашле яму ці ёй спіс апошніх 500 памылак сервера з Інструментаў для вэб-майстроў Google.

Часам 500 памылкі сервера адлюстроўваюцца ў Search Console Google, з-за часовай праблемы. Сервер можа быць на некаторы час з-за тэхнічнае абслугоўванне, перагрузкі, або форс-мажорныя абставіны. Гэта, як правіла, тое, што вы зможаце даведацца, правяраючы файлы часопісаў і казаць сваім распрацоўшчыкам і вэб-хостынгу. У такім выпадку, як гэта вы павінны паспрабаваць, каб пераканацца, што такая праблема не ўзнікае зноў у будучыні.

Звярніце ўвагу на памылкі сервера, якія з'яўляюцца ў вашым Google Webmaster Tools, і паспрабаваць абмежаваць іх з'яўленне як мага больш. Робат Google заўсёды павінен быць у стане атрымаць доступ да старонак без якіх-небудзь тэхнічных бар'ераў.

Давайце паглядзім на некаторыя іншыя памылкі сканавання вы можаце натрапіць на ў вашых інструментах Google для вэб-майстроў.

Іншыя памылкі сканавання: 400, 503 і г.д.

Мы мелі справу з найбольш важнымі і распаўсюджанымі памылкамі сканавання ў гэтым артыкуле: 404, «Soft 404» і 500. Пасля таго, як у той час, вы можаце знайсці іншыя тыпы памылак сканавання, як 400, 503, «Доступ забаронены», «Няспраўнасць перанакіроўвае »(для смартфонаў), і гэтак далей.

У многіх выпадках, Google дае некаторыя тлумачэння і ідэі пра тое, як мець справу з рознымі тыпамі памылак.

Увогуле, гэта добрая ідэя, каб мець справу з кожным тыпам памылкі сканавання вы знойдзеце і паспрабаваць пазбегнуць яго паказ зноў у будучыні. Чым менш памылак поўзаць бот Сутыкненні Google, тым больш Google давярае вашаму здароўю сайт. Старонкі, якія пастаянна выклікаюць памылкі сканавання будуць разглядацца таксама забяспечыць дрэнны карыстацкі вопыт і будуць ранжыраваць ніжэй, чым у здаровых сайты.

Вы знойдзеце больш падрабязную інфармацыю аб розных тыпах памылак сканавання ў наступнай частцы гэтага артыкула:

Спіс усіх памылак сканавання я сутыкнуўся ў «рэальным жыцці»

Я думаў, што гэта можа быць цікава ўключаць пералік усіх тыпаў памылак сканавання я сапраўды бачыў ва ўласцівасцях Google Search Console я працаваў. У мяне няма шмат інфармацыі на ўсіх з іх (за выключэннем тых, разгледжаных вышэй, за выключэннем), але тут мы ідзем:

Памылка сервера (500)
У гэтай справаздачы, Google пералічвае URL-адрас, які вяртае памылку 500, калі бот Google спрабаваў прасканаваць старонку. глядзець вышэй для больш падрабязнай інфармацыі.

мяккая 404
Гэтыя URL-адрасы, якія вяртаюцца код статусу 200, але павінен быць вяртаюць памылку 400, у адпаведнасці з Google. Я прапанаваў некалькі варыянтаў вырашэння гэтага вышэй ,

Доступ забаронены (403)
Тут Google пералічаныя ўсе URL-адрасы, вяртае памылку 403, калі бот Google спрабаваў прасканаваць іх. Пераканайцеся, што вы не спасылаюцца на URL, якія патрабуюць праверкі сапраўднасці. Вы можаце ігнараваць «Доступ забаронены» памылкі для старонак, якія вы ўключылі ў свой файл robots.txt, таму што вы не хочаце Google для доступу да іх. Гэта можа быць добрай ідэяй, хоць выкарыстоўваць NoFollow спасылкі, калі вы спасылаецеся на гэтых старонках, так што Google не спрабуе сканаваць іх зноў і зноў.

Не знойдзена (404/410)
«Не знойдзена» класічны 404 памылка, якая абмяркоўвалася вышэй , Чытаць каментары за цікавую інфармацыю пра 404 і 410 памылак.

Не было потым (301)
Памылка «не было» ставіцца да URL-адрасах, якія перанакіроўваюць на іншы URL, але рэдырэкт не працуе. Замацаваць гэтыя пераадрасоўвае!

Іншае (400/405 / 406)
Тут групы Google ўсё гэта не мае імя: Я бачыў 400, 405 і 406 памылкі ў гэтым дакладзе, і Google кажа, што яна не можа сканаваць URL-адрасы «з-за неўсталяваны пытанне». Я прапаную вам разгледзець гэтыя памылкі гэтак жа, як вы б ставіцца да нармальных 404 памылкі ,

Змест Flash (смартфон)
У гэтай справаздачы проста пералічваюцца старонкі з вялікай колькасцю кантэнту ўспышкі, што не будзе працаваць на большасці смартфонаў. Пазбаўцеся ад ўспышкі!

Заблякаваныя (смартфон)
Гэтая памылка адносіцца да старонак, якія могуць быць даступныя ботам Google, але былі заблакаваныя для мабільнага робата Google у файле robots.txt. Пераканайцеся, што вы дазваляеце ўсе ботаў Google для доступу да змесціва індэксавання!

Калі ласка , дайце мне ведаць , калі ў вас ёсць якія - небудзь пытанні ці дадатковая інфармацыя пра памылкі сканавання , названых вышэй , або іншых тыпаў памылак сканавання.

Crawl пікавай памылкі пасля міграцыі вэб-сайта

Вы можаце чакаць піку ў вашых памылках сканавання пасля міграцыі вэб-сайта. Нават калі вы зрабілі ўсё, што ў вашых сілах падрыхтаваць міграцыю з пункту гледжання SEO , То вельмі верагодна, што бот Google будзе сутыкацца вялікая колькасць памылак 404 пасля паўторнага запуску.

Калі колькасць памылак сканавання ў вашым Google Webmaster Tools, падымаецца пасля міграцыі, няма неабходнасці панікаваць. Проста выконвайце інструкцыі, якія былі растлумачаны вышэй, і паспрабаваць выправіць столькі памылак сканавання, як можна на працягу некалькіх тыдняў пасля міграцыі.

рэзюмэ

  • Адзначыць усе памылкі сканавання фіксаванымі.
  • Вярніцеся ў справаздачу раз у тыдзень.
  • Выправіць памылкі 404, перанаправіўшы ілжывыя адрасы або змяніць вашы ўнутраныя спасылкі і запіс сайта.
  • Паспрабуйце, каб пазбегнуць памылак сервера і звярніцеся да распрацоўніку і хост-сервера для дапамогі.
  • Разабрацца з іншымі тыпамі памылак і выкарыстання рэсурсы кампаніі Google па дапамогу.
  • Чакаць пік у вашых памылках сканавання пасля вэб-міграцыі.

Калі ў вас ёсць якія-небудзь дадатковыя ідэі аб тым, як змагацца з памылкамі сканавання ў Google Webmaster Tools, я быў бы ўдзячны за вашыя каментары.

Што рабіць з 500 памылкі сервера?
Ці робіць гэта скрыншот Вы адчуваеце сябе лепш?
Што такое «Soft 404» памылкі?
Гэта тое, што Google прыдумаў, ці не так?
Што рабіць з 500 памылкі сервера?