Так собі SEO: як банки, агрегатори квитків і сайти відомств порушують закон про зберігання персональних даних

  1. Хто винен?
  2. Яким чином відбувається індексація?
  3. Як захистити особисті дані користувачів?
  4. реакція

У 2011 році SEO-спеціаліст і експерт по пошуковим системам в Rush Agency Павло Медведєв за допомогою пошукових систем дізнався, що невеликі інтернет-магазини зливають особисті дані росіян, включаючи паспортні дані.

Витоку Google.Docs, PowerBi - це все фігня. Запит для пошуку кошиків сексшоп 2011го року який по всіх новин прогримів все ще працює. :) 2011й рік, Карл, ще не пофіксити!

Posted by Pavel Medvedev on Thursday, July 12, 2018

Через сім років, на тлі галасу індексації Яндексом документів Google Docs , Він вирішив повторити запит. І, як з'ясувалося, ситуація тільки погіршилася. В ряду з невеликими інтернет-магазинами виявилися «Ощадбанку», ВТБ, сайти департаментів мерії Москви, а також агрегаторів квитків:

В ряду з невеликими інтернет-магазинами виявилися «Ощадбанку», ВТБ, сайти департаментів мерії Москви, а також агрегаторів квитків:

Роздруківки квитків з travel.vtb.ru

Проблемні місця виявилися і у «Ощадбанку»:

Дані транзакцій «Ощадбанку»

А на сайтах департаментів мерії Москви взагалі можна знайти скани документів:

Всі ці сайти порушують Федеральний закон «Про персональні дані» .

Хто винен?

Проблема, на думку Медведєва, не лежить на комусь одному.

Я вважаю, це пов'язано з тим, що через кризу багато хороші фахівці і розробники переорієнтувалися на Захід, і якість кадрів в ІТ знизилося.

Павло Медведєв

Експерт з пошуковим системам в Rush Agency

Його слова підтверджує те, що у вказаних сайтів в кореневому каталозі відсутній robots.txt. Цей файл дає команду пошуковим системам, які сторінки індексувати.

80% провини на слив даних Медведєв покладає на власників сайтів:

Більшість сайтів до доопрацювання SEO-фахівцями виглядають жалюгідно, власники немов живуть в паралельному світі без кіберзагроз, без пошукових систем, ботів, які можуть проіндексувати особисті дані користувачів.

Павло Медведєв

Експерт з пошуковим системам в Rush Agency

Експерт з пошуковим системам в Rush Agency

На пошукових системах залишилася вина. Справа в тому, що вони погано інформують користувачів про механізми ранжирування та індексації.

Часто стикаєшся з нерозумінням від розробників сайтів: «Як же пошукові системи проїндексируют сторінку, адже у них немає посилання цієї сторінки?». Такі ж питання часто чую навіть від фахівців з SEO.

Павло Медведєв

Експерт з пошуковим системам в Rush Agency

Яким чином відбувається індексація?

Передбачається, що пошукові системи не будуть індексувати сторінки, доступні тільки по авторизації. Але для зручності користувачів для певних сторінок підбираються url-адреси, що складаються з рандомних набору символів.

Медведєв наводить як приклад сайт.ру / перевірити-статус-мого-замовлення / orjY4mGPRjk5boDnW0uvlrrd71vZw9kphf8eGbhlTpS4q9cvHzFNngSdNNIG8H5Lt3. За його словами, на підбір всіх цих символів буде потрібно приблизно 2, e + 100 років. передбачуване велике стиснення Всесвіту відбудеться раніше.

І подібні посилання відправляються на електронні адреси користувачів. Вони копіюють ці посилання і цілком можуть кинути їх на забутий богом форум, де тусується кілька людей з близького кола. І ось таким чином ця посилання потрапляє під індексацію.

Але є й інші методи. Наприклад, адміністратори сайту користуються «Яндекс.Метрика». За замовчуванням в її настройках вказана індексація всіх сторінок:

Але навіть якщо встановити заборону, є інші варіанти, як посилання може бути проіндексована.

Встановлюючи браузери, ви даєте угоду на обробку анонімних даних веб-перегляду.

Також ви можете відкрити посилання через браузер на смартфоні і забути про неї. Тут вже її проіндексувати можуть і браузер, і метрика, і сторонній софт, що збирає знеособлені дані.

Як захистити особисті дані користувачів?

  • Закривати дані авторизацією;
  • Забороняти роботам індексувати сторінки з персональною інформацією, використовуючи robot.txt, clean-param і meta-noindex;
  • Налаштувати методи захисту під всі відомі пошукові системи (навіть «Супутник»);
  • Блокувати доступ роботам, віддаючи серверів відповідь типу 4xx;
  • Консультуватися з SEO-фахівцями.

Я чесний громадянин, мені нема чого приховувати!

Коли на ваше ім'я візьмуть кредит або переоформлять куплений вами квиток до Таїланду на інше число і на інше ім'я, тоді і стане зрозуміло, що приховувати вам є що.

реакція

Павло Медведєв звернув увагу на проблему 12 липня. На момент написання цього тексту ніяка з названих організацій ніяк не відреагувала.

Хто винен?
Яким чином відбувається індексація?
Як захистити особисті дані користувачів?
Хто винен?
Часто стикаєшся з нерозумінням від розробників сайтів: «Як же пошукові системи проїндексируют сторінку, адже у них немає посилання цієї сторінки?
Як захистити особисті дані користувачів?