Так собі SEO: як банки, агрегатори квитків і сайти відомств порушують закон про зберігання персональних даних
У 2011 році SEO-спеціаліст і експерт по пошуковим системам в Rush Agency Павло Медведєв за допомогою пошукових систем дізнався, що невеликі інтернет-магазини зливають особисті дані росіян, включаючи паспортні дані.
Витоку Google.Docs, PowerBi - це все фігня. Запит для пошуку кошиків сексшоп 2011го року який по всіх новин прогримів все ще працює. :) 2011й рік, Карл, ще не пофіксити!
Posted by Pavel Medvedev on Thursday, July 12, 2018
Через сім років, на тлі галасу індексації Яндексом документів Google Docs , Він вирішив повторити запит. І, як з'ясувалося, ситуація тільки погіршилася. В ряду з невеликими інтернет-магазинами виявилися «Ощадбанку», ВТБ, сайти департаментів мерії Москви, а також агрегаторів квитків:
Роздруківки квитків з travel.vtb.ru
Проблемні місця виявилися і у «Ощадбанку»:
Дані транзакцій «Ощадбанку»
А на сайтах департаментів мерії Москви взагалі можна знайти скани документів:
Всі ці сайти порушують Федеральний закон «Про персональні дані» .
Хто винен?
Проблема, на думку Медведєва, не лежить на комусь одному.
Я вважаю, це пов'язано з тим, що через кризу багато хороші фахівці і розробники переорієнтувалися на Захід, і якість кадрів в ІТ знизилося.
Павло Медведєв
Експерт з пошуковим системам в Rush Agency
Його слова підтверджує те, що у вказаних сайтів в кореневому каталозі відсутній robots.txt. Цей файл дає команду пошуковим системам, які сторінки індексувати.
80% провини на слив даних Медведєв покладає на власників сайтів:
Більшість сайтів до доопрацювання SEO-фахівцями виглядають жалюгідно, власники немов живуть в паралельному світі без кіберзагроз, без пошукових систем, ботів, які можуть проіндексувати особисті дані користувачів.
Павло Медведєв
Експерт з пошуковим системам в Rush Agency
На пошукових системах залишилася вина. Справа в тому, що вони погано інформують користувачів про механізми ранжирування та індексації.
Часто стикаєшся з нерозумінням від розробників сайтів: «Як же пошукові системи проїндексируют сторінку, адже у них немає посилання цієї сторінки?». Такі ж питання часто чую навіть від фахівців з SEO.
Павло Медведєв
Експерт з пошуковим системам в Rush Agency
Яким чином відбувається індексація?
Передбачається, що пошукові системи не будуть індексувати сторінки, доступні тільки по авторизації. Але для зручності користувачів для певних сторінок підбираються url-адреси, що складаються з рандомних набору символів.
Медведєв наводить як приклад сайт.ру / перевірити-статус-мого-замовлення / orjY4mGPRjk5boDnW0uvlrrd71vZw9kphf8eGbhlTpS4q9cvHzFNngSdNNIG8H5Lt3. За його словами, на підбір всіх цих символів буде потрібно приблизно 2, e + 100 років. передбачуване велике стиснення Всесвіту відбудеться раніше.
І подібні посилання відправляються на електронні адреси користувачів. Вони копіюють ці посилання і цілком можуть кинути їх на забутий богом форум, де тусується кілька людей з близького кола. І ось таким чином ця посилання потрапляє під індексацію.
Але є й інші методи. Наприклад, адміністратори сайту користуються «Яндекс.Метрика». За замовчуванням в її настройках вказана індексація всіх сторінок:
Але навіть якщо встановити заборону, є інші варіанти, як посилання може бути проіндексована.
Встановлюючи браузери, ви даєте угоду на обробку анонімних даних веб-перегляду.
Також ви можете відкрити посилання через браузер на смартфоні і забути про неї. Тут вже її проіндексувати можуть і браузер, і метрика, і сторонній софт, що збирає знеособлені дані.
Як захистити особисті дані користувачів?
- Закривати дані авторизацією;
- Забороняти роботам індексувати сторінки з персональною інформацією, використовуючи robot.txt, clean-param і meta-noindex;
- Налаштувати методи захисту під всі відомі пошукові системи (навіть «Супутник»);
- Блокувати доступ роботам, віддаючи серверів відповідь типу 4xx;
- Консультуватися з SEO-фахівцями.
Я чесний громадянин, мені нема чого приховувати!
Коли на ваше ім'я візьмуть кредит або переоформлять куплений вами квиток до Таїланду на інше число і на інше ім'я, тоді і стане зрозуміло, що приховувати вам є що.
реакція
Павло Медведєв звернув увагу на проблему 12 липня. На момент написання цього тексту ніяка з названих організацій ніяк не відреагувала.
Хто винен?Яким чином відбувається індексація?
Як захистити особисті дані користувачів?
Хто винен?
Часто стикаєшся з нерозумінням від розробників сайтів: «Як же пошукові системи проїндексируют сторінку, адже у них немає посилання цієї сторінки?
Як захистити особисті дані користувачів?