Добавить новость
Новости сегодня

Новости от TheMoneytizer

ШІ навчився деанонімізувати користувачів за коментарями в соціальних мережах

AI-інженер Саймон Лермен і його колеги представили роботу «Large-Scale Online Deanonymization with LLMs», в якій оцінили можливості LLM встановлювати особистість користувачів за анонімними постами на різних майданчиках. Експерименти проводилися на даних Hacker News, Reddit, LinkedIn, а також на знеособлених інтерв'ю з датасету Anthropic. Ідея не нова. Ще на початку 2000-х професор Гарварду Латанья Суїні дійшла висновку, що 87% населення США можна ідентифікувати лише за трьома параметрами: поштовим індексом, статтю та датою народження. Але на практиці деанонімізація довго залишалася трудомістким ручним процесом: дані розкидані, не структуровані, і зібрати з них портрет конкретної людини міг хіба що досвідчений аналітик.

LLM прискорюють і автоматизують цей процес, причому роблять це економічно ефективно, стверджують Лермен і його співавтори.

Як це працює

Спочатку модель витягує з коментарів користувача непрямі відомості. Потім за допомогою пошуку на основі ембеддінгів (векторних математичних «відбитків» тексту) формується пул із 100 найбільш ймовірних кандидатів, і на фінальному етапі LLM «розмірковує» і вибирає найкращий збіг.

Для перевірки в одному з тестів дослідники відібрали 338 користувачів Hacker News, чиї профілі містили посилання на LinkedIn. Після видалення прямих ідентифікаторів моделі пропонувалося відновити відповідність між анонімізованим акаунтом і реальною людиною. Модель дала правильну відповідь у 226 випадках із 338 (67%). При цьому точність склала 90% — тобто в тих випадках, коли система взагалі видавала результат, вона майже завжди виявлялася права.

В іншому експерименті історію одного облікового запису Reddit штучно ділили за часом і за тематичними спільнотами. Завданням моделі було «зшити» фрагменти назад. Комбінація ембеддінгів і логічного аналізу значно перевершила базові методи зіставлення за метаданими та активністю.

У міру збільшення пулу кандидатів до десятків тисяч точність знижувалася плавно, без обвалу. Автори екстраполювали результати на бази в 100 млн користувачів і дійшли висновку, що при достатніх обчислювальних потужностях вже можна «атакувати» великі платформи. А з розвитком LLM поріг входу буде тільки знижуватися.

У дослідженні наводиться і реальний кейс. На датасеті знеособлених інтерв'ю вчених модель змогла встановити особи 9 із 125 учасників. Але еталонних даних для даного завдання не було, і результати перевірялися вручну.

Весь експеримент обійшовся приблизно в $2000. Вартість деанонімізації одного профілю — від $1 до $4 (правда, це все в експериментальних умовах, в реальному житті цифра була б зовсім іншою).

Чому це важливо

Автори перераховують кілька сценаріїв зловживань. Уряди можуть використовувати технологію для переслідування журналістів і активістів, корпорації — для побудови надточних рекламних профілів, а зловмисники — для цільового фішингу та соціальної інженерії.

Проте в мережі нагадують, що деанонімізація за непрямими ознаками відома давно. Частина користувачів вказує на обмеженість експериментальних умов, а деякі зазначають, що LLM не створюють принципово нової загрози, а лише автоматизують вже існуючі методи.

Читайте на сайте


Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. Абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city
Музыкальные новости
Новости России
Экология в России и мире
Спорт в России и мире
Moscow.media






Топ новостей на этот час

Rss.plus





СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *