Этика, приватность и борьба со злоупотреблениями

kirill_ir · Сообщение **kirill_ir** » 09 июн 2026, 09:16

Часть VI · ~11 ч · Сложность: (базовый)→(средний) · Пререквизиты: Модуль 11, 18

Обзор модуля

Предыдущие модули учили строить мощную поисковую машину: собирать поведенческие сигналы (Модуль 11), персонализировать выдачу (Модуль 18), ранжировать каскадом и собирать страницу. Но всякая мощность создаёт ответственность. Этот модуль — про оборотную сторону инженерии поиска: про то, какие данные о людях система имеет право собирать и сколько хранить, как её выдачей пытаются манипулировать (и как этому противостоять), что обязана раскрывать поисковая система регулятору и пользователю, и как не превратить обучаемое ранжирование в машину, тихо воспроизводящую и усиливающую несправедливость.

В сквозном конвейере «обход → индекс → факторы → ранжирование → выдача → постобработка → измерение» этот модуль — не отдельная стадия, а поперечный слой ограничений, пронизывающий все стадии. Сбор поведения (стадия измерения) ограничен приватностью. Признаки и обучение (стадия факторов и ранжирования) ограничены требованиями справедливости и аудита. Выдача (стадия показа) ограничена прозрачностью и правом на удаление. Иными словами: всё, что было «можно технически» в прошлых модулях, здесь получает рамку «допустимо и обязательно».

Главный тезис: этика и приватность в поиске — это не PR-обёртка поверх готовой системы, а инженерные требования, которые проектируются вместе с системой. Минимизацию данных нельзя «прикрутить» к логам, спроектированным жадно; справедливость ранжирования нельзя «починить» после релиза одним фильтром; право быть забытым невозможно исполнить, если архитектура не умеет находить и удалять данные по субъекту. Чем раньше ограничения встроены, тем дешевле они обходятся — и наоборот, ретроактивное приведение в соответствие почти всегда болезненно.

Внимание. Модуль сознательно держится принципов, а не юрисдикций. Конкретные сроки хранения, пороги и формулировки законов различаются по странам и меняются во времени; мы говорим о классах требований (минимизация, право на удаление, прозрачность, недискриминация) и инженерных паттернах их исполнения. Любые числа в примерах — иллюстративные, не нормативные. Это не юридическая консультация.

Как читать по трекам

Студент — обязательны главы 21.1 (приватность: минимизация, анонимизация, агрегация) и 21.4 (смещения и справедливость на уровне идей). Главы 21.2 и 21.3 — концептуально: какие бывают манипуляции и зачем нужна прозрачность.
Инженер — всё обязательно. Особое внимание: инженерные заметки про псевдонимизацию vs анонимизацию, k-анонимность и её провалы, TTL/ретеншн-пайплайны и каскадное удаление в 21.1; конвейер исполнения права на удаление в 21.3; метрики справедливости и протокол аудита в 21.4.
SEO — главы 21.2 (что считается манипуляцией выдачей и почему «серые» техники рискованны) и 21.3 (как устроены каналы удаления/жалоб и что реально удаляется из выдачи, а что — нет). SEO-врезки по всему модулю.
Смешанный — последовательно весь модуль; формальные определения дифференциальной приватности в 21.1 и метрик справедливости в 21.4 можно бегло просмотреть при первом проходе.

Карта модуля

21.1. Приватность поведенческих данных — минимизация, псевдонимизация vs анонимизация, агрегация, k-анонимность/дифф-приватность, сроки хранения (TTL/retention). (средний)
21.2. Манипуляции выдачей — накрутка, дезинформация, «отравление» сигналов (signal poisoning), Сивилловы атаки, обратная связь и петли усиления. (средний)
21.3. Прозрачность и регуляторные требования — объяснимость ранжирования, право быть забытым (right to be forgotten), каналы удаления, разделение «удалить из индекса» vs «убрать из выдачи». (средний)
21.4. Ответственный ML — смещения (bias) в данных и моделях, справедливость ранжирования (fairness), аудит и мониторинг во времени. (средний)

Глава 21.1. Приватность поведенческих данных: минимизация, анонимизация, агрегация, сроки хранения (средний)

Цели обучения

После главы студент сможет:

Сформулировать принцип минимизации данных (data minimization) и ограничения цели (purpose limitation) и применить их к проектированию лога взаимодействия из Модуля 11.
Различать псевдонимизацию (pseudonymization) и анонимизацию (anonymization) и объяснить, почему первая не выводит данные из-под защиты, а вторая трудно достижима.
Объяснить k-анонимность, её слабости (атаки на однородность и фоновое знание) и идею дифференциальной приватности (differential privacy) как более строгой гарантии.
Спроектировать политику сроков хранения (retention/TTL) с разными окнами для сырых и агрегированных данных и реализовать её каскадное применение.
Оценить приватностный риск конкретного признака или агрегата (реидентификация, утечка через редкие комбинации).

Конспект

Поведенческие сигналы (Модуль 11) — самый ценный и одновременно самый опасный класс данных в поиске: за каждой записью лога стоит конкретный человек и его запросы, а запросы людей бывают предельно интимны (болезни, ориентация, финансы, юридические проблемы). Приватность здесь — не «галочка», а условие самого права собирать данные.

Минимизация и ограничение цели

Два фундаментальных принципа, из которых выводится почти всё остальное.

Интуиция. Не собирай того, что тебе не нужно; собранное используй только для той цели, ради которой собрал; храни ровно столько, сколько нужно для этой цели. Данные, которых у вас нет, невозможно украсть, утечь, запросить повесткой или использовать против пользователя.

Минимизация (data minimization). Логируй минимально достаточный набор полей. Если для оценки качества выдачи нужен факт «клик на позиции i по запросу q», то точный user_id, полный IP, точные координаты и User-Agent в исходном виде, скорее всего, избыточны.
Ограничение цели (purpose limitation). Данные, собранные для «улучшения ранжирования», нельзя без отдельного основания пускать на, скажем, профилирование для сторонних целей. Цель фиксируется заранее.
Ограничение хранения (storage limitation). У каждого набора данных есть срок жизни (см. ниже про TTL).

Инженерная заметка. Минимизация начинается на уровне схемы лога, а не на уровне «потом обрежем». Проектируя запись показа/клика из Модуля 11, для каждого поля задайте вопрос: какая конкретная фича/метрика его потребляет? Поле без потребителя — это чистый риск без выгоды. Хороший приём — «бюджет полей»: добавление нового поля в лог требует обоснования цели и срока хранения, как code review.

Псевдонимизация против анонимизации

Критическое и постоянно путаемое различие.

Псевдонимизация (pseudonymization) — замена прямых идентификаторов на стабильный суррогат (например, user_id → соль+хеш). Связь «суррогат ↔ человек» разорвана не полностью: при наличии таблицы соответствий (или ключа соли) её можно восстановить. Псевдонимизированные данные — по-прежнему персональные данные и остаются под защитой.
Анонимизация (anonymization) — необратимое преобразование, после которого данные нельзя соотнести с человеком никакими разумными средствами. Только полностью анонимные данные выходят из-под режима персональных.

Заблуждение. «Мы захешировали user_id — значит, данные анонимны.» Нет. Это псевдонимизация. Хеш стабилен, поэтому склеить всю историю одного человека по-прежнему можно, а сама история часто содержит достаточно уникальных «отпечатков» (редкий запрос + город + время), чтобы вычислить, кто это. Истинная анонимизация почти всегда требует потери информации (агрегации, обобщения, шума), а не просто замены ключа.

Внимание. Богатая поведенческая история практически всегда квазиидентификатор. Сочетания «несколько редких запросов + регион + тип устройства + распорядок дня» делают людей уникальными даже без имени. Классический результат приватности: достаточно нескольких точек, чтобы реидентифицировать индивида в «анонимном» датасете.

Агрегация как защита

Главный практический инструмент: переходить от записей о людях к статистике о группах как можно раньше в конвейере.

Вместо «пользователь U кликнул по URL X в момент T» хранить «по запросу q URL X получил n кликов из m показов за день D». Такой агрегат уже не про человека — он про пару «запрос–документ», и именно он нужен ранжированию (клик-модели из Модуля 11 потребляют агрегированные CTR, а не сырые клики конкретных людей).

Интуиция. Сырой лог — топливо; агрегаты — переработанный продукт. Чем быстрее вы сожжёте топливо (свернёте сырьё в счётчики) и зальёте в бак продукт, тем меньше у вас опасного сырья на складе.

Но агрегация защищает не автоматически. Опасны:

Малые ячейки (small cells). Агрегат «по запросу q в городе N за час — 1 клик» фактически указывает на одного человека. Нужны пороги k (не публиковать/не хранить агрегаты с числом субъектов < k) и/или подавление редких ячеек.
Дифференцирование во времени. Два «безопасных» агрегата, снятые до и после события, разностью могут выдать поведение одного субъекта.

k-анонимность и её провалы

k-анонимность (k-anonymity): датасет k-анонимен, если по набору квазиидентификаторов каждая запись неотличима минимум от k−1 других. То есть любого человека «прячут в толпе» размером не меньше k.

Пример. Таблица запросов с полями (возрастная группа, город, тема). Если для каждой комбинации этих полей есть ≥10 разных пользователей — таблица 10-анонимна по этим квазиидентификаторам.

Слабости (важно понимать пределы метода):

Атака однородности (homogeneity attack). Все k записей в группе имеют одно и то же чувствительное значение. Спрятали в толпе из 10 — но все 10 искали одно и то же «деликатное» → значение раскрыто. Лечится l-разнообразием (l-diversity): в каждой группе ≥ l разных чувствительных значений.
Атака фонового знания (background knowledge). Атакующий уже что-то знает о субъекте и сужает группу. Частично лечится t-близостью (t-closeness): распределение чувствительного признака в группе близко к общему.

Заблуждение. «Сделали k-анонимность — приватность доказана.» k-анонимность — синтаксическое свойство таблицы, оно не учитывает фоновое знание и плохо композируется: два k-анонимных релиза вместе могут уже не быть анонимными. Это полезный, но слабый и хрупкий гарант.

Дифференциальная приватность — более строгая идея

Дифференциальная приватность (differential privacy, DP) даёт математическую гарантию вместо синтаксической. Механизм M ε-дифференциально приватен, если для любых двух датасетов D и D', отличающихся одной записью (одним человеком), и любого исхода S:

P[M(D) ∈ S] ≤ e^ε · P[M(D') ∈ S]

Интуиция. Результат запроса почти не меняется от того, есть в данных конкретный человек или нет. Значит, по выходу нельзя надёжно заключить, что этот человек вообще присутствовал, — а раз так, его участие безопасно. Параметр ε («бюджет приватности») регулирует силу: меньше ε — сильнее защита, больше шума, ниже точность.

Достигается добавлением калиброванного шума (механизмы Лапласа/Гаусса) к агрегатам/счётчикам. Бывает локальной (шум добавляется на устройстве до отправки — система не видит сырых данных вовсе) и централизованной (доверенный агрегатор шумит на выходе).

Инженерная заметка. DP — не бесплатна: каждый ответ «тратит» из бюджета ε (composition), накопленные запросы суммируют утечку. Поэтому DP применяют точечно — к публикуемой статистике, дашбордам, выгрузкам для аналитиков, обучающим агрегатам, — а не пытаются «зашуметь всё». Главный практический выигрыш: даёт доказуемую границу, чего k-анонимность не даёт.

Сроки хранения: TTL и ретеншн-пайплайны

Ограничение хранения исполняется технически через сроки жизни данных (TTL, retention windows). Типичная многоуровневая политика (числа иллюстративны):

Код: Выделить всё

Слой данных                                    |  Что это                                      |  Окно (пример)                      |  Зачем столько
-----------------------------------------------+-----------------------------------------------+-------------------------------------+-------------------------------------
Сырые события показа/клика с идентификаторами  |  отладка атрибуции, расследование инцидентов  |  дни–недели                         |  минимально для операционных нужд
Псевдонимизированные сессии                    |  обучение клик-моделей, антифрод              |  месяцы                             |  нужен горизонт сезонности/паттернов
Агрегаты по (запрос, URL, регион)              |  факторы ранжирования                         |  длинное окно с затуханием (decay)  |  сигнал ценен долго, но риск низкий
Полностью анонимные/DP-статистики              |  отчётность, исследования                     |  бессрочно                          |  не персональные данные

Инженерная заметка. TTL должен быть активным, а не «настройкой на бумаге». Это пайплайн: партиционирование хранилища по дате → автоматическое истечение партиций → каскадное удаление производных (нельзя удалить сырьё, но оставить его псевдонимизированную копию в другом сторе). Каждое поле в каталоге данных помечается классом и сроком; джоб ежедневно сверяет факт с политикой. Удаление должно покрывать и бэкапы/реплики/кэши — иначе данные «живут» в снапшотах дольше политики.

SEO-врезка. Сроки хранения и затухание поведенческих агрегатов объясняют, почему манипуляции поведением выдыхаются: накрученный всплеск кликов попадает в окно с decay и со временем теряет вес, а сырьё, по которому можно было бы «дообъяснить» аномалию, к тому моменту удалено. Долгоживущий сигнал — это устойчивый сигнал, а не разовый импульс.

SEO-врезка. Для владельца сайта приватностный режим означает, что часть данных о пользователях, которые он привык получать (точные запросы-источники, детальные профили), системой агрегируется или скрывается. Это не «утаивание ради утаивания», а прямое следствие минимизации — стройте аналитику на агрегатах, а не на индивидуальной слежке.

Частые заблуждения

Заблуждение. «Если убрать имя и e-mail, данные обезличены.» Имя — лишь прямой идентификатор. Реидентификация работает через квазиидентификаторы (поведение, геолокация, тайминги). Удаление имени необходимо, но далеко не достаточно.

Заблуждение. «Чем больше данных храним, тем лучше модель — значит, хранить надо всё и навсегда.» Предельная польза от старых сырых данных быстро убывает (агрегаты сохраняют почти всю ценность), а предельный риск (утечка, повестка, ошибка доступа) — нет. Минимизация почти всегда выгоднее на горизонте.

Заблуждение. «Дифференциальная приватность делает данные бесполезными из-за шума.» При разумном ε и больших объёмах шум растворяется в статистике: относительная погрешность массовых агрегатов мала. DP «ломает» именно точечные запросы про одного человека — ровно то, что и должна ломать.

Лаба / практика

Аудит приватности лога + политика хранения. Время ~70 мин.

Дано: схема лога взаимодействия из Модуля 11 (поля impression_id, user_id, query_normalized, results[], clicks[], ts_serp, session_id, context{регион, устройство, IP, User-Agent}).

Для каждого поля заполните таблицу: прямой идентификатор / квазиидентификатор / чувствительное / технически-необходимое; кто потребитель; предлагаемое преобразование (хеш, обобщение, обрезка, удаление).
Предложите минимизированную схему: что псевдонимизировать (соль+хеш user_id), что обобщать (IP → /24 или регион; точное время → час), что вовсе не логировать.
Постройте таблицу из ~30 синтетических записей; выберите квазиидентификаторы (регион, устройство, возрастная группа) и проверьте k-анонимность: найдите группы с k<3, обобщите поля, пока минимальный k≥3 не достигнут. Зафиксируйте, что для этого пришлось «потерять».
Опишите многоуровневую retention-политику (≥3 слоя) с TTL и правилом каскадного удаления.

Критерий «сделано»: каждое поле классифицировано и обосновано (или удалено); итоговая таблица k-анонимна по выбранным квазиидентификаторам; показано, какая точность принесена в жертву; политика хранения покрывает сырьё, производные и бэкапы.

Контрольные вопросы

В чём принципиальная разница между псевдонимизацией и анонимизацией с точки зрения правового режима данных?
Почему стабильный хеш user_id не делает лог анонимным? Приведите сценарий реидентификации.
Сформулируйте атаку однородности на k-анонимный датасет и объясните, как l-разнообразие её закрывает.
Что гарантирует ε-дифференциальная приватность и как ε влияет на компромисс «приватность ↔ точность»?
Чем «малые ячейки» опасны при агрегации и какие два приёма их обезвреживают?
Почему ограничение хранения должно реализовываться как активный пайплайн, а не как запись в политике? Что легко забыть удалить?
Как связаны затухание поведенческого сигнала (Модуль 11) и сроки хранения сырых данных?

Глава 21.2. Манипуляции выдачей, дезинформация, «отравление» сигналов (signal poisoning) (средний)

Цели обучения

После главы студент сможет:

Классифицировать атаки на поисковую систему по стадии конвейера, на которую они нацелены (контент, ссылки, поведение, сущности).
Объяснить механику «отравления сигналов» (signal poisoning) и почему обучаемое ранжирование особенно к нему уязвимо.
Описать Сивиллову атаку (Sybil attack) и роль ботнетов/ферм в накрутке поведенческих факторов.
Связать петлю обратной связи «ранжирование → поведение → переобучение» из Модуля 11 с риском усиления манипуляций и дезинформации.
Сформулировать общие принципы защиты: разнообразие сигналов, доверие к источнику, обнаружение аномалий, человеческий контроль.

Конспект

Поисковая выдача — это власть над вниманием, а значит, объект постоянных атак. Манипуляция — попытка изменить ранжирование не за счёт реальной полезности документа, а за счёт эксплуатации механики системы. Разберём ландшафт.

Таксономия манипуляций по мишени-сигналу

Каждый класс сигнала (Модули 6–11) имеет свой класс атак:

Код: Выделить всё

Мишень                      |  Атака                                |  Суть
----------------------------+---------------------------------------+---------------------------------------------------------------
Текстовые сигналы           |  keyword stuffing, cloaking           |  переспам ключевых слов; показ роботу одного, человеку другого
Ссылочный граф (Модуль 7)   |  link farms, PBN, покупка ссылок      |  искусственная накачка авторитета фиктивными ссылками
Сущности/разметка           |  spoofing разметки, фальшивые отзывы  |  ложные структурированные данные, накрутка рейтингов
Поведенческие (Модуль 11)   |  click fraud, накрутка ПФ             |  имитация массовых «настоящих» кликов и сессий
Персонализация (Модуль 18)  |  profile poisoning                    |  целенаправленное «загрязнение» профиля пользователя/сегмента

Интуиция. Атакующий всегда бьёт в самый дешёвый для подделки сигнал с наибольшим весом в ранжировании. По мере того как система повышает вес трудно-подделываемых сигналов (поведение), атаки мигрируют туда же — отсюда индустрия накрутки поведенческих факторов.

Отравление сигналов (signal poisoning)

Отравление сигналов — внедрение в данные, на которых система учится или которые агрегирует, специально сконструированных наблюдений, сдвигающих оценку в нужную атакующему сторону. Это атака не на один документ, а на модель/статистику.

Формы:

Отравление обучающей выборки (training-data / label poisoning). Поскольку обучаемое ранжирование (Модуль 9) и клик-модели (Модуль 11) учатся на логах, фальшивое поведение становится частью обучающих данных. Накрутка кликов — это, по сути, инъекция ложных «меток релевантности».
Отравление агрегатов. Накачка счётчиков CTR/dwell по паре «запрос–URL», чтобы поднять её агрегированный поведенческий фактор.
Отравление контентного слоя. Массовая генерация текстов/страниц, формирующих ложный «консенсус» по теме (особенно опасно для дезинформации — см. ниже).

Внимание. Ключевая уязвимость: петля обратной связи (Модуль 11). Ранжирование формирует выдачу → выдача порождает поведение → поведение переучивает ранжирование. Если в эту петлю влить отравленный сигнал, система может самоусиливать ошибку: накрученный документ поднимается → получает больше органических показов → набирает уже настоящие клики (за счёт позиции, а не качества) → закрепляется. Атакующему достаточно «толкнуть» петлю, дальше она крутит сама.

Сивиллова атака (Sybil attack)

Имя — из обобщённой литературы по распределённым системам: атакующий создаёт множество фиктивных идентичностей (аккаунтов, устройств, IP), чтобы его единственный голос выглядел как голоса многих независимых субъектов.

В поиске это фундамент накрутки поведения: чтобы «миллионы независимых пользователей» проголосовали за документ, нужны тысячи правдоподобных псевдо-пользователей — ботнеты, фермы устройств, мотивированные люди-исполнители (краудтурбинг). Защита от Сивиллы — задача отличить много фейковых сущностей от немногих настоящих:

Стоимость идентичности. Поднять цену создания правдоподобной сущности (репутация устройства/сети, история, прохождение проверок).
Граф доверия и аномалии. Настоящие пользователи распределены по сетям, устройствам, времени «естественно»; ботнет оставляет корреляции (один пул IP, синхронные тайминги, шаблонные траектории).
Агрегация с весами доверия. Голос сущности с низким доверием весит меньше.

Инженерная заметка. Чистый поведенческий сигнал — главный продукт борьбы с Сивиллой. До того как клики попадут в клик-модели (Модуль 11), их фильтрует слой обнаружения накрутки: дедупликация, отсев бот-трафика, понижение веса аномальных кластеров. Отравленные данные, дошедшие до обучения, отравляют модель надолго — поэтому фильтрация до агрегации критична.

Дезинформация: особый класс

Дезинформация — не «накрутка позиции», а попытка сделать так, чтобы по важному запросу выдача давала ложную, вредную или вводящую в заблуждение картину. Отличия от обычного спама:

Цель — не коммерция, а влияние; контент бывает технически качественным.
Часто координированная кампания: сеть источников создаёт ложный консенсус (много «независимых» источников повторяют одно).
Ущерб — общественный (здоровье, выборы, безопасность), а не только «плохая выдача».

Принципы противодействия (без идеологии, на уровне инженерии и политики):

Доверие к источнику (authoritativeness). По чувствительным темам поднимать вес проверяемых, ответственных источников — это сигнал качества, а не цензура темы.
Разнообразие и происхождение. Учитывать независимость источников: десять зеркал одного текста — это один голос, а не десять (связь с дедупликацией, Модуль 15, и обнаружением координации).
Прозрачность, а не тихое подавление. Где возможно — давать контекст/пометки, а не молча удалять (связь с 21.3).
Человек в контуре. Для самых чувствительных классов запросов — ручная экспертиза и явные политики, а не только автомат.

Заблуждение. «Если документ собирает много кликов, он точно полезен — толпа не ошибается.» Толпа не ошибается, когда она настоящая и независимая. Накрутка и координированные кампании ломают оба условия: голоса не настоящие и/или не независимые. Поэтому поведенческий сигнал ценен только после очистки от Сивиллы и проверки независимости.

SEO-врезка. Граница «оптимизация ↔ манипуляция» проходит по вопросу: вы улучшаете реальную полезность для пользователя или эксплуатируете механику в обход полезности? Накрутка ПФ, покупка ссылок, клоакинг, фейковые отзывы — это отравление сигналов; они дают временный всплеск, попадают под антиспам и затухание (21.1) и грозят санкциями. Устойчивый рост даёт только сигнал, который вы заслужили, а не инъецировали.

SEO-врезка. «Серые» техники опасны асимметрией: выгода временная (до следующей итерации антиспама), а штраф — устойчивый (домен может надолго потерять доверие). Ожидаемая ценность манипуляции на горизонте часто отрицательна.

Частые заблуждения

Заблуждение. «Отравить ранжирование — значит подкрутить один документ.» Нет: отравление бьёт по модели и статистике, и через петлю обратной связи эффект распространяется и самоусиливается. Это атака на процесс обучения, а не на отдельную карточку.

Заблуждение. «Боты легко отличить — у них нет курсора/JS.» Современные фермы имитируют человеческие траектории, тайминги, устройства. Надёжный признак — не отдельное событие, а статистические корреляции по множеству сущностей (Сивиллова сигнатура): синхронность, общие сети, шаблонность.

Лаба / практика

Сценарный анализ атаки и защиты. Время ~50 мин.

Дано: пара «запрос–URL» с историей дневных CTR за 60 дней; на день 30 начинается накрутка (CTR резко вырастает с пула из 50 IP, тайминги синхронны, dwell-time подозрительно одинаков).

Постройте график CTR во времени; отметьте аномалию. Какие три признака указывают на Сивиллову атаку, а не на органический всплеск (например, вирусность)?
Опишите, что произойдёт, если этот сигнал без фильтрации попадёт в клик-модель и петлю обратной связи: смоделируйте 3 итерации «позиция → клики → переобучение».
Предложите два независимых детектора (например, аномалия распределения по IP/сетям; рассинхрон с органическим спросом) и правило понижения веса.
Сформулируйте, почему фильтрацию надо делать до агрегации, а не лечить модель после.

Критерий «сделано»: аномалия выделена и обоснована тремя признаками; показан механизм самоусиления; предложены детекторы и точка их включения в конвейер (до агрегации).

Контрольные вопросы

Почему атаки мигрируют в сторону поведенческих сигналов по мере роста их веса в ранжировании?
Что такое отравление сигналов и чем оно отличается от манипуляции отдельным документом?
Объясните механизм самоусиления манипуляции через петлю обратной связи из Модуля 11.
Что такое Сивиллова атака и какие сигнатуры выдают ботнет в поведенческих логах?
Почему «ложный консенсус» из множества зеркал не должен считаться множеством независимых голосов?
Какие принципы противодействия дезинформации можно применять, не скатываясь в произвольную цензуру?
Где проходит инженерная граница между добросовестной оптимизацией и манипуляцией?

Глава 21.3. Прозрачность ранжирования, право быть забытым, регуляторные требования (средний)

Цели обучения

После главы студент сможет:

Объяснить напряжение между прозрачностью ранжирования и устойчивостью к манипуляциям (раскрытие алгоритма облегчает его взлом).
Различать уровни объяснимости: общая политика, факторы запроса, пер-результатное объяснение, и оценить, что реально раскрываемо.
Описать «право быть забытым» (right to be forgotten) и инженерный конвейер исполнения запроса субъекта на удаление.
Различать три разных действия: удаление из индекса, скрытие из выдачи по конкретному запросу, удаление исходного контента (последнее системе недоступно).
Перечислить типовые классы регуляторных требований к поиску и спроектировать их исполнимость на уровне архитектуры.

Конспект

С ростом влияния поиска на доступ к информации растут и требования к его подотчётности: пользователь и регулятор хотят понимать, почему выдача такая, и иметь рычаги (удаление своих данных, оспаривание результатов). Эта глава — про прозрачность и исполнение прав.

Прозрачность ранжирования и её предел

Интуиция. Полная прозрачность алгоритма и устойчивость к манипуляциям — в прямом конфликте. Если опубликовать точную формулу и веса, завтра её начнут эксплуатировать (см. 21.2). Поэтому прозрачность в поиске — это раскрытие принципов и политик, а не точных весов и порогов.

Уровни объяснимости (от общего к частному):

Код: Выделить всё

Уровень                      |  Что раскрывается                                               |  Реалистичность
-----------------------------+-----------------------------------------------------------------+----------------------------------------------------------
Политика ранжирования        |  какие *классы* сигналов учитываются, что считается нарушением  |  высокая, публикуется
Объяснение для запроса       |  почему по запросу q важны такие-то факторы                     |  частичная
Пер-результатное объяснение  |  почему именно этот документ на этой позиции                    |  трудно: каскад L0–L3 + нейромодели слабо интерпретируемы
Точные веса/пороги           |  сама модель                                                    |  не раскрывается (взлом + IP)

Инженерная заметка. Чем больше в ранжировании нейросетевых стадий (Модуль 10) и обучаемых каскадов (Модуль 9), тем труднее пер-результатная объяснимость: ответ — функция тысяч признаков и нелинейностей. Практичные суррогаты: атрибуция признаков (какие фичи сильнее всего двигали скор), контрфактические объяснения («поднимись текст по теме — позиция была бы выше»), а не «честное» вскрытие модели. Это область ответственного ML (21.4).

Право быть забытым

Право быть забытым (right to be forgotten, right to erasure) — право субъекта потребовать удаления/недоступности касающихся его данных при определённых условиях. В контексте поиска критично различать три разных действия, которые часто путают:

Удаление из выдачи по запросу (delisting). Результат перестаёт показываться по определённым запросам (например, по имени человека), но остаётся в индексе и доступен по другим запросам и по прямой ссылке. Это самое частое исполнение «права быть забытым» применительно к поисковику-посреднику.
Удаление из индекса (deindexing). Документ полностью убирается из индекса системы — не находится ни по какому запросу. Но сам по исходному адресу он жив.
Удаление исходного контента. Физическое удаление страницы — вне власти поисковой системы: это делает владелец ресурса/хостинг. Поиск может лишь перестать на него указывать.

Внимание. Эти три уровня постоянно смешивают в публичных дискуссиях. Поисковая система — посредник, а не первоисточник. «Удалите про меня из интернета» она исполнить не может; она может перестать индексировать или показывать по запросу. Понимание этой границы — половина грамотного разговора о праве на удаление.

Инженерная заметка. Конвейер исполнения запроса на удаление (erasure pipeline):
1. Приём и аутентификация запроса субъекта (подтвердить, что заявитель — тот, о ком данные).
2. Балансировка интересов (там, где применимо): право на приватность против общественного интереса/свободы информации — нередко требует ручной экспертизы, а не автоудаления.
3. Идентификация затронутых данных по субъекту — здесь архитектура решает: если данные нельзя найти по субъекту, право неисполнимо. Нужны индексы/каталоги, позволяющие собрать всё, относящееся к человеку, по его идентификатору.
4. Применение действия (delist/deindex/erase) во всех хранилищах: индекс, кэши, реплики, бэкапы, производные агрегаты, обучающие выборки.
5. Подтверждение и аудит-лог (факт, дата, основание, объём) — для подотчётности, и сам этот лог тоже под ретеншн-политикой.
Ключевой урок: исполнимость права на удаление — это требование к проектированию хранилищ (data lineage, поиск по субъекту, каскадное удаление), а не «кнопка», добавляемая в конце.

Типовые классы регуляторных требований

Без привязки к конкретным законам — классы обязательств, которые регуляторы предъявляют поиску:

Защита персональных данных — законные основания сбора, минимизация, безопасность (вытекает из 21.1).
Права субъекта данных — доступ к своим данным, исправление, удаление, переносимость, возражение против профилирования.
Прозрачность ранжирования и рекламы — раскрытие основных параметров ранжирования (классов сигналов), явная маркировка рекламы/платных размещений, недопущение скрытого самопредпочтения.
Недискриминация — запрет на дискриминацию по защищённым признакам (связь с 21.4).
Прозрачность модерации/удалений — уведомление о причинах удаления, механизм оспаривания (appeal).
Особый режим уязвимых данных — здоровье, дети, чувствительные категории.

SEO-врезка. Маркировка рекламы и запрет скрытого самопредпочтения напрямую касаются устройства выдачи (сборка SERP, Модуль 14): спецблоки и платные размещения должны быть отличимы от органики. Для SEO это означает, что «органическая» позиция и «платная» живут по разным правилам и раскрываются по-разному.

SEO-врезка. Каналы удаления — это не «удалить конкурента из интернета». Делистинг по имени и деиндексация имеют узкие основания; чтобы реально убрать страницу, контент должен быть удалён/закрыт на первоисточнике (noindex, удаление страницы, настройки доступа). Поиск лишь следует за состоянием источника.

Заблуждение. «Право быть забытым = моё имя исчезает из всех поисковиков по всему миру.» На практике делистинг часто ограничен конкретными запросами, юрисдикциями и проходит балансировку с общественным интересом; контент при этом остаётся в сети у первоисточника.

Частые заблуждения

Заблуждение. «Прозрачность — значит опубликовать алгоритм.» Публикация точной модели = инструкция по её взлому (21.2). Прозрачность в поиске — это раскрытие политик, классов сигналов и маркировок, плюс объяснимость на уровне «почему важны такие факторы», а не выдача весов.

Заблуждение. «Если поисковик убрал результат, контент удалён.» Делистинг/деиндексация затрагивают видимость в поиске, а не существование контента. Первоисточник остаётся, если его владелец не удалил страницу.

Лаба / практика

Проектирование erasure-конвейера и матрицы действий. Время ~60 мин.

Дано: упрощённая карта хранилищ системы — индекс, кэш выдачи, лог взаимодействия (псевдоним.), обучающие выборки клик-модели, агрегаты CTR, ночные бэкапы.

Постройте матрицу «тип запроса субъекта × хранилище × действие»: для делистинга, деиндексации и стирания персональных данных укажите, что делается в каждом сторе (ничего / скрыть по запросу / удалить запись / пересчитать агрегат / удалить из бэкапа при ротации).
Опишите, какой индекс по субъекту нужен, чтобы шаг «найти все данные о человеке» был выполним; что будет, если его нет.
Спроектируйте аудит-лог удаления: какие поля, какой TTL, кто имеет доступ.
Составьте таблицу-памятку «удаление из выдачи vs из индекса vs исходного контента»: кто исполняет, что остаётся доступным.

Критерий «сделано»: матрица покрывает все стора, включая бэкапы и обучающие выборки; обоснована необходимость поиска по субъекту; памятка корректно разводит три уровня удаления и роль посредника.

Контрольные вопросы

Почему полная прозрачность алгоритма ранжирования противоречит устойчивости к манипуляциям? Что раскрывают вместо весов?
Почему пер-результатная объяснимость трудна в нейросетевом каскаде и какие суррогаты её заменяют?
Разведите три действия: делистинг, деиндексация, удаление исходного контента — кто что исполняет?
Какие шаги erasure-конвейера зависят от архитектуры хранилищ, и почему «найти данные по субъекту» — узкое место?
Почему бэкапы и обучающие выборки нельзя забывать при исполнении права на удаление?
Зачем нужна явная маркировка рекламы и запрет скрытого самопредпочтения с точки зрения регулятора?
В каком смысле поисковая система — «посредник», и как это ограничивает то, что она в принципе может удалить?

Глава 21.4. Ответственный ML: смещения (bias), справедливость ранжирования, аудит (средний)

Цели обучения

После главы студент сможет:

Перечислить источники смещений (bias) в данных и моделях поиска и проследить, как они проникают через петлю обратной связи.
Различать позиционное смещение (position bias) как технический артефакт и социальные/демографические смещения, ведущие к несправедливости.
Сформулировать несколько операционализаций справедливости ранжирования (fairness) и объяснить, почему они конфликтуют между собой и с релевантностью.
Спроектировать протокол аудита ранжирования: метрики, срезы, мониторинг во времени.
Связать ответственный ML с приватностью (21.1), манипуляциями (21.2) и персонализацией (Модуль 18).

Конспект

Обучаемое ранжирование (Модули 9–11) учится на данных о прошлом поведении. Если в прошлом была систематическая несправедливость или искажение, модель её выучит и закрепит — тихо, под видом «оптимизации релевантности». Ответственный ML — про то, как это замечать и ограничивать.

Откуда берутся смещения

Код: Выделить всё

Источник                                 |  Механизм                                            |  Пример
-----------------------------------------+------------------------------------------------------+--------------------------------------------------------------
Смещение выборки (sampling)              |  данные не репрезентативны                           |  логи только активных пользователей одного сегмента
Смещение представления (representation)  |  группа недопредставлена                             |  редкие языки/регионы недообучены
Историческое (historical)                |  данные отражают прошлую несправедливость            |  модель воспроизводит исторический перекос
Позиционное (position bias)              |  клик зависит от позиции, а не только релевантности  |  верхние позиции «выигрывают» из-за внимания (Модуль 11)
Смещение петли (feedback loop)           |  выдача формирует поведение, поведение — выдачу      |  «богатые богатеют»: показанное собирает клики и закрепляется
Смещение прокси-метки (proxy)            |  целевая метка ≠ истинная цель                       |  клик ≠ удовлетворённость; оптимизируем не то

Интуиция. Модель оптимизирует то, что вы ей дали как «правильный ответ». Если «правильный ответ» — это исторические клики, а клики искажены позицией, популярностью и прошлыми решениями, то модель честно выучит искажение. «Мусор на входе — мусор на выходе», только мусор тут — это неявная несправедливость, незаметная в среднем.

Внимание. Позиционное смещение (Модуль 11) — технический артефакт, его снимают клик-моделями (cascade/DBN, propensity-взвешивание). Демографические/социальные смещения — иной класс: их не «снять формулой смещения позиции», они требуют явных метрик справедливости и решений о ценностях. Путать их опасно: чистая дебиасинг-математика клик-моделей не делает систему справедливой.

Справедливость ранжирования: несколько определений

Справедливость (fairness) — не единое понятие; есть конкурирующие операционализации:

Групповая справедливость экспозиции (exposure / demographic parity). Группы получают внимание (показы, верхние позиции) пропорционально некоторой норме (например, своей доле или равно). Релевантность при этом может проседать.
Справедливость по заслугам (merit-based / equal opportunity). Экспозиция пропорциональна истинной релевантности/качеству, без штрафа за принадлежность к группе. Требует несмещённой оценки релевантности.
Индивидуальная справедливость (individual fairness). Похожие документы/субъекты получают похожее обращение.
Контрфактическая (counterfactual). Результат не должен меняться, если поменять только защищённый признак при прочих равных.

Заблуждение. «Существует одна правильная метрика справедливости, надо её максимизировать. Теоретически доказано, что несколько естественных критериев справедливости несовместимы** одновременно (кроме вырожденных случаев) — нельзя удовлетворить их все. Выбор критерия — это решение о ценностях и контексте, а не чисто техническая оптимизация. Инженер обязан сделать выбор явным, а не спрятать его в дефолтах.

Внимание. Справедливость экспозиции и релевантность в общем случае конфликтуют: перераспределяя внимание к недопредставленной группе, мы можем опустить более релевантный документ. Это компромисс (trade-off), который выбирается осознанно под задачу, а не «решается» раз и навсегда.

Связь с позиционным смещением и петлёй

Позиционное смещение + петля обратной связи = механизм усиления неравенства: документ, случайно оказавшийся выше, собирает больше кликов из-за позиции, переобучение закрепляет его выше, разрыв растёт. То же касается групп: недопредставленная группа реже показывается → реже кликается → выглядит «менее релевантной» → ещё реже показывается.

Противоядия (на уровне принципов):

Дебиасинг по позиции (propensity-взвешивание, клик-модели) — убирает технический артефакт прежде, чем учить модель.
Исследование (exploration). Контролируемо показывать не только «топ по модели», чтобы собирать несмещённые данные о недопоказанных документах (классический exploration–exploitation; ломает петлю «богатые богатеют»).
Ограничения справедливости в постранжировании. Гарантировать минимальную экспозицию группам/слотам (связь с диверсификацией, Модуль 15).

Инженерная заметка. Exploration — это намеренный отказ от сиюминутной выгоды ради несмещённых данных и здоровья петли в долгую. Малая доля «исследовательских» показов окупается тем, что модель перестаёт жить в эхо-камере собственных прошлых решений. Это прямой инструмент против feedback-bias.

Аудит: метрики, срезы, мониторинг

Справедливость и качество измеряются не средним по всем, а по срезам (slices).

Интуиция. Среднее качество может быть отличным, пока для конкретного языка/региона/группы оно проваливается — среднее это прячет. Аудит — это привычка смотреть на худшие срезы, а не на среднее.

Протокол аудита:

Определить защищённые/чувствительные срезы и группы (язык, регион, тип запроса, демография — где её этично и законно использовать).
Выбрать метрики качества (nDCG и пр. из метрик оценки) и справедливости (разрывы экспозиции/качества между группами).
Считать по срезам, не по среднему; искать максимальный разрыв (worst-case slice).
Мониторить во времени. Смещение и дрейф нарастают: новые данные, изменения поведения, петля. Аудит — непрерывный процесс, а не разовая проверка перед релизом.
Реагировать: документировать (model cards / datasheets — паспорта моделей и данных), ставить пороги-алерты на рост разрыва, иметь процедуру отката.

Инженерная заметка. Аудит должен быть встроен в тот же контур, что и A/B-измерение качества: те же логи, те же дашборды, плюс разрезы по группам и метрики справедливости. Отдельный «этический аудит раз в год» бесполезен против дрейфа — нужен непрерывный мониторинг разрывов с алертами, как на любую регрессию качества.

SEO-врезка. Понимание позиционного смещения и exploration объясняет, почему новый качественный документ получает шанс: система намеренно подмешивает исследовательские показы, иначе он никогда бы не выбрался из-под закрепившихся «старожилов». Это не «удача», а встроенный механизм против феномена «богатые богатеют».

Частые заблуждения

Заблуждение. «Модель объективна, потому что это математика.» Модель ровно настолько объективна, насколько объективны её данные и выбранная цель. Исторические искажения и искажённые метки делают «объективную» оптимизацию воспроизводством несправедливости.

Заблуждение. «Дебиасинг позиции = справедливость.» Снятие position bias — техническая гигиена клик-моделей; оно ничего не говорит о демографической/социальной справедливости, которая требует отдельных метрик и ценностного выбора.

Заблуждение. «Одного замера качества перед релизом достаточно.» Смещение дрейфует во времени через петлю и смену поведения. Без непрерывного мониторинга срезов система деградирует незаметно.

Лаба / практика

Аудит справедливости по срезам. Время ~70 мин.

Дано: логи ранжирования по запросам с двумя группами документов (условно A и B, где B — недопредставленная), позиции, клики; известна (для лабы) «истинная» релевантность.

Посчитайте среднее качество (nDCG) по всему набору и по каждой группе отдельно. Найдите разрыв. Покажите, как среднее «прячет» провал группы B.
Оцените позиционное смещение: сравните CTR на одной позиции для A и B; примените простое propensity-взвешивание и пересчитайте оценку релевантности.
Посчитайте разрыв экспозиции (доля показов/верхних позиций) против разрыва заслуг (истинная релевантность). Какой критерий справедливости нарушен?
Смоделируйте 3 итерации петли без exploration и с малой долей exploration; покажите, как разрыв растёт без исследования и стабилизируется с ним.
Оформите мини-«паспорт модели»: данные, метрики, срезы, найденные разрывы, пороги-алерты.

Критерий «сделано»: показано расхождение среднего и по-групповых метрик; разведены позиционное и групповое смещения; продемонстрировано влияние exploration на петлю; заполнен паспорт с порогами мониторинга.

Контрольные вопросы

Перечислите минимум четыре источника смещения в данных/моделях поиска и механизм каждого.
Чем позиционное смещение принципиально отличается от демографического, и почему их нельзя «лечить» одним приёмом?
Назовите три операционализации справедливости ранжирования и объясните, почему они конфликтуют.
Почему справедливость экспозиции и релевантность в общем случае находятся в компромиссе?
Как петля обратной связи усиливает неравенство и каким образом exploration её разрывает?
Почему аудит надо вести по срезам и непрерывно, а не по среднему и разово?
Что фиксирует «паспорт модели» (model card) и зачем он нужен для подотчётности?

Итоги модуля

Этика и приватность — инженерные требования, а не обёртка. Минимизация, исполнимость права на удаление, справедливость и аудит проектируются вместе с системой; ретроактивно их встроить дорого или невозможно.
Минимизация и ограничение цели — фундамент приватности. Данных, которых нет, нельзя лишиться. Схема лога должна оправдывать каждое поле конкретным потребителем и сроком хранения.
Псевдонимизация ≠ анонимизация. Хешированный user_id — всё ещё персональные данные; богатая поведенческая история — квазиидентификатор, позволяющий реидентификацию. Истинная анонимность требует потери информации.
Агрегация и DP сильнее k-анонимности. k-анонимность синтаксична и хрупка (атаки однородности, фонового знания, плохая композиция); дифференциальная приватность даёт доказуемую границу ценой бюджета ε и шума. Сроки хранения исполняются активным TTL-пайплайном, включая бэкапы и производные.
Манипуляции бьют в самый дешёвый сигнал с большим весом — и потому мигрируют в поведение. «Отравление сигналов» атакует модель/статистику, а петля обратной связи самоусиливает эффект. Сивиллова атака — основа накрутки; фильтровать надо до агрегации.
Прозрачность — это раскрытие политик и классов сигналов, не весов. Право быть забытым разводится на делистинг / деиндексацию / удаление первоисточника; поиск — посредник, исполнимость удаления — требование к архитектуре хранилищ (поиск по субъекту, каскадное удаление).
Ответственный ML отделяет позиционное смещение от социального. Справедливость не единична: её критерии конфликтуют между собой и с релевантностью; выбор критерия — явное ценностное решение. Exploration ломает «богатые богатеют», аудит ведётся по срезам и непрерывно.
Главное: мощность системы из прошлых модулей легитимна лишь в рамке ограничений этого модуля — собирай меньше, объясняй принципы, удаляй по запросу, измеряй справедливость по худшим срезам, а не по среднему.

Глоссарий модуля

Минимизация данных (data minimization) — сбор только минимально достаточного для заявленной цели набора данных.
Ограничение цели (purpose limitation) — использование данных только ради цели, под которую они собраны.
Ограничение хранения (storage limitation) — хранение данных не дольше, чем нужно цели; исполняется через TTL/ретеншн.
Псевдонимизация (pseudonymization) — замена прямых идентификаторов на обратимый суррогат; данные остаются персональными.
Анонимизация (anonymization) — необратимое обезличивание; только полностью анонимные данные выходят из режима персональных.
Квазиидентификатор (quasi-identifier) — поле, само по себе не идентифицирующее, но в комбинации позволяющее реидентификацию.
k-анонимность (k-anonymity) — каждая запись неотличима минимум от k−1 других по квазиидентификаторам.
l-разнообразие / t-близость (l-diversity / t-closeness) — усиления k-анонимности против атак однородности и фонового знания.
Дифференциальная приватность (differential privacy, ε-DP) — гарантия, что присутствие/отсутствие одного субъекта почти не влияет на результат; сила задаётся бюджетом ε.
Малая ячейка (small cell) — агрегат с числом субъектов меньше порога, по сути раскрывающий индивида.
TTL / ретеншн (retention window) — срок жизни данных и активный пайплайн их истечения, включая производные и бэкапы.
Отравление сигналов (signal poisoning) — инъекция сконструированных наблюдений в обучающие/агрегируемые данные ради сдвига оценки.
Отравление обучающей выборки (training-data poisoning) — частный случай: фальшивое поведение как ложные метки релевантности.
Сивиллова атака (Sybil attack) — создание множества фиктивных идентичностей, чтобы один субъект выглядел как многие независимые.
Петля обратной связи (feedback loop) — «ранжирование → поведение → переобучение»; источник самоусиления как качества, так и манипуляций/смещений.
Ложный консенсус — координированная сеть зеркал/источников, имитирующая независимое согласие (риск дезинформации).
Право быть забытым (right to be forgotten / erasure) — право субъекта на удаление/недоступность касающихся его данных.
Делистинг (delisting) — скрытие результата из выдачи по определённым запросам; документ остаётся в индексе и по прямой ссылке.
Деиндексация (deindexing) — полное удаление документа из индекса; первоисточник остаётся жив.
Erasure-конвейер — процесс приёма, балансировки, идентификации по субъекту, каскадного удаления и аудита запроса на удаление.
Объяснимость ранжирования — раскрытие политик/классов сигналов и суррогатных объяснений (атрибуция признаков, контрфактика) без выдачи весов.
Смещение (bias) — систематическое искажение данных/модели (выборки, представления, историческое, позиционное, петли, прокси-метки).
Позиционное смещение (position bias) — зависимость клика от позиции, а не только релевантности; снимается клик-моделями/propensity.
Справедливость ранжирования (fairness) — недискриминационное распределение качества/экспозиции; имеет конкурирующие операционализации (экспозиция/заслуги/индивидуальная/контрфактическая).
Exploration (исследование) — контролируемый показ неоптимальных по модели результатов ради несмещённых данных и разрыва петли.
Аудит по срезам (slice-based audit) — измерение качества/справедливости по группам, а не по среднему, с непрерывным мониторингом во времени.
Паспорт модели/данных (model card / datasheet) — документ о данных, метриках, срезах, разрывах и порогах мониторинга.

Связи с другими модулями

Опирается на Модуль 11 (поведенческие сигналы) — приватность регулирует сбор и хранение логов взаимодействия; накрутка ПФ — это отравление сигналов; позиционное смещение и петля обратной связи родом оттуда.
Опирается на Модуль 18 (персонализация) — профилирование пользователя ограничивается минимизацией, согласием и правом возражения; profile poisoning — отдельный класс манипуляции.
Связан с Модулем 9 (обучение ранжированию) — обучаемая модель наследует смещения данных; справедливость и аудит — требования к её жизненному циклу.
Связан с Модулем 10 (нейропоиск) — рост нейростадий усложняет пер-результатную объяснимость; отсюда суррогатные методы интерпретации.
Связан с Модулем 14 (метапоиск и федерация, сборка SERP) — маркировка рекламы, запрет самопредпочтения: спецблоки и платные размещения должны быть отличимы от органики.
Связан с Модулем 15 (группировка, схлопывание, разнообразие) — минимальная экспозиция групп, дедупликация зеркал против ложного консенсуса.
Связан с антиспам-тематикой — обнаружение Сивиллы, фильтрация накрутки до агрегации, доверие к источнику дополняют приёмы из глав про злоупотребления.

Материалы для углубления

Классические работы по реидентификации и провалам обезличивания (уникальность по квазиидентификаторам, атаки на «анонимные» датасеты).
Литература по моделям приватности: k-анонимность, l-разнообразие, t-близость и их критика.
Основополагающие работы по дифференциальной приватности (механизмы Лапласа/Гаусса, composition, локальная vs централизованная DP).
Обзоры по справедливости в ранжировании (fairness in ranking): определения экспозиции и заслуг, теоремы о несовместимости критериев справедливости.
Работы по дебиасингу из логов: propensity-взвешивание, unbiased learning-to-rank, exploration–exploitation в ранжировании.
Литература по Сивилловым атакам и обнаружению координированного поведения в распределённых системах и поиске.
Материалы по подотчётности ML: паспорта моделей и данных (model cards, datasheets for datasets), протоколы аудита и мониторинга дрейфа.
Обзоры по прозрачности ранжирования и регуляторным рамкам для онлайн-посредников (на уровне принципов: права субъекта, делистинг, маркировка рекламы).

kun_sergey · Сообщение **kun_sergey** » 10 июн 2026, 17:28

по поводу поведенческих сигналов из модуля 11 - а как тут балансировать приватность и качество ранжирования? если обезличивать клики слишком агрессивно, персонализация из 18 модуля начинает выдавать ерунду. где грань между анонимизацией и тем что выдача перестаёт быть полезной

rust98 · Сообщение **rust98** » 12 июн 2026, 01:06

мини история: мы как-то собирали dwell-time без явного согласия, потом приехал запрос на удаление данных по gdpr и оказалось что эти сигналы размазаны по всему индексу ранжирования. вычистить одного юзера из агрегированных факторов почти нереально, закладывайте это в архитектуру сразу

qemu6 · Сообщение **qemu6** » 12 июн 2026, 23:47

немного не согласен с подачей что борьба со злоупотреблениями это чисто про спам. накрутка поведенческих факторов это сейчас целая индустрия - боты эмулируют клики и dwell, и отличить их от живых людей по одним только логам почти невозможно без капчи или фингерпринта

Этика, приватность и борьба со злоупотреблениями

Этика, приватность и борьба со злоупотреблениями

Re: Этика, приватность и борьба со злоупотреблениями

Re: Этика, приватность и борьба со злоупотреблениями

Re: Этика, приватность и борьба со злоупотреблениями

Кто сейчас на конференции