ИИ с двойным дном. Дообучение больших моделей — это долго, дорого и рискованно: нейросеть может забыть старое или, наоборот, сохранить то, что нужно скрыть (например, секретные данные)

20 декабря 2025, 08:04

ИИ с двойным дном

Дообучение больших моделей это долго, дорого и рискованно: нейросеть может забыть старое или, наоборот, сохранить то, что нужно скрыть (например, секретные данные). DARPA давно ищет способ сделать ИИ управляемым, а не черным ящиком.

Недавно опубликованный патент от ученых Georgia Tech (грант DARPA) предлагает решение: отказаться от переобучения и превратить знания в сменные файлы.

Авторы придумали способ выделять конкретный навык будь то математика или наведение дрона в отдельный компактный файл (патч).

Хотя сама идея адаптеров (LoRA) не нова, инновация патента в алгоритме чистого разделения навыков.

-Обычный LoRA умеет только добавлять знания поверх старых (грязный слой).

-Технология DARPA умеет хирургически разделять навыки, чтобы они не смешивались. Это позволяет безопасно вычитать знания, не ломая логику модели.

Два режима работы:

1. LEARN (Добавление): Загрузили файл (550 Мб) модель мгновенно поумнела.

2. UNLEARN (Удаление): Вычли файл модель математически потеряла доступ к конкретному навыку, оставаясь рабочей.

Это превращает ИИ в конструктор LEGO, где детали (навыки) идеально подогнаны и не конфликтуют.

Три сценария:

1. Экспортный контроль (Необратимая зачистка): США смогут продавать обезжиренные версии ИИ. Режим UNLEARN позволяет хирургически вырезать навыки кибератак. Восстановить их без исходного картриджа невозможно у покупателя на руках просто нет нужных весов.

2. Маскировка (Идеальное двойное дно): Решение для дронов. На борту стерильная гражданская модель (проверка кода ничего не найдет). Перед атакой загружается микро-патч с тактикой. После удара патч стирается, оставляя идеально чистого мирного курьера.

3. Иерархия доступа (Без конфликтов): Одна модель для всех. Рядовой видит инструкции, офицер подключает свой модуль и видит секреты. Благодаря новому алгоритму, секретный модуль не ломает базовую логику модели и не вызывает глюков.

Авторы признают проблему переплетения знаний. Удаляя химию взрывчатки, можно случайно повредить школьную химию. Чем больше таких правок, тем нестабильнее модель она может превратиться в чудовище Франкенштейна и начать галлюцинировать.

Эра черных ящиков закончилась. Началась эра ящиков с двойным дном.

DARPA&CIA

Больше новостей на Nao-news.ru