ИИ с двойным дном. Дообучение больших моделей — это долго, дорого и рискованно: нейросеть может забыть старое или, наоборот, сохранить то, что нужно скрыть (например, секретные данные)

20 декабря 2025, 08:04

ИИ с двойным дном

Дообучение больших моделей это долго, дорого и рискованно: нейросеть может забыть старое или, наоборот, сохранить то, что нужно скрыть (например, секретные данные). DARPA давно ищет способ сделать ИИ управляемым, а не черным ящиком.

Недавно опубликованный патент от ученых Georgia Tech (грант DARPA) предлагает решение: отказаться от переобучения и превратить знания в сменные файлы.

Авторы придумали способ выделять конкретный навык будь то математика или наведение дрона в отдельный компактный файл (патч).

Хотя сама идея адаптеров (LoRA) не нова, инновация патента в алгоритме чистого разделения навыков.

-Обычный LoRA умеет только добавлять знания поверх старых (грязный слой).

-Технология DARPA умеет хирургически разделять навыки, чтобы они не смешивались. Это позволяет безопасно вычитать знания, не ломая логику модели.

Два режима работы:

1. LEARN (Добавление): Загрузили файл (550 Мб) модель мгновенно поумнела.

2. UNLEARN (Удаление): Вычли файл модель математически потеряла доступ к конкретному навыку, оставаясь рабочей.

Это превращает ИИ в конструктор LEGO, где детали (навыки) идеально подогнаны и не конфликтуют.

Три сценария:

1. Экспортный контроль (Необратимая зачистка): США смогут продавать обезжиренные версии ИИ. Режим UNLEARN позволяет хирургически вырезать навыки кибератак. Восстановить их без исходного картриджа невозможно у покупателя на руках просто нет нужных весов.

2. Маскировка (Идеальное двойное дно): Решение для дронов. На борту стерильная гражданская модель (проверка кода ничего не найдет). Перед атакой загружается микро-патч с тактикой. После удара патч стирается, оставляя идеально чистого мирного курьера.

3. Иерархия доступа (Без конфликтов): Одна модель для всех. Рядовой видит инструкции, офицер подключает свой модуль и видит секреты. Благодаря новому алгоритму, секретный модуль не ломает базовую логику модели и не вызывает глюков.

Авторы признают проблему переплетения знаний. Удаляя химию взрывчатки, можно случайно повредить школьную химию. Чем больше таких правок, тем нестабильнее модель она может превратиться в чудовище Франкенштейна и начать галлюцинировать.

Эра черных ящиков закончилась. Началась эра ящиков с двойным дном.

DARPA&CIA

Источник: Telegram-канал "Secrets DARPA and CIA", репост Юрий Баранчик

Это интересно

Воздушные и легкие кексы с сыром: новые горизонты здоровья и вкуса

Как защитить растения от тли в начале лета: подробные советы и рекомендации

Как приготовить идеальные домашние пельмени: секреты и советы

10 минут на полезный салат: просто, быстро и вкусно!

Как очистить трубы без химии: эффективный домашний способ

Эффективная дрожжевая подкормка для огурцов: как решить проблемы роста

От чувствительности к здоровью: как восстановить эмаль зубов в домашних условиях

Янтарное наслаждение: как создать прозрачное яблочное варенье в домашних условиях

Праздничные гастрономические приключения Москвы

Летний вкус: освежающий холодник на кефире как идеальное блюдо теплых дней

Больше новостей на Nao-news.ru