Про обробку інформації з обмеженим доступом штучним інтеллектом

Цкйво, спочатку я з цього листа просто поржав, але потім задумався — і стало реально страшно.
Не важливо від кого і кому лист, суть виділив жовтим: заборонити.
Не важливо від кого і кому лист, суть виділив жовтим: заборонити.
Трохи поясню для тих, хто не до кінця розуміє, як працюють LLM (штучні інтеллекти).
Ми даємо задачу:
 «Відредагуй текст “Як умру - то заховайте меня у могилі серед степу високого на вкраїні якийсь” на помилки».
 Модель бере масив уже завантажених даних з правопису, контекст про Шевченка і видає виправлений варіант. Для користувача на цьому все закінчується. Але не для розробника: він отримує анонімізований (ну вони так кажуть що інформація про користувача не збирається) масив даних у вигляді токенів — закодованих фрагментів тексту, яким reward-модель (автоматичний оцінювач відповідей) уже виставила оцінки. Частина цих оцінок може бути використана для подальшого донавчання моделі.
Або ні ¯\_(ツ)_/¯
Далі я роблю запит на редагування наступного тексту:
 «Комплекс Patriot розгорнуто в населеному пункті Оксенфурт для прикриття ТЕЦ» (назва міста вигадана).
 Але в моделі вже є ембединг (виправлення) для дуже схожого тексту:
 «Комплекс Patriot розгорнуто в населеному пункті Озерне для прикриття ТЕЦ».
 І вона відповість пану майору «правильну» версію. А звідки взявся цей текст? Очевидно, якийсь діловод кинув реальний документ на перевірку в бота. Страшно? Поки що не дуже.
Для ШІ нема різниці чи інформація ДСК чи ні, це просто набор токенів
Для ШІ нема різниці чи інформація ДСК чи ні, це просто набор токенів
Запитайте у Grok, хто красивіше стрибає — Ілон Маск чи Майкл Джордан. Або у DeepSeek — про «злочини КНР проти власного населення».
Ці моделі беруть запити, фільтрують їх і накопичують як матеріал для подальшої фільтрації та корекції відповідей. Наприклад, той самий Grok нещодавно доводив, що саме Ілон Маск «краще за всіх нюхає кокс». Це було зроблено в результаті неправильного налаштування моделі, яка мала ігнорувати факти і казати що Ілон краще за всіх. Після аналізу запитів і внутрішнього редагування він почав формулювати це вже інакше: що Ілон — «найчистіший серед усіх наркоманів». А що ще аналізують аналітики Grok? Ваші запити? БРку, яку діловод кинув на вичитку? Штатний розпис для вирівнювання стовпчиків?))
Грок, скоріш за все -найбільша розвідуваньна система для мультимільярдера на букву М
Грок, скоріш за все -найбільша розвідуваньна система для мультимільярдера на букву М
Наче очевидні речі, але страшно що хтось їх не розуміє настільки що треба окремо розказувати це... Не використовувати ШІ в 2026 це як не використовувати електроенергію у 1926: ще жити можна, але ті хто його не використовує - на 2 кроки позаду. Як виходжу з цього я: якщо питаю у чата щось військове — спочатку заміняю номери ВЧ і прізвища на рандомні. Він вичитує текст, а потім я повертаю все назад. Ну і, звісно, ніколи не фотографую ДСК-телеграми, щоб Gemini відцифровував текст))

Цей допис поки що не має жодних доповнень від автора/ки.

20 січ., 17:02

Отруєння мережі, чи це страшно?

Кіберзахист і таке інше
Кіберзахист і таке інше @CyberSecurity
30 січ., 11:35

Про захист паролів від таких як я :) доречі, я не хакер!

Кіберзахист і таке інше
Кіберзахист і таке інше @CyberSecurity
30 січ., 12:19

Час підбору пароля до вашого акаунта

Кіберзахист і таке інше
Кіберзахист і таке інше @CyberSecurity
30 січ., 12:35

Як ми вираховуємо який комп'ютер мережі заражено

Кіберзахист і таке інше
Кіберзахист і таке інше @CyberSecurity
Невідомий кабель згорів? І слава богам! Про небезпеку кабелів.
12 лют., 22:54

Невідомий кабель згорів? І слава богам! Про небезпеку кабелів.

Кіберзахист і таке інше
Кіберзахист і таке інше @CyberSecurity