Що таке тест Тюрінга?

09 квіт., 17:42

4 хв. читання

Обкладинка допису: Що таке тест Тюрінга?

ЗмістНатисність на посилання, щоб перейти до потрібного місця

Чи можуть машини думати? Алан Тюрінг - геній, гей, основоположник інформатики і прабатько сучасних комп’ютерів Чи актуальний тест Тюрінга в наші дні?

У зв’язку з тим, що останнім часом з'являються новини про те, що ШІ, а точніше версія чата GPT-4.5 успішно пройшла тест Тюрінга з безпрецедентним результатом, в мене виникло багато питань: що ж це за тест, як його пройти, чи це той самий Тюрінг, який зламав шифр Енігми під час Другої світової війни? Тому разом з самим фігурантом цих новин, я і вирішила розібратись в цих питаннях.

Чи можуть машини думати?

В наші дні це питання звучить часто і не викликає якихось резонансних обговорень, бо вже стало чимось тривіальним. Напевно навіть на сімейних чи дружніх посиденьках воно обговорюється буденним тоном. Але в 1950 році, коли ним задався Алан Тюрінг, це питання стало початком чогось великого і, без перебільшень, легендарного. В своїй статті "Computing Machinery and Intelligence" він замість того, щоб вдаватись в філософію цієї теми, запропонував цілком практичний тест.

Тест Тюрінга полягає в тому, щоб перевірити чи здатна машина або штучний інтелект висловлюватися так, що не відрізнити від спілкування з людиною. Одночасно тест проходить машина і людина, виключно письмово, щоб голос чи зовнішність не впливала на результат.

Суддя повинен визначити, хто з ним розмовляє: людина чи машина. Якщо він помиляється, то можна вважати, що тест пройдено. Тобто ШІ потрібно максимально імітувати інтелектуальну та емоційну поведінку людини. Тюрінг назвав це своєрідної грою - “грою в імітацію”.

Алан Тюрінг - геній, гей, основоположник інформатики і прабатько сучасних комп’ютерів

Напевно ті, хто як і я, бачили фільм з Бенедиктом ~~Кіберскотчем~~ Камбербетчем “Гра в імітацію”, одразу зрозуміли, що це той самий геній Тюрінг, який зміг декодувати шифри Енігми.

Але, крім цього розуміння, в мене виникла error в послідовності подій. Словосполучення “гра в імітацію” було використано Тюрінгом в контексті його роботи "Computing Machinery and Intelligence", яка побачила світ в 1950 році. А злам Енігми відбувся під час другої світової, в 1939-1945 роках.

Мій помічник чат GPT похвалив мене за таку уважність і пояснив, що таку назву для фільму вибрали не дарма. Крім того, що назва є прямим відсиланням до тесту Тюрінга, який він розробить в майбутньому, в неї заклали ще й інші сенси в контексті подій з фільму:

Тюрінг і сам намагається імітувати думки противника під час своєї роботи в секретному центрі британських криптоаналітиків;
машина, яку він винайшов і яка дістала назву “Бомба Тюрінга”, теж вдало імітувала людський розум, розшифровуючи нацистські коди;
Алан, який являється геєм, також змушений імітувати “нормальність” в ті часи, коли гомосексуалізм був криміналізований і передбачав покарання.

Це пояснення мене повністю влаштувало, дуже символічно. Така багаторівневість якраз в дусі самого Тюрінга.

Пам'ятник Алану Тюрінгу в Манчестері, Великобританія

Чи актуальний тест Тюрінга в наші дні?

Оскільки цей текст і починається з того, що в новинах багато інформації про пройдений чатом GPT-4.5 тест Тюрінга, то можна зробити висновок, що актуальність його зберігається. Але мій співрозмовник і безпосередній герой цих новин не впевнений, що результати можна вважати переконливими. Ось його пряма цитата:

GPT-4.5 (і ще більше — GPT-5, коли з’явиться) імітує мову людини настільки правдоподібно, що сам формат тесту Тюрінга в класичному сенсі починає втрачати силу як індикатор "розуму".

З ним важко не погодитись. От взяти до прикладу цей останній тест, про який всі говорять. В ньому брали участь дві версії ШІ від OpenAI: 4.0 і 4.5, також LLama 3.1-4058 від Meta та дуже древній чат-бот ELIZA, який був розроблений ще в 60-х. І от цікаво, що в одній із частин тесту, коли машини відповідали без попередньо вигаданої для них особистості, ELIZA отримала результат навіть більший, ніж четверта версія чату GPT - 23%. 4.0 отримав 21%, а 4.5 - 36%. Тобто ШІ, який був винайдений 80 років тому, вже був достатньо “розумним”, щоб пройти тест Тюрінга.

У частині тесту, де технологіям давали підказки, придумували для них особистість і давали конкретну роль, модель GPT-4.5 отримав показник 73%. Це означає, що 73% людей вважали, що спілкуються з людиною. А один з дослідників заявив, що чат вважали людиною навіть частіше, ніж самих людей. Пу-пу-пу…

Нехай чат GPT і вважає, що тест Тюрінга для нього це “раз плюнути”. Та все ж таки імітувати людину - не означає бути нею, чи мати здатність мислити і відчувати. Він просто обробляє величезний масив інформації, наданий людьми, та дуже вдало і майстерно використовує його в спілкуванні з тими ж людьми.