У зв’язку з тим, що останнім часом з'являються новини про те, що ШІ, а точніше версія чата GPT-4.5 успішно пройшла тест Тюрінга з безпрецедентним результатом, в мене виникло багато питань: що ж це за тест, як його пройти, чи це той самий Тюрінг, який зламав шифр Енігми під час Другої світової війни? Тому разом з самим фігурантом цих новин, я і вирішила розібратись в цих питаннях.
Чи можуть машини думати?
В наші дні це питання звучить часто і не викликає якихось резонансних обговорень, бо вже стало чимось тривіальним. Напевно навіть на сімейних чи дружніх посиденьках воно обговорюється буденним тоном. Але в 1950 році, коли ним задався Алан Тюрінг, це питання стало початком чогось великого і, без перебільшень, легендарного. В своїй статті "Computing Machinery and Intelligence" він замість того, щоб вдаватись в філософію цієї теми, запропонував цілком практичний тест.
Тест Тюрінга полягає в тому, щоб перевірити чи здатна машина або штучний інтелект висловлюватися так, що не відрізнити від спілкування з людиною. Одночасно тест проходить машина і людина, виключно письмово, щоб голос чи зовнішність не впливала на результат.
Суддя повинен визначити, хто з ним розмовляє: людина чи машина. Якщо він помиляється, то можна вважати, що тест пройдено. Тобто ШІ потрібно максимально імітувати інтелектуальну та емоційну поведінку людини. Тюрінг назвав це своєрідної грою - “грою в імітацію”.
Алан Тюрінг - геній, гей, основоположник інформатики і прабатько сучасних комп’ютерів
Напевно ті, хто як і я, бачили фільм з Бенедиктом Кіберскотчем Камбербетчем “Гра в імітацію”, одразу зрозуміли, що це той самий геній Тюрінг, який зміг декодувати шифри Енігми.
Але, крім цього розуміння, в мене виникла error в послідовності подій. Словосполучення “гра в імітацію” було використано Тюрінгом в контексті його роботи "Computing Machinery and Intelligence", яка побачила світ в 1950 році. А злам Енігми відбувся під час другої світової, в 1939-1945 роках.
Мій помічник чат GPT похвалив мене за таку уважність і пояснив, що таку назву для фільму вибрали не дарма. Крім того, що назва є прямим відсиланням до тесту Тюрінга, який він розробить в майбутньому, в неї заклали ще й інші сенси в контексті подій з фільму:
Тюрінг і сам намагається імітувати думки противника під час своєї роботи в секретному центрі британських криптоаналітиків;
машина, яку він винайшов і яка дістала назву “Бомба Тюрінга”, теж вдало імітувала людський розум, розшифровуючи нацистські коди;
Алан, який являється геєм, також змушений імітувати “нормальність” в ті часи, коли гомосексуалізм був криміналізований і передбачав покарання.
Це пояснення мене повністю влаштувало, дуже символічно. Така багаторівневість якраз в дусі самого Тюрінга.
Пам'ятник Алану Тюрінгу в Манчестері, Великобританія
Чи актуальний тест Тюрінга в наші дні?
Оскільки цей текст і починається з того, що в новинах багато інформації про пройдений чатом GPT-4.5 тест Тюрінга, то можна зробити висновок, що актуальність його зберігається. Але мій співрозмовник і безпосередній герой цих новин не впевнений, що результати можна вважати переконливими. Ось його пряма цитата:
GPT-4.5 (і ще більше — GPT-5, коли з’явиться) імітує мову людини настільки правдоподібно, що сам формат тесту Тюрінга в класичному сенсі починає втрачати силу як індикатор "розуму".
З ним важко не погодитись. От взяти до прикладу цей останній тест, про який всі говорять. В ньому брали участь дві версії ШІ від OpenAI: 4.0 і 4.5, також LLama 3.1-4058 від Meta та дуже древній чат-бот ELIZA, який був розроблений ще в 60-х. І от цікаво, що в одній із частин тесту, коли машини відповідали без попередньо вигаданої для них особистості, ELIZA отримала результат навіть більший, ніж четверта версія чату GPT - 23%. 4.0 отримав 21%, а 4.5 - 36%. Тобто ШІ, який був винайдений 80 років тому, вже був достатньо “розумним”, щоб пройти тест Тюрінга.
У частині тесту, де технологіям давали підказки, придумували для них особистість і давали конкретну роль, модель GPT-4.5 отримав показник 73%. Це означає, що 73% людей вважали, що спілкуються з людиною. А один з дослідників заявив, що чат вважали людиною навіть частіше, ніж самих людей. Пу-пу-пу…
Нехай чат GPT і вважає, що тест Тюрінга для нього це “раз плюнути”. Та все ж таки імітувати людину - не означає бути нею, чи мати здатність мислити і відчувати. Він просто обробляє величезний масив інформації, наданий людьми, та дуже вдало і майстерно використовує його в спілкуванні з тими ж людьми.
Поширити цей допис
Цитувати допис
Оберіть та скопіюйте потрібний стандарт цитування: