"1"

У минулому році знаменитий фізик-теоретик Стівен Хокінг заявив, що вдосконалення штучного інтелекту стане «або кращою, або гіршою подією для всього людства». Всі ми дивилися «Термінатора» і всі ми чудово уявляємо, яким апокаліптичним пеклом може стати наше існування, якщо така маюча самосвідомість ШІ-система, як «Скайнет», одного разу вирішить, що людства вона більше не потребує. І останні результати роботи нової ШІ-системи від компанії DeepMind (належить Google) лише в черговий раз нагадують нам про необхідність бути вкрай обережними при виробництві роботів майбутнього.

У дослідженнях, що проводилися в кінці минулого року, ШІ від DeepMind знайшов і продемонстрував можливість свого навчання незалежно від того, що закладено в його пам’ять, а ще переміг кращих в світі гравців в логічну гру го. Крім цього, він удосконалював свої навички в читанні по губах та імітуванні людського голосу.

В рамках же останніх випробувань системи дослідники перевіряли «її прагнення» до співпраці. Тести показали, коли ШІ DeepMind «відчуває», що ось-ось програє, то для уникнення програшу він починає вибирати нові і «вкрай агресивні» стратегії. Команда Google провела з ШІ 40 мільйонів сесій в простій комп’ютерній грі Gathering, де гравцю було потрібно зібрати якомога більше потрібних фруктів. ШІ DeepMind керував двома «гравцями-агентами» (синім кубиком і червоним кубиком). Інженери Google дали системі задачу влаштувати змагання між «агентами» і зібрати стільки віртуальних яблук (зелених квадратиків), скільки вийде.

До часу, поки «агенти» могли без проблем збирати фрукти, наявні у великій кількості, все йшло гладко. Але як тільки запас яблук скорочувався, поведінка «агентів» ставала «агресивною». Вони стали активніше використовувати засіб (лазерний промінь), який допомагав вибити противника за ігровий екран і потім самому зібрати всі яблука:

Що цікаво, за вибивання противника з поля за допомогою лазерного променя ніякої додаткової нагороди не пропонувалося. Вибитий супротивник лише деякий час знаходиться за межами екрану, в той час як більш успішний противник мав можливість безперешкодно зібрати побільше віртуальні яблука.

Якби «агенти» не використали лазерні промені, то теоретично кількість зібраних ними яблук була б однаковою. Це в принципі і відбувалося, коли в якості «агентів» використовувалися більш низькорівневі і «менш інтелектуальні» варіанти DeepMind. Більш агресивна поведінка, шкідництво і жадібність стали проявлятися тільки тоді, коли команда Google стала використовувати більш складні форми DeepMind.

Коли дослідники використовували в якості «агентів» простіші мережі DeepMind, то між ними зазначалася наявність «атмосфери більш доброзичливого співіснування на ігровому полі». Однак, коли управління агентами передавалося все більш складним формам мереж, ШІ ставав агресивнішим і став намагатися заздалегідь вибити опонента з ігрового поля, щоб першим швидше дістатися до левової частки видобутку з віртуальних яблук. Вчені Google припускають, що чим розумніший «агент», тим він ефективніше здатний навчатися, адаптуватися до умов середовища і доступних методів, і в кінцевому підсумку приходити до використання найбільш агресивної тактики для перемоги.

«Ця модель показує, що результатом навчання та адаптації до умов навколишнього середовища є прояв деяких аспектів, властивих людській поведінці», – говорить Джоель З. Лейбо, один з дослідників, які проводили цей експеримент.

«Менш агресивна поведінка проявлялося тільки при навчанні і знаходженні в безпечному середовищі, з меншою ймовірністю наслідків після тих чи інших дій. Жадібність же, в свою чергу, відбивалася в прагненні обігнати суперника і самостійно зібрати всі яблука».

Після «збору врожаю» DeepMind запропонували зіграти в іншу гру, під назвою Wolfpack. Цього разу в ній були присутні відразу три ШІ-агенти: два грали роль вовків, а третій – роль здобичі. На відміну від гри Gathering, нова гра всіляко сприяла співпраці між вовками. По-перше, так легше зловити здобич, а по-друге, якщо обидва «вовки» знаходилися поруч із загнаної здобиччю, вони обидва отримували якусь нагороду, в незалежності від того, хто саме її спіймав.

«Ідея полягає в тому, що здобич може бути небезпечною. Крім того, може самотній вовк і здатний її загнати, але є ризик її втрати в результаті нападу падальщиків», – пояснює команда.

«Але якщо обидва вовки заганяють здобич разом, то вони здатні краще її захищати від падальщиків і завдяки цьому отримують підвищену нагороду».

У загальному і цілому з гри Gathering ШІ DeepMind усвідомив, що агресія і егоїзм є найбільш ефективними стратегіями для отримання потрібного результату в конкретно взятому середовищі. З Wolfpack та ж система зрозуміла, що співпраця, на відміну від індивідуальних спроб, може стати ключем до більш цінної нагороди в певних ситуаціях. І хоча описані вище тестові середовища є лише елементарними комп’ютерними іграми – основний посил зрозумілий вже зараз. Візьміть різні ШІ, що володіють конкуруючими інтересами в реальних ситуаціях, помістіть в одне середовище, і, можливо, якщо їх завдання не компенсуються спільною метою, результатом може стати справжня війна. Особливо, якщо людина, як одна з ланок у досягненні цієї мети, буде виключена.

Як приклад просто уявіть собі світлофори, керовані ШІ, і безпілотні автомобілі, які намагаються самостійно знайти найшвидший маршрут. Кожен виконує свої завдання з метою отримання найбільш безпечного і найбільш ефективного результату для суспільства.

Незважаючи на «дитячі» роки DeepMind і відсутність якого б то не було стороннього критичного аналізу його можливостей, результати його випробувань наводять на такі думки: навіть якщо ми їх і створюємо, це зовсім не означає, що в роботах і ШІ-системах буде автоматичним чином закладено прагнення ставити наші людські інтереси вище їх власних. Тому нам самим необхідно «закладати доброзичливість» в природу машин і передбачити будь-які «лазівки», які можуть дозволити їм дістатися до тих самих лазерних променів.

Одна з основних тез ініціативної групи OpenAI, спрямованої на вивчення питань етики штучного інтелекту, якось пролунала в 2015 році в такий спосіб:

«Сьогоднішні ШІ-системи мають дивні, але вузькоспеціалізовані можливості. І найімовірніше, ми ще довгий час не будемо їх стримувати в своєму вдосконаленні. Принаймні до тих пір, поки їх можливості у вирішенні практично кожного інтелектуального завдання не стануть перевершувати людські. Складно уявити, який саме рівень користі зможе принести ШІ людського рівня для суспільства, так само, як і складно уявити, якої шкоди він зможе завдати суспільству при недбалому ставленні до його створення і використання».

Нагадаємо також, що штучний інтелект DeepMind отримав «прискорювач» процесу навчання.

Коментарі закрито.

Поділитися

Двогодинна презентація WWDC 2016 за 7 хвилин

На конференції Worldwide Developers Conference 2016, що відкрилася в Каліфорнії 13 червня, компанія Apple представила нову, десяту за рахунком версію операційної системи iOS, а також черговий реліз настільної платформи macOS Sierra. Apple називає дані поновлення найбільшими: у них виробник зосередився не тільки на оптимізації, але і на поліпшенні функціоналу з акцентом на простоту і зручність. Ресурс […]

Apple представила новий додаток TV, що об’єднує Apple TV та iOS-пристрої

На вчорашній презентації Apple, крім «залізних» новинок, представила і новий додаток, покликаний дати користувачам більше зручностей при перегляді ТБ-контенту. Додаток отримав абсолютно нехитру назву – просто «TV». Поширюватися він буде безкоштовно, і вийде для iOS і tvOS в грудні цього року. У додатку TV користувачі можуть переглядати будь-який телевізійний контент на своїх iOS-гаджетах, при цьому підтримується […]

AOC і Porsche представили еталонний монітор 2017 року

Відомий виробник моніторів AOC спільно зі студією дизайну F.A Porsche представили два монітори з діагоналлю 24 і 27 дюймів. Обидва з роздільною здатністю Full HD і практично без рамок. Головна їхня фішка: дроти не стирчать з моніторів. Компанія стверджує, що монітор – це перш за все екран, зовнішній вигляд якого не повинні псувати непривабливі кабелі, […]