Deep Learning

2012 рік став переломним у розвитку штучного інтелекту. Команда з Університету Торонто навчила нейронну мережу на базі даних ImageNet. Ця модель, названа AlexNet (на честь провідного дослідника Алекса Крижевського), продемонструвала революційні результати у розпізнаванні зображень. З цього моменту розпочалась ера deep learning | DL (глибинного навчання).

Deep learning — це спеціалізований напрямок machine learning, який навчає компʼютери робити те, що люди вміють робити від природи — вчитися на прикладах. Технологія deep learning заснована на штучних нейронних мережах (neural networks), які моделюють те, як людський мозок обробляє інформацію. Ці мережі складаються з шарів взаємопов'язаних вузлів (нейронів), які обробляють дані крок за кроком. Термін «deep/глибинне» означає багато шарів у мережі, кожен з яких допомагає системі розуміти дедалі складніші закономірності.

Deep learning потребує меншого залучення людини у порівнянні із традиційним машинним навчанням. Продовжуючи аналогію про фрукти, глибинне навчання — це показати дитині багато різних фруктів і дозволити їй самостійно знайти спільні риси та відмінності шляхом спостереження. Дорослий усе ще називає фрукти (якщо це контрольоване навчання — supervised learning), але не визначає чітко, на що слід звертати увагу:

Завдяки deep learning, ШІ зробив величезний стрибок вперед у таких сферах, як розпізнавання мови (speech recognition), класифікація зображень (image classification) і обробка мови (language processing). Також воно стало рушійною силою потужних інструментів генеративного штучного інтелекту, які ми бачимо сьогодні.

Залежно від того, як ці моделі взаємодіють і використовують надані навчальні дані, ми можемо умовно розділити їх на дві категорії: discriminative (дискримінативні) та generative (генеративні).