Синаптична пластичність: як синапси навчаються

1. Постулат Хебба і Хеббівське навчання

У 1949 році канадський психолог Дональд Хебб написав одне з найвпливовіших речень у нейронауці: "Коли аксон клітини A достатньо близький до того, щоб збудити клітину B, і неодноразово або постійно бере участь у її активації, відбувається деякий процес росту або метаболічна зміна в одній або обох клітинах, завдяки якій ефективність A як однієї з клітин, що активують B, збільшується." Це стало відомим як постулат Хебба, який часто скорочують до "нейрони, що активуються разом, зв'язуються разом."

Математично постулат Хебба можна записати як правило оновлення синаптичної ваги. Нехай w_ij — це сила синапсу від пресинаптичного нейрона j до постсинаптичного нейрона i, а x_j та y_i — відповідні рівні активності. Найпростіше безперервне Хеббівське правило:

dw ij /dt = η \cdot y i \cdot x j де η — мала позитивна швидкість навчання.

Це правило має негайну проблему: воно є нестабільним. Оскільки позитивна активність завжди збільшує позитивні ваги, петля позитивного зворотного зв'язку призводитиме до необмеженого зростання ваг — лавинного збудження. Всі практичні Хеббівські правила навчання включають нормалізацію або члени загасання для запобігання цьому.

Правило коваріації

Витончений спосіб виправлення — це використовувати відхилення від середньої активності, а не абсолютні значення частоти розрядів. Правило коваріації (Сейновскі, 1977) замінює активності їхніми відхиленнями від середнього:

dw ij /dt = η \cdot (y i - ȳ i) \cdot (x j - x̄ j) Це дозволяє w зменшуватись, коли обидві клітини нижче середнього, реалізуючи форму анти-Хеббівської депресії.

Правило коваріації відображає статистичну концепцію кореляції: синаптична вага збігається до коваріації пре- та постсинаптичної активності, роблячи його концептуальним попередником аналізу головних компонент (PCA) у нейронних мережах.

Чому Хебб має значення: Попри свою простоту, Хеббівська концепція надихнула практично всі сучасні правила навчання — від персептрона і зворотного поширення помилки до контрастивного Хеббівського навчання і предиктивного кодування. Фраза "активуються разом — зв'язуються разом" залишається найбільш цитованим принципом в обчислювальній нейронауці.

2. Довгострокова потенціація та депресія

Постулат Хебба залишався переважно теоретичним аж до 1973 року, коли Тімоті Блісс та Терьє Леомо відкрили довгострокову потенціацію (ДПП) у гіпокампі кроленят. Нанесення короткого розряду високочастотної стимуляції (тетанічна стимуляція) на перфорантний шлях виробило стійке — іноді постійне — збільшення синаптичної ефективності, що тривало годинами до тижнів. Це стало першим прямим експериментальним свідченням того, що синаптична сила може надовго змінюватися під дією активності.

Доповнюючим явищем є довгострокова депресія (ДПД), підтверджена Масао Іто у 1982 році в мозочку: тривала низькочастотна спільна активація паралельних волокон і волокон, що видряпуються, спричинила тривале зниження синаптичних відповідей клітин Пуркін'є. ДПД розуміється тепер як ключовий механізм мозочкового моторного навчання.

Молекулярний механізм ДПП

Домінуюча модель індукції ДПП задіює NMDA-рецептор, який виступає детектором збіжності. Іонний канал NMDA-рецептора потребує двох одночасних умов для відкриття:

Пресинаптичне вивільнення глутамату, що зв'язується з рецептором.
Постсинаптична деполяризація, що витісняє іон Mg²⁺, який блокує пору каналу у стані спокою.

Коли обидві умови виконані, Ca²⁺ надходить до постсинаптичної клітини, активуючи кінази (CaMKII, PKC), що фосфорилюють AMPA-рецептори та вставляють додаткові AMPA-рецептори в мембрану, збільшуючи синаптичну провідність. Цей молекулярний механізм безпосередньо реалізує постулат Хебба на біофізичному рівні: синапс зміцнюється лише тоді, коли пре- та постсинаптичні нейрони активні одночасно.

Властивість	ДПП	ДПД
Протокол стимуляції	Високочастотний розряд (тетанус)	Тривала низькочастотна стим.
Зміна синаптичної ваги	Збільшення (+)	Зменшення (−)
Сигнал Ca²⁺	Великий, швидкий транзієнт	Невеликий, тривалий підйом
Ключові кінази/фосфатази	CaMKII, PKC (кінази)	PP1, PP2B (фосфатази)
Трафік AMPA-рецепторів	Включення до синапсу	Інтерналізація з синапсу
Ділянка мозку (приклад)	Гіпокамп CA1	Мозочок, смугасте тіло

Гіпотеза Ca²⁺ надає єдине пояснення для ДПП і ДПД: великі транзієнти Ca²⁺ активують кінази і викликають ДПП, тоді як помірне, тривале підвищення Ca²⁺ переважно активує фосфатази і викликає ДПД. Результат залежить від амплітуди та часового перебігу сигналу Ca²⁺, а не просто від його наявності.

3. Пластичність залежна від часу спайків

Протоколи тетанічної стимуляції, що використовуються для індукції ДПП в ранніх експериментах, є фармакологічними прийомами — вони не відображають того, як нейрони насправді спілкуються під час поведінки. Реальні нейрони генерують потенціали дії у нерегулярні моменти, і більш фізіологічно доречне питання: як точний час окремих пресинаптичних і постсинаптичних спайків визначає, чи потенціюється, чи пригнічується синапс?

Пластичність, залежна від часу спайків (STDP), — це відкриття того, що зміни синаптичних ваг залежать від часового інтервалу між часами пресинаптичного та постсинаптичного спайків з точністю до мілісекунд. Ключові експерименти, проведені незалежно Марком та ін. (1997) у корковому зрізі та Бі та Пу (1998) у культурі гіпокампальних нейронів, демонстрували причинну асиметрію:

Якщо пресинаптичний спайк надходить до постсинаптичного (причинна послідовність, Δt = t_post − t_pre > 0), синапс потенціюється (ДПП).
Якщо пресинаптичний спайк надходить після постсинаптичного (анти-причинна послідовність, Δt < 0), синапс пригнічується (ДПД).

Величина зміни ваги спадає експоненційно зі збільшенням |Δt|, наближаючись до нуля для часових інтервалів, що перевищують ~100 мс. Це причинне правило часто описується як темпоральне Хеббівське правило: синапс зміцнюється, коли він, ймовірно, міг спричинити постсинаптичний спайк.

Хронологія відкриття: Явище було натякнуто Леві та Стюардом (1983) у зубчастій звивині, піонеровано Маджі та Джонстоном (1997) в одиночних пірамідних клітинах, і отримало остаточну характеристику від Бі та Пу (1998). Термін "STDP" популяризували Еббот та Нельсон (2000).

4. Вікно навчання STDP

Залежність між часовим інтервалом Δt і зміною ваги Δw називається вікном навчання STDP (або ядром STDP). Класична асиметрична експоненційна форма:

Δw(Δt) = A₊ · exp(−Δt / τ₊) при Δt > 0 (область ДПП)\n Δw(Δt) = −A₋ · exp(+Δt / τ₋) при Δt < 0 (область ДПД)\n\n де:\n Δt = t_post − t_pre (мс)\n A₊ ≈ 0.005 – 0.1 (амплітуда потенціації)\n A₋ ≈ A₊ · 1.05 (депресія злегка переважає)\n τ₊ ≈ 20 мс (постійна часу ДПП)\n τ₋ ≈ 20 мс (постійна часу ДПД)

Біологічно вимірювані параметри значно варіюють у різних типах синапсів і ділянках мозку. Пірамідні нейрони кіркового шару 5 виявляють τ₊ ≈ 17 мс і τ₋ ≈ 34 мс (Шостром та ін., 2001), тоді як культури гіпокампа демонструють більш симетричні вікна. Деякі синапси демонструють симетричний STDP (і причинні, і анти-причинні спайки дають ДПП), тоді як гальмівні синапси часто мають зворотний STDP із перекинутою полярністю.

Апроксимація найближчого сусіда

У послідовності спайків кожен постсинаптичний спайк взаємодіє з кількома пресинаптичними. Правило взаємодії найближчого сусіда враховує лише найостанніший пре- та пост-спайк для кожного оновлення, що суттєво спрощує реалізацію, зберігаючи більшу частину біологічної феноменології. Повна взаємодія всі-з-усіма підсумовує внески від усіх попередніх пар спайків.

Реалізація на основі слідів

При кожному пресинаптичному спайку: r_pre += 1 (збільшити пре-слід) w += -A₋ \cdot o_post (ДПД: пост нещодавно активовано) При кожному постсинаптичному спайку: o_post += 1 (збільшити пост-слід) w += +A₊ \cdot r_pre (ДПП: пре нещодавно активовано) Між спайками: dr_pre/dt = -r_pre / τ₊ do_post/dt = -o_post / τ₋

5. Правило BCM і ковзний поріг

Чисті Хеббівські правила нестабільні і не можуть розрізняти вибіркову та невибіркову потенціацію. У 1982 році Елі Біненсток, Леон Купер та Пол Мунро запропонували правило BCM (Bienenstock-Cooper-Munro), яке ввело ключове нововведення: ковзний поріг модифікації θ_M, що розділяє области ДПП і ДПД.

dw i /dt = η \cdot x i \cdot φ(y, θ M) φ(y, θ M) = y \cdot (y - θ M) де: y = постсинаптична активність (частота розрядів) x i = пресинаптичний вхід від нейрона i θ M = поріг модифікації (ковзає динамічно)

Ключова особливість — ковзний поріг: θ_M сам еволюціонує як надлінійна функція середньої постсинаптичної активності (зазвичай θ_M ∝ ⟨y²⟩). Коли клітина хронічно недоактивна, θ_M знижується, полегшуючи індукцію ДПП. Коли клітина гіперактивна, θ_M зростає, сприяючи ДПД. Це забезпечує:

Стабільність — ковзний поріг запобігає лавинній потенціації.
Вибірковість — потенціюються лише входи, корельовані з високою постсинаптичною активністю; інші пригнічуються.
Конкуренція — різні синапси конкурують за фіксований бюджет постсинаптичної активації.

Правило BCM успішно пояснило пластичність домінування очного представлення у зоровій корі і передбачило, що монокулярна депривація послаблює синапси позбавленого ока, зміцнюючи синапси відкритого ока — передбачення, підтверджене Ріттенхаусом та ін. (1999).

BCM і машинне навчання: Правило BCM є біологічно правдоподібним попередником сучасних алгоритмів самонормалізованого навчання. Механізм ковзного порогу концептуально пов'язаний з адаптивними швидкостями навчання і пакетною нормалізацією у глибокому навчанні: обидва запобігають монополізації репрезентаційної ємності одним нейроном.

6. Гомеостатична пластичність

Хеббівські та STDP-правила за своєю природою є Хеббівськими — залежні від активності зміни, що можуть підсилювати відмінності та створювати нестабільність без збалансованих механізмів контролю. Мозок вирішує цю проблему за допомогою сімейства повільніших механізмів негативного зворотного зв'язку, які разом називають гомеостатичною пластичністю, — вони підтримують активність нейронів і кіл у функціональних межах.

Синаптичне масштабування

У визначальних експериментах Туріджано та ін. (1998) блокували всі потенціали дії в культурі кіркових нейронів на 48 годин і виявили, що струми через AMPA-рецептори рівномірно збільшувались (масштабувались вгору) у всіх синапсах. Навпаки, хронічна надмірна активація викликала пропорційне масштабування вниз. Це синаптичне масштабування зберігає відносний паттерн синаптичних ваг (сліди пам'яті), регулюючи абсолютний коефіцієнт підсилення:

w i \to α \cdot w i (мультиплікативне масштабування) α підлаштовується так, що ⟨y⟩ \to y target α збільшується, коли ⟨y⟩ < y target (тихо \to масштаб вгору) α знижується, коли ⟨y⟩ > y target (гучно \to масштаб вниз)

Пластичність власної збудливості

Окрім синаптичного масштабування, нейрони також регулюють власну внутрішню збудливість — перетворення синаптичного вводу у вихідні розряди — шляхом модуляції щільності та кінетики потенціалзалежних іонних каналів. Це надає другий гомеостатичний важіль, незалежний від корекції синаптичних ваг.

Разом Хеббівська (швидка, специфічна, навчальна) і гомеостатична (повільна, глобальна, дозволяюча) пластичності утворюють систему двох часових масштабів, здатну одночасно навчатися специфічним паттернам і зберігати стабільність.

Механізм	Часовий масштаб	Ефект	Обчислювальна роль
STDP	Мс–секунди	Специфічна для синапсу Δw	Навчання тимчасових послідовностей
ДПП/ДПД	Хвилини–години	Специфічна для синапсу Δw	Асоціативна пам'ять
Ковзний θ BCM	Години–дні	Зміщення порогу	Вибірковість, конкуренція
Синаптичне масштабування	Години–дні	Глобальне мультиплікативне	Стабільність, збереження паттерну
Пластичність збудливості	Години–дні	Підсилення збудливості	Підтримка цільової частоти розрядів

7. Динаміка синаптичних ваг і стабільність

Повна модель синаптичної пластичності повинна відповісти на фундаментальне питання: чи збігаються ваги до стабільних значень, чи вони дрейфують нескінченно? Аналіз стабільності динаміки ваг пов'язує правила пластичності з їхніми довгостроковими наслідками.

Еволюція ваги при STDP

Для одного синапсу, що керується незалежними потоками спайків Пуассона з частотами ν_pre та ν_post, середня зміна ваги за одиницю часу при STDP:

⟨dw/dt⟩ = ν pre \cdot ν post \cdot (A₊ \cdot τ₊ - A₋ \cdot τ₋) Результат — потенціація або депресія — залежить від того, чи A₊τ₊ > A₋τ₋. Типові параметри: A₋τ₋ злегка > A₊τ₊ \to незначна чиста депресія.

Ця незначна асиметрія (депресія домінує для некорельованих входів) функціонально важлива: вона означає, що синапси слабко затухають у відсутності корельованої активності, запобігаючи хибній потенціації через випадкові збіги. Лише входи з справжніми тимчасовими кореляціями виробляють стійку ДПП.

Розподіли ваг і бімодальність

Симуляції та теоретичний аналіз мереж з STDP показують, що ваги не збігаються до єдиного стабільного значення, а натомість еволюціонують до бімодального розподілу: ваги кластеризуються поблизу 0 (мовчазні синапси) або поблизу деякого максимуму w_max (насичені синапси). Ця бінарна сегментація, як вважається, максимізує ємність пам'яті і була пов'язана з експериментально спостереженою властивістю "все або нічого" синаптичної потенціації на окремих дендритних шипиках.

Потрійний STDP: Класичний парний STDP не може відтворити всі протоколи індукції ДПП (Шостром та ін., 2001). Правило трійки (Пфістер та Герстнер, 2006) залежить від трійок спайків (пре-пост-пост або пост-пре-пост), додаючи другий постсинаптичний слід з повільнішою постійною часу τ_y ≈ 114 мс. Потрійний STDP відтворює частотну залежність індукції пластичності і успішно пояснює феноменологію Біненстока-Купера-Мунро.

8. JavaScript симуляція STDP

Симуляція нижче моделює два нейрони з пуассонівськими розрядами, з'єднаних одним змінним синапсом. Часи пре- та постсинаптичних спайків генеруються стохастично, а правило STDP з експоненційними вікнами навчання оновлює вагу в реальному часі. Еволюція ваги та емпірична крива STDP малюються на окремих полотнах, дозволяючи спостерігати, як зміщення часу між двома нейронами визначає потенціацію чи депресію синапсу.

Частота пре (Гц) 20 Гц Частота пост (Гц) 25 Гц Зміщення часу Δt (мс) +15 мс

Ліва панель показує еволюцію синаптичної ваги з часом. Коли пре-спайк послідовно передує пост-спайку (позитивне Δt), вага зростає до w_max. При від'ємному Δt (пост перед пре) вона спадає. Поблизу Δt = 0 конкуренція між ДПП і ДПД визначає тонку рівновагу.

Вікно навчання STDP (права панель) відображає виміряну зміну ваги залежно від Δt для кожної пари спайків, накопичуючи емпіричну оцінку ядра. При достатній кількості пар спайків (кілька секунд симуляції) проявляється характерна антисиметрична експоненційна форма.

Синаптична пластичність і правила навчання