حافظه طولانی کوتاه-مدت

حافظه طولانی کوتاه-مدت (به انگلیسی: Long short-term memory) یا به اختصار ال‌اس‌تی‌ام (تلفظ تحت‌اللفظی LSTM)، یک معماری شبکه عصبی بازگشتی (یک شبکه عصبی مصنوعی) است که در سال ۱۹۹۷ میلادی توسط سپ هوخرایتر و یورگن اشمیدهوبر ارائه شد،[2] و بعداً در سال ۲۰۰۰ میلادی توسط فیلیکس ژرس و دیگران بهبود داده شد.[3]

یک بلوک ال‌اس‌تی‌ام روزنه‌ای با دروازه‌های ورودی، خروجی و فراموشی. پیکان‌های خروجی از گره ct به واقع به نشان دهنده پیکان‌های خروجی از ct-1 هستند به جز تنها پیکان راست-به-چپ. بسیاری از انواع دیگر ال‌اس‌تی‌ام‌ها هم وجود دارد.[1]

معماری

ال‌اس‌تی‌ام سنتی

مقادیر اولیه: و . عملگر نشان دهنده ضرب هادامارد (ضرب عنصری).

متغیرها

  • : بردار ورودی
  • : بردار خروجی
  • : بردار وضعیت سلول
  • و : ماتریس‌ها و بردار پارامتر
  • و : بردارهای دروازه
    • : بردار دروازه فراموشی. وزن به یادداری اطلاعات قدیمی.
    • : بردار دروازه ورودی. وزن اندوختن اطلاعات جدید.
    • : بردار دروازه خروجی. کاندید خروجی.

توابع فعال‌سازی

  • : تابع اصلی یک تابع سیگموئید است.
  • : تابع اصلی یک تانژانت هذلولی است.
  • : تابع اصلی یک تانژانت هذلولی است اما ال‌اس‌تی‌ام روزنه‌ای .

ال‌اس‌تی‌ام روزنه‌ای

ال‌اس‌تی‌ام روزنه‌ای با دروازه‌های فراموشی. استفاده نمی‌شود، در عوض از در بیش تر جاها استفاده می‌شود.

ال‌اس‌تی‌ام کانولوشنی

ال‌اس‌تی‌ام کانولوشنی.[4] نشان دهنده عملگر کانولوشن است.

جستارهای وابسته

منابع

  1. Klaus Greff; Rupesh Kumar Srivastava; Jan Koutník; Bas R. Steunebrink; Jürgen Schmidhuber (2015). "LSTM: A Search Space Odyssey". arXiv:1503.04069. More than one of |author1= and |author= specified (help); More than one of |eprint= and |arxiv= specified (help)
  2. Sepp HochreiterJürgen Schmidhuber (1997). "Long short-term memory"Neural Computation9 (8): 1735–1780. doi:10.1162/neco.1997.9.8.1735PMID 9377276.
  3. Felix A. Gers; Jürgen Schmidhuber; Fred Cummins (2000). "Learning to Forget: Continual Prediction with LSTM"Neural Computation12 (10): 2451–2471. doi:10.1162/089976600300015015.
  4. Xingjian Shi; Zhourong Chen; Hao Wang; Dit-Yan Yeung; Wai-kin Wong; Wang-chun Woo (2015). "Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting". Proceedings of the 28th International Conference on Neural Information Processing Systems: 802–810.

پیوند به بیرون

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.