حافظه طولانی کوتاه-مدت
حافظه طولانی کوتاه-مدت (به انگلیسی: Long short-term memory) یا به اختصار الاستیام (تلفظ تحتاللفظی LSTM)، یک معماری شبکه عصبی بازگشتی (یک شبکه عصبی مصنوعی) است که در سال ۱۹۹۷ میلادی توسط سپ هوخرایتر و یورگن اشمیدهوبر ارائه شد،[2] و بعداً در سال ۲۰۰۰ میلادی توسط فیلیکس ژرس و دیگران بهبود داده شد.[3]
معماری
الاستیام سنتی
الاستیام سنتی
مقادیر اولیه: و . عملگر نشان دهنده ضرب هادامارد (ضرب عنصری).
متغیرها
- : بردار ورودی
- : بردار خروجی
- : بردار وضعیت سلول
- و : ماتریسها و بردار پارامتر
- و : بردارهای دروازه
- : بردار دروازه فراموشی. وزن به یادداری اطلاعات قدیمی.
- : بردار دروازه ورودی. وزن اندوختن اطلاعات جدید.
- : بردار دروازه خروجی. کاندید خروجی.
توابع فعالسازی
- : تابع اصلی یک تابع سیگموئید است.
- : تابع اصلی یک تانژانت هذلولی است.
- : تابع اصلی یک تانژانت هذلولی است اما الاستیام روزنهای .
الاستیام روزنهای
الاستیام روزنهای با دروازههای فراموشی. استفاده نمیشود، در عوض از در بیش تر جاها استفاده میشود.
جستارهای وابسته
- کامپیوترهای عصبی مشتقپذیر
- شبکه عصبی مصنوعی
- Prefrontal Cortex Basal Ganglia Working Memory (PBWM)
- شبکههای عصبی بازگشتی
- Gated recurrent unit
- سریهای زمانی
- توانبخشی طولانی-مدت
منابع
- Klaus Greff; Rupesh Kumar Srivastava; Jan Koutník; Bas R. Steunebrink; Jürgen Schmidhuber (2015). "LSTM: A Search Space Odyssey". arXiv:1503.04069. More than one of
|author1=
and|author=
specified (help); More than one of|eprint=
and|arxiv=
specified (help) - Sepp Hochreiter; Jürgen Schmidhuber (1997). "Long short-term memory". Neural Computation. 9 (8): 1735–1780. doi:10.1162/neco.1997.9.8.1735. PMID 9377276.
- Felix A. Gers; Jürgen Schmidhuber; Fred Cummins (2000). "Learning to Forget: Continual Prediction with LSTM". Neural Computation. 12 (10): 2451–2471. doi:10.1162/089976600300015015.
- Xingjian Shi; Zhourong Chen; Hao Wang; Dit-Yan Yeung; Wai-kin Wong; Wang-chun Woo (2015). "Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting". Proceedings of the 28th International Conference on Neural Information Processing Systems: 802–810.
پیوند به بیرون
- Recurrent Neural Network با بیش از ۳۰ مقاله الاستیام توسط گروه یورگن اشمیدهوبر در IDSIA
- تز دکترای ژرس در مورد شبکههای الاستیام.
- مقاله تشخیص تقلب با دو فصل اختصاص داده شده به توضیح شبکههای عصبی بازگشتی، به خصوص الاستیام.
- مقاله ای در مورد توسعه با کارایی بالای الاستیامها که به یک تک گره سادهسازی شده و میتواند معماری من درآوردی ای را آموزش دهد.
- خودآموز: چگونه در پایتون با ثینو (theano) الاستیام را پیادهسازی کنیم
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.