زبان‌شناسی رایانشی

زبان‌شناسی رایانشی (Computational linguistics) حوزه‌ای میان‌رشته‌ای است که می‌کوشد با بهره‌گیری از روش‌های آماری و قاعده‌بنیاد (rule-based)، به مدل‌سازی زبان طبیعی بپردازد. به شکل سنتی زبان‌شناسی رایانشی در قلمرو کاری دانشمندان کامپیوتری قرار داشت که در حوزه‌ی پردازش یک زبان خاص توسط کامپیوتر تخصص لازم را کسب کرده بودند. امروزه زبان‌شناسان رایانشی به عنوان اعضای گروه‌های میان‌رشته‌ای به فعالیت می‌پردازند، که اعضای این تیم‌ها می‌توانند شامل زبان‌شناسان (به شکل خاص در زمینه‌ی زبان‌شناسی همگانی تخصص دارند)، کارشناسان زبان (افرادی با پیش‌زمینه و تا حدی دارای مهارت‌های عملی مرتبط با پروژه‌ی مورد نظر)، و دانشمندان علم کامپیوتر باشند. به‌طور کلی، زبان‌شناسی رایانشی از همکاری دانشمندان و کارشناسان رشته‌های زبان‌شناسی، علوم رایانه‌ای، متخصصین زمینه‌ی هوش مصنوعی، ریاضی، منطق، علوم شناختی، روان‌شناسی شناختی، روان-زبان‌شناسی، مردم‌شناسی، عصب‌شناسی و برخی دیگر از رشته‌ها استفاده می‌کند.

زبان‌شناسی رایانشی دارای زیر شاخه‌های نظری و کاربردی است. زبان‌شناسی رایانشی نظری به بررسی و مطالعه زبان‌شناسی نظری با در نظر داشتن علوم شناختی می‌پردازد و زبانشناسی رایانشی کاربردی نتایج کاربردی بحث مدل‌سازی برای زبان را مد نظر قرار می‌دهد.[1]

خاستگاه

پیدایش حوزه زبان‌شناسی رایانشی به عنوان یک حوزه علمی و مطالعاتی، در واقع به قبل از پیدایش هوش مصنوعی (حوزه‌ای که زبان‌شناسی رایانشی اغلب زیر شاخه‌ای از آن محسوب می‌شود) بازمی‌گردد. محل تولد زبان‌شناسی رایانشی را باید در تلاش‌های ایالات متحده در دهه ۱۹۵۰ جستجو کرد، یعنی زمانی که آن‌ها در تلاش بودند تا بتوانند با استفاده از رایانه به شکل خودکار متون زبان‌های بیگانه، به خصوص منابع علمی به زبان روسی، را به انگلیسی ترجمه کنند.[2] از آنجایی که سیستم‌های رایانه‌ای، پردازش‌های ریاضیاتی را بسیار سریع تر از انسان‌ها انجام می‌دهند در ابتدا چنین تصور شد که مسایل تکنیکی ترجمه ماشینی به سرعت حل خواهند شد و آن‌ها قادر خواهند بود تا ماشین‌های ترجمه با توانایی‌های مشابه انسان بسازند.[3]

هنگامی که ترجمه ماشینی (نام دیگر: ترجمه مکانیکی) طراحی شده آن زمان نتوانست از انجام ترجمه صحیح متون برآید، بحث پردازش زبان انسان بسیار پیچیده‌تر از آنچه پیشتر تصور می‌شد به حساب آمد. نام زبان‌شناسی رایانشی به عنوان نام شاخه‌ای جدید از علوم متولد و ایجاد شد که به بررسی و تولید الگوریتم‌ها و نرم‌افزارهای بررسی هوشمند داده‌های زبانی می‌پردازد. زمانی که در سال‌های ۱۹۶۰ زبان‌شناسی رایانشی پا به عرصهٔ وجود گذاشت، به عنوان زیر شاخه‌ای از هوش مصنوعی که به بررسی، فهم و تولید زبان در سطح هوشی انسانی می‌پردازد در نظر گرفته شد.

بعد از بررسی نحوه انجام ترجمه صحیح توسط انسان‌ها چنین مشاهده شد که فرد مترجم می‌بایست به دستور، تکواژشناسی و همچنین قواعد نحوی هر دو زبان آگاهی داشته باشد. مبانی آگاهی از نحو نیز، داشتن دانش معناشناسی، واژگان و همچنین کاربردشناسی شناسایی شدند؛ بنابراین تلاش در جهت تحقق ترجمهٔ ماشینی به شاخه‌ای پیچیده از علوم برای توصیف، نمایش و پردازش ماشینی زبان‌های انسانی تبدیل شد.[4]

موارد کاربرد

در مورد استفاده از آن از جمله می‌توان به کاربردهای زیر اشاره کرد:

فرایافت concept و تجزیه زبانهای برنامه‌نویسی

نوآم چامسکی توانست تشابه زبانهای طبیعی و زبان های برنامه‌نویسی را به اثبات برساند. یعنی یک زبان رایانه‌ای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ می‌باشد. تفسیر یک متن از تجزیهٔ واژه‌ها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان میابد.

ترجمه ماشینی

مقالهٔ اصلی: ترجمه ماشینی (خودکار)

این شاخه از زبان‌شناسی رایانه‌ای زمان درازی کم‌اهمیت جلوه می‌کرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته می‌باشد. پس از مرحلهٔ شکافت واژه‌ها و نحو می‌باید تجزیهٔ مفهوم و سپس پراگماتیک را نیز افزود. در واقع این دو کوشش بر شناخت مفهوم خاص یک واژه در مکانی که ظاهر می‌شود را دارد.

پرسش و پاسخ با زبانهای طبیعی

این ایده مدتی به‌عنوان پاسخی قانع‌کننده به مسئله ارتباط انسان و ماشین تلقی می‌شد. این دید در واقع جنبهٔ گسترده‌تری از دستور زایشی چامسکی است.

صرف محاسباتی

مقالهٔ اصلی: صرف محاسباتی

به مطالعات مربوط به ساختارهای[5] درونی واژه ها صرف گفته می‌شود. اغلب دست‌آوردها و نتایج پژوهشهای صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سامانه های پردازش زبان‌های طبیعی انسانی فراهم آمده‌است.

پانویس

  1. Hans Uszkoreit. What Is Computational Linguistics? Department of Computational Linguistics and Phonetics of Saarland University
  2. John Hutchins: Retrospect and prospect in computer-based translation. بایگانی‌شده در ۱۴ آوریل ۲۰۰۸ توسط Wayback Machine Proceedings of MT Summit VII, 1999, pp. 30–44.
  3. Arnold B. Barach: Translating Machine 1975: And the Changes To Come.
  4. Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel
  5. Structures

منابع

  • Crystal D. , The Cambridge Encyclopedia of Language, 2nd edition, Cambridge University Press, 1996. ISBN 0-521-55967-7
  • Manning, C. D. , and Schutze, H. , Foundations of Statistical Natural Language Processing, 5th edition, The MIT Press, 2002. ISBN 0-262-13360-1
  • Linguistique informatique, Wikipedia
  • O'Grady, W. , Dobrovolsky, M. , and aronoff, M. , Contemporary Linguistics, An Introduction, 2nd edition, St. Martin' Press, Inc. , 1993. ISBN 0-312-06780-1

پیوند به بیرون

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.