حروف معین
در علوم رایانه مخصوصاً در نظریه زبانها و ماشینها، طرح حروف معین توسط Alur و Madhusudan به عنوان تعمیم مشترکی از کلمهها بیان شدهاست همانطور که بهطور سنتی برای مدلسازی سازههای خطی و درختهای مرتب بدون درجه استفاده میشود که بهطور سنتی برای مدلسازی ساختارهای سلسله مراتبی استفاده میشود. پذیرندههای حالت محدود برای حروف معین که ماشین حروف معین نامیده میشود که یک تعریف بیانگرانهتر از ماشین محدود را بر روی کلمات بیان میکند. کدگذاری خطی زبانهای پذیرفته شده توسط ماشین حرف معین محدود یک کلاس از زبانهای پشتهای عیان را ارائه میدهد. کلاس زبان دوم بهطور صحیح بین زبانهای منظم و زبانهای مستقل از متن قطعی است. از زمان معرفی آنها در سال ۲۰۰۴ تحقیقات زیادی در این زمینه انجام دادهاند.
تعریف رسمی
برای تعریف کردن حروف معین، ابتدا باید رابطههای مربوط را تعریف کنیم. برای عددهای غیرمنفی 󠅟، نشان دهنده مجموعه {۱٬۲,…, ι-۱, ι} میباشد، با مورد ویژه [۰] = ᶲ مطابق با رابطه ↝ از طول 󠅟 که یک زیرمجموعه از میباشد از این رو:
- تمام لبههای این علامتها رو ب جلو هستند، اگر i ↝ j آنگاه i <j .
- بهطور معمول این لبهها محدود نیستند، برای ∞> i> ∞- حداقل یک موقعیت h وجود دارد که h ↝ i و حداقل یک موقعیت j که i ↝ j.
- لبههای معین هیچوقت قطع نمیکنند، هیچ ' i <i ′ ≤ j <j وجود ندارد به طوری که هر دو i ↝ j و 'i ′ ↝ j.
موقعیت i به عنوانهای زیر اشاره میکند:
- موقعیت تماس، اگر i ↝ j برای برخی j .
- تماس در انتظار اگر i ↝ ∞.
- موقعیت برگشت، اگر h ↝ i برای برخی h .
- موقعیت برگشت اگر ∞- ↝ i .
- موقعیت داخلی در همه موردهای باقیمانده.
حرف معین با طول بالای حرف الفبا Σ یک جفت (w,↝) به طوری که w یک حرف یا رشته باشد با طول در بالای Σ و ↝ یک رابطه مطابق با طول میباشد.
کدگذاری حروف معین به حروف متداول
حروف معین بر روی میتواند به حروف متداول که بر روی حرف تگ شده کدگذاری شود. هر علامت a از ، ۳ همتا تگ شده دارد. علامت ⟨a برای کدگذاری یک موقعیت تماس در یک حرف معین با برچسب a، علامت a⟩ برای کدگذاری موقعیت برگشت که با برچسب a علامت گذاری شده و در نهایت علامت a خودش برای نشان دادن موقعیت درونی که با برچسب a علامت گذاری شدهاست. دقیقتر اگر یک تابع φ نقشهبرداری حروف معین بر روی Σ تا به طوری که هر حرف معین (↝, بر روی کلمه به طوری که حرف معادل ⟨a و a و a⟩ و اگر و i به ترتیب یک (ممکن هست در حال انتظار) موقعیت تماس، موقعیت داخلی، و یک (ممکن هست در حال انتظار) موقعیت بازگشتی باشد.
مثال
برای تصویرسازی، (↝,n=(w یک حرف معین بر روی الفبای ۳ گانه با w=abaabccca و مطابق با رابطه ↝ = {(−∞,۱),(۲,∞),(۳٬۴),(۵٬۷),(۸,∞)} باشد سپس کدگذاری آن بر اساس حرف بهطور
φ(n) = a⟩⟨b⟨aa⟩⟨bcc⟩⟨ca خوانده میشود.
ماشینها
ماشین حرف معین
ماشین حرف معین حالات محدودی از اعداد دارد و تقریباً همانطور که ماشین قطعی محدود روی رشتههای کلاسیک هست عمل میکند. ماشین محدود کلاسیک ورودی را از چپ به راست میخواند و حالت ماشین بعد از خواندن j امین حرف بستگی به حالت ماشین قبل از خواندن دارد.
در ماشین حرف معین، موقعیت j در حرف معین (w,↝) ممکن است موقعیت بازگشتی باشد. اگر چنین باشد، حالت بعد از خواندن فقط به حالت خطی که در ماشین قبل از خواندن هست وابسته نخواهد بود.
بلکه در یک حالت سلسله مراتبی که در زمان تماس متناظر آن توسط ماشین پخش شد وابسته خواهد بود.
در قیاس با زبانهای منظم، مجموعه L از حروف معین منظم نامیده میشود اگر توسط چند حالت محدود ماشین حرف معین پذیرفته شود.
ماشین پشتهای عیان
ماشین حرف معین مدل ماشینی میباشد که حرفهای معین را میپذیرد. مدل معادلی وجود دارد که حروف متداول را کنترل میکند بهطور مثال مفهوم ماشین قطعی پشتهای عیان محدودیتی برای مفهوم ماشین قطعی پشتهای میباشد.
به پیروی از Alur و Madhusudan ماشین پشتهای عیان توسط ۶-تاپل معرفی میشود به طوری که:
- مجموعه محدودی از حالات
- الفبا ورودی است به طوری که – در تضاد ماشین پشتهای متداول – در ۳ مجموعه، Σint Σc, Σ قسمتبندی میشه. الفبای Σc مجموعه علامتهای تماس را نشان میدهد، Σ شامل علامتهای بازگشتی است و مجموعه Σint شامل علامتهای داخلی.
- مجموعه محدود که الفبای پشته نامیده میشود که شامل علامت ویژه میباشد که نشان دهنده پشته خالی است.
- تابع انتقال است که به سه قسمت متناظر انتقال تماس ، انتقال بازگشتی و انتقال داخلی تقسیمبندی شدهاست.
- تابع انتقال تماس.
- تابع انتقال بازگشتی.
- تابع انتقال داخلی.
- حالت اولیه میباشد.
- مجموعهای از حالتهای قابل پذیرش میباشد.
نظریه محاسبات ماشین پشتهای عیان بهطور قابل ملاحظهای محدودیتی است که برای ماشینهای پشتهای استفاده میشود. ماشین پشتهای عیان فقط وقتی که خواندن علامت تماس باشد علامت را به پشته اضافه میکند. آنها فقط میتوانند عنصر بالایی را از پشته وقتی که علامت بازگشتی میباشد حذف کنند و نمیتوانند پشته را وقتی رویداد داخلی اتفاق میفتد تغییر دهند.
یک محاسبه که در حالت پذیرش پایان میابد یک محاسبهپذیر است.
در نتیجه یک ماشین پشتهای عیان نمیتواند با علامت یکسان از پشته هم push و هم pop کند.
بنابراین زبان نمیتواند توسط ماشین پشتهای عیان برای هر قسمتی از پذیرفته شود اگرچه ماشین پشتهای که این زبان را بپذیرد وجود دارد.
اگر زبان در بالای الفبای توسط ماشین قطعی پشتهای عیان پذیرفته شده باشد، سپس زبان پشتهای عیان نامیده میشود.
ماشین غیرقطعی پشتهای عیان
ماشین غیرقطعی پشتهای عیان حاکی از آنهایی که قطعی هستند میباشد. از این رو میتوان یک ماشین غیرقطعی پشتهای عیان را به قطعی تبدیل کرد. اما اگر ماشین غیرقطعی حالت داشته باشد ماشین قطعی آن داراست.
مشکلات تصمیمگیری
اگر اندازه یک ماشین باشد، سپس میتوان چک کرد که آیا حرف n توسط ماشین در زمان پذیرفتهاست یا خیر. بهطور خاص مسئله خالی در زمان حل میشود. اگر ثابت باشد در زمان و فضای که عمق n در جریان دیده شده میباشد قابل حل میباشد. همینطور با فضای و زمان قابل حل است و به فرم مدار یکنواخت Boolean با عمق .
برای دو ماشین غیرقطعی A و B تصمیمگیری در مورد اینکه آیا مجموعهای از کلمات پذیرفته شده توسط A یک زیرمجموعه از حروفی است که توسط B پذیرفته شده EXPTIME-Complete هست یا خیر. همینطور EXPTIME-complete برای کشف کردن اینکه حرف پذیرفته نشدهاست نیز میباشد.
زبانها
همانطور که تعریف ماشین پشتهای عیان نشان میدهد ماشین قطعی پشتهای عیان میتواند به عنوان یک مورد ویژه از ماشین قطعی پشتهای دیده شود؛ بنابراین مجموعه VPL از زبانهای پشتهای عیان بر روی زیرمجموعهای را از مجموعه DCFL (زبانهای قطعی مستقل از متن) بر روی مجموعهای از علامت تشکیل میدهد. به خصوص تابعی که مطابق با رابطهای که از حروف معین که زبانهای منظم را به زبانهای مستقل از متن تبدیل میکند.
خواص بستهشدن
مجموعهای از زبانهای پشتهای عیان که بر اساس عملیات زیر هستند:
- مجموعه عملیاتها:
- اجتماع
- تقاطع
- مکمل
به این ترتیب به جبر بولی میرسیم.
برای عمل تقاطع میتوان یک متغیر M از VPA (ماشین پشتهای عیان) شبیهسازی کنیم و ۲ VPA داده شده و با ساخت یک ضرب ساده (Alur & Madhusudan 2004): برای فرض کنیم داده شده باشد به صورت سپس برای ماشین M مجموعه حالات میباشد، حالت اولیه و حالتهای پایانی میباشد و الفبای پشته توسط داده شدهاست و علامت پشته اولیه میباشد.
اگر در حالت بر روی علامت خواندن تماس باشد سپس علامت را Push میکند و به حالت میرود به طوری که علامت پشتهای است که توسط ، Push شدهاست از حالت به بر روی خواندن ورودی میرود.
اگر در حالت بر روی خواندن علامت داخلی باشد سپس به حالتهای میرود وقتی که از حالت به بر روی خواندن a انتقال یابد.
اگر در حالت بر روی خواندن نماد بازگشتی باشد، سپس نماد را pop میکند از پشته و به حالت میرود به طوری که نماد پشته Pop شده توسط وقتی که از حالت به انتقال میابد با خواندن .
صحت ساختار فوق به شدت بر این واقعیت متکی است که عملیاتهای push و pop از ماشینهای شبیهسازی شده و هماهنگ با نمادهای ورودی خوانده میشود. در واقع شبیهسازی مشابه برای ماشین قطعی پشتهای وجود ندارد به عنوان کلاس بزرگتر از زبانهای مستقل از متن قطعی بر روی تقاطع بسته میشود.
در مقایسه با تلفیقی که در بالا نشان داده شدهاست، ساختار تکمیلی برای ماشینهای پشتهای عیان با ساختار استاندارد ماشینهای قطعی پشتهای همخوانی دارد.
علاوه بر این شبیه کلاس از زبانهای مستقل از متن کلاس زبانهای پشتهای عیان زیر بستن پیشوند و برعکس بسته میشود. از این رو بسته شدن پسوند نیز دارد.
رابطه با کلاسهای دیگر زبانها
Alur & Madhusudan (2004) اشاره کردند که زبانهای پشتهای عیان عمومیتر از زبانهای پرانتزی که توسط (McNaughton (1967 پیشنهاد شدهاست میباشد. همانطور که توسط Crespi Reghizzi & Mandrioli (2012) نشان داده شدهاست VPL به نوبه خود به شدت در کلاس زبانهای توصیف شده توسط گرامرهای عملگر اولویت که توسط (Floyd (1963 معرفی شد و دارای خواص و مشخصات مشابه (دیده شده توسط Lonati et al. (2015) برای زبانهای ω و منطق و خصوصیات مبتنی بر ماشین). در مقایسه با گرامر همبستگی تعمیم دادن گرامرهای مستقل از متن (Okhotin (2011 نشان داد که همبستگی خطی زبانها یک کلاس بزرگ از زبانهای پشتهای عیان شکل میدهد. جدول آخر این مقاله گروهی از زبانهای پشتهای عیان را در رابطه با گروههای دیگر زبان در وراثت چامسکی نشان میدهد. Rajeev Alur و Parthasarathy Madhusudan یک زیر کلاس از زبانهای درختی باینری منظم تا زبانهای پشتهای عیان را در برمیگیرد.
توضیح مدلهای دیگر
گرامرهای پشتهای عیان
زبانهای پشتهای دقیقاً زبانهایی هستند که میتوانند توسط گرامرهای پشتهای عیان بیان شوند.
گرامرهای پشتهای عیان میتوانند به عنوان محدودیتی از گرامرهای مستقل از متن تعریف شوند. گرامر پشتهای عیان توسط ۴-تاپل به طوری که:
- و مجموعههای محدود جدا از هم میباشند هر عنصر یک کاراکتر غیرترمینال یا متغیر میباشد. هر متغیر بیانگر نوع متفاوتی از عبارت یا جمله در جمله میباشد. هر متغیر یک زیر-زبان از زبان که توسط تعریف شدهاست و زیر-زبان بدون تماسهای در حال انتظار و درحال انتظارهای بازگشتی میباشد.
- مجموعه محدودی از ترمینالها که از جدا شدهاند میباشد که محتوای واقعی حکم را تشکیل میدهند. مجموعه ترمینالها الفبای زبان تعریف شده توسط گرامر میباشد.
- رابطه محدودی از تا که . عضوهای محصول گرامر میباشند. ۳ نوع بازنویسی قوانین وجود دارد به صورت و .
- و اگر آنگاه و
- و اگر آنگاه
- متغیر شروع (یا نماد شروع) برای نشان دادن کل جمله (یا برنامه) بیان میشود.
در اینجا ستاره بیانگر عملیات ستاره کلین و حرف خالی است.
مدارات بولی یکنواخت
مشکل اینکه آیا یک کلمه با طول که توسط ماشین حرف معین پذیرفته شدهاست میتواند توسط مدارات بولی یکنواخت با عمق حل شود.
توضیح منطقی
زبانهای منظم بیش از کلمات ناسازگار دقیقاً مجموعهای از زبانها هستند که توسط Monadic second-order logicبیان شدهاند با دو پیش فرض غیرمعمول تماس و بازگشت جانشین خطی و رابطه تطبیقی ↝.
منابع
- https://swt.informatik.uni-freiburg.de/teaching/SS2012/AutomataTheory/Resources/Slides/nestedwordautomata-seminarslides-christianschilling.pdf
- Floyd, R. W. (July 1963). "Syntactic Analysis and Operator Precedence". Journal of the ACM. 10 (3): 316–333. doi:10.1145/321172.321179.
- McNaughton, R. (1967). "Parenthesis Grammars". Journal of the ACM. 14 (3): 490. doi:10.1145/321406.321411.
- Alur, R.; Arenas, M.; Barcelo, P.; Etessami, K.; Immerman, N.; Libkin, L. (2008). Grädel, Erich, ed. "First-Order and Temporal Logics for Nested Words". Logical Methods in Computer Science. 4 (4). arXiv:0811.0537. doi:10.2168/LMCS-4(4:11)2008.
- Crespi Reghizzi, Stefano; Mandrioli, Dino (2012). "Operator precedence and the visibly pushdown property" (PDF). Journal of Computer and System Sciences. 78 (6): 1837–1867. doi:10.1016/j.jcss.2011.12.006. Archived from the original (PDF) on 9 August 2017. Retrieved 31 December 2017.
- Lonati, Violetta; Mandrioli, Dino; Panella, Federica; Pradella, Matteo (2015). "Operator Precedence Languages: Their Automata-Theoretic and Logic Characterization". SIAM Journal on Computing. 44 (4). doi:10.1137/140978818.
- Okhotin, Alexander: Comparing linear conjunctive languages to subfamilies of the context-free languages, 37th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2011).
- ویکیپدیای انگلیسی: Nested Word