نظریه توالییابی دیانای
نظریه توالییابی دیانای به تلاشهایی جهت طرح کردن مبانی تحلیلی توالییابی دیانای میگویند. توالییابی دیانای فرایندی است که در طی آن ترتیب نوکلئوتیدهای درون مولکول DNA مشخص میشود. نتایج ریاضی محض بدست آمده نظریه توالییابی دیانای در عمل عوامل مهمی در توالییابی نیستند. در نتیجه توسعه نظریه توالییابی در حوزه ریاضیات کاربردی ادامه پیدا کرد.[1]
نظریه و ترفندهای توالییابی
توالییابی، یک مساله پوشش
همهی روشهای اصلی توالییابی دیانای، بر پایهی خواندن تکههای دیانای و بازسازی دیانای از روی این تکهها، یا به وسیله بازسازی توالی و یا همترازسازی توالی است. مساله پوشش، یک مساله انتزاعی برای هردوی آنهاست.
بیش از یک قرن، ریاضیدانان ویژگیهای انتزاعی پوشش را مطالعه قرار دادند. با این حال، کاربردهای مستقیم نتایج آنها به طور کلی امکانپذیر نبوده. به این معنا که الگوریتمهای بدستآمده از آنها زمان زیادی برای اجرا نیاز دارند. یکی از مثالهای این الگوریتمها، پیکربندی استیون است.[2]
کاربردهای اولیهی نظریه توالییابی به کمک نظریه احتمال
فرض کنید فرایند بالا را به این شکل مدل کنیم که طول تکه رشتهها باشد و طول دنباله هدف (دیانای) باشد. اگر به صورت تصادفی انتخاب شده باشد احتمال این که یک نوکلئوتید در تکه باشد برابر است و اگر فرض کنیم در اینصورت این احتمال برابر است با پس احتمال اینکه این نوکلئوتید در تکه نباشد برابر حال اگر تکه داشته باشیم این احتمال برابر میشود. متغیرتصادفی را به اینصورت تعریف میکنیم که اگر این نوکلئوتید توسط حداقل یک تکه پوشیده شود برابر ، وگرنه شود.
و اگر فرض کنیم (که در بسیاری از موارد فرض درستی است) داریم:
که را افزونگی میگویند.[3]
نظریه لندر-واترمن
در سال ۱۹۸۸، اریک لندر و مایکل واترمن یک مقاله مهم در این زمینه منتشر کردند. تمرکز آنها روی مسأله نگاشت ژن بود که در حالت انتزاعی خیلی به مسأله توالییابی نزدیک است. مدل آنها در پروژه ژنوم انسان نیز استفاده شد و همچنان نقش اساسیای در توالییابی دیانای دارد. یکی از پراستفادهترین نتایج مدل آنها بدست آوردن امیدریاضی تعداد وربستهاست.[4]
ترفند توقفگاه
ترفند توقفگاه برای توالییابی مانند توقف خودروها در کنار جدول خیابانهاست. هر ماشین یک تکه است و جدول کنار خیابان توالی دیانای خواسته شده است. در این ترفند هر تکه طوری انتخاب میشود که با تکههای قبلی اشتراک نداشته باشد. مانند خودروهای متوقف شده در کنار خیابان که با هم فاصله دارند، بین تکهها نیز فاصلههایی وجود دارد که برای پر کردن این فاصلهها ممکن است مجبور باشیم هزینه زیادی بپردازیم.[5]
جستارهای وابسته
منابع
- Solomon, H. (1978). Geometric Probability. Philadelphia: Society for Industrial and Applied Mathematics. ISBN 978-0-898-71025-0.
- Stevens WL (1939). "Solution to a Geometrical Problem in Probability". Annals of Eugenics. 9 (4): 315–320. doi:10.1111/j.1469-1809.1939.tb02216.x.
- Clarke L, Carbon J (1976). "A colony bank containing synthetic Col-El hybrid plasmids representative of the entire E. coli genome". Cell. 9 (1): 91–99. doi:10.1016/0092-8674(76)90055-6. PMID 788919.
- Lander ES, Waterman MS (1988). "Genomic mapping by fingerprinting random clones: a mathematical analysis". Genomics. 2 (3): 231–239. doi:10.1016/0888-7543(88)90007-9. PMID 3294162.
- Roach JC; et al. (2000). "Parking strategies for genome sequencing". Genome Research. 10 (7): 1020–1030. doi:10.1101/gr.10.7.1020. PMC 310895. PMID 10899151.