نظریه توالی‌یابی دی‌ان‌ای

نظریه توالی‌یابی دی‌ان‌ای به تلاش‌هایی جهت طرح کردن مبانی تحلیلی توالی‌یابی دی‌ان‌ای می‌گویند. توالی‌یابی دی‌ان‌ای فرایندی است که در طی آن ترتیب نوکلئوتیدهای درون مولکول DNA مشخص می‌شود. نتایج ریاضی محض بدست آمده نظریه توالی‌یابی دی‌ان‌ای در عمل عوامل مهمی در توالی‌یابی نیستند. در نتیجه توسعه نظریه توالی‌یابی در حوزه ریاضیات کاربردی ادامه پیدا کرد.[1]

نظریه و ترفندهای توالی‌یابی

توالی‌یابی، یک مساله پوشش

برای توالی‌یابی دی‌ان‌ای تکه‌ها باید به شکل مناسب کنار هم گذاشته شوند.

همه‌ی روش‌های اصلی توالی‌یابی دی‌ان‌ای، بر پایه‌ی خواندن تکه‌های دی‌ان‌ای و بازسازی دی‌ان‌ای از روی این تکه‌ها، یا به وسیله بازسازی توالی و یا هم‌ترازسازی توالی است. مساله پوشش، یک مساله انتزاعی برای هردوی آن‌هاست.

بیش از یک قرن، ریاضیدانان ویژگی‌های انتزاعی پوشش را مطالعه قرار دادند. با این حال، کاربردهای مستقیم نتایج آن‌ها به طور کلی امکان‌پذیر نبوده. به این معنا که الگوریتم‌های بدست‌آمده از آن‌ها زمان زیادی برای اجرا نیاز دارند. یکی از مثال‌های این الگوریتم‌ها، پیکربندی استیون است.[2]

کاربردهای اولیه‌ی نظریه توالی‌یابی به کمک نظریه احتمال

فرض کنید فرایند بالا را به این شکل مدل کنیم که طول تکه رشته‌ها باشد و طول دنباله هدف (دی‌ان‌ای) باشد. اگر به صورت تصادفی انتخاب شده باشد احتمال این که یک نوکلئوتید در تکه باشد برابر است و اگر فرض کنیم در اینصورت این احتمال برابر است با پس احتمال اینکه این نوکلئوتید در تکه نباشد برابر حال اگر تکه داشته باشیم این احتمال برابر می‌شود. متغیرتصادفی را به اینصورت تعریف می‌کنیم که اگر این نوکلئوتید توسط حداقل یک تکه پوشیده شود برابر ، وگرنه شود.

و اگر فرض کنیم (که در بسیاری از موارد فرض درستی است) داریم:

که را افزونگی می‌گویند.[3]

نظریه لندر-واترمن

در سال ۱۹۸۸، اریک لندر و مایکل واترمن یک مقاله مهم در این زمینه منتشر کردند. تمرکز آن‌ها روی مسأله نگاشت ژن بود که در حالت انتزاعی خیلی به مسأله توالی‌یابی نزدیک است. مدل آن‌ها در پروژه ژنوم انسان نیز استفاده شد و همچنان نقش اساسی‌ای در توالی‌یابی دی‌ان‌ای دارد. یکی از پراستفاده‌ترین نتایج مدل آن‌ها بدست آوردن امیدریاضی تعداد وربستهاست.[4]

ترفند توقفگاه

ترفند توقفگاه برای توالی‌یابی مانند توقف خودروها در کنار جدول خیابان‌هاست. هر ماشین یک تکه است و جدول کنار خیابان توالی دی‌ان‌ای خواسته شده است. در این ترفند هر تکه طوری انتخاب می‌شود که با تکه‌های قبلی اشتراک نداشته باشد. مانند خودروهای متوقف شده در کنار خیابان که با هم فاصله دارند، بین تکه‌ها نیز فاصله‌هایی وجود دارد که برای پر کردن این فاصله‌ها ممکن است مجبور باشیم هزینه زیادی بپردازیم.[5]

جستارهای وابسته

منابع

  1. Solomon, H. (1978). Geometric Probability. Philadelphia: Society for Industrial and Applied Mathematics. ISBN 978-0-898-71025-0.
  2. Stevens WL (1939). "Solution to a Geometrical Problem in Probability". Annals of Eugenics. 9 (4): 315–320. doi:10.1111/j.1469-1809.1939.tb02216.x.
  3. Clarke L, Carbon J (1976). "A colony bank containing synthetic Col-El hybrid plasmids representative of the entire E. coli genome". Cell. 9 (1): 91–99. doi:10.1016/0092-8674(76)90055-6. PMID 788919.
  4. Lander ES, Waterman MS (1988). "Genomic mapping by fingerprinting random clones: a mathematical analysis". Genomics. 2 (3): 231–239. doi:10.1016/0888-7543(88)90007-9. PMID 3294162.
  5. Roach JC; et al. (2000). "Parking strategies for genome sequencing". Genome Research. 10 (7): 1020–1030. doi:10.1101/gr.10.7.1020. PMC 310895. PMID 10899151.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.