Metagenome data Analysis

تحلیل داده‌های متاژنوم

ما در این کارگاه می‌خواهیم به‌صورت عملی و کاربردی و البته به‌صورت ساده فرایند تحلیل داده‌های متاژنوم و استخراج اطلاعات کاربردی از آن‌ها را آموزش دهیم. مخاطب این دوره می‌تواند اساتید و دانشجویان بیوانفورماتیک، زیست‌شناسی، ژنتیک، میکروبیولوژی، بیوتکنولوژی، پزشکی باشد. با توجه به اینکه داده‌ها و پردازش‌های مربوط به این حوزه بسیار حجم هستند، بنابراین نیاز به سخت‌افزار و نرم‌افزارهای مناسب دارد. وب‌سرویس‌های Galaxy، سرویس‌هایی هستند که به‌صورت رایگان خدمات سخت‌افزاری (پردازشی و ذخیره‌سازی) و همچنین نرم‌افزاری را در اختیار کاربران قرار می‌دهد. ما در این کارگاه از امکانات مربوط به این وب‌سرویس‌ها برای آنالیز داده‌های متاژنوم استفاده خواهیم کرد.

سرفصل‌های کارگاه:

پیش‌پردازش داده‌های توالی یابی شده
– بررسی و تبدیل داده‌ها به فرمت استاندارد
– هرس داده‌ها و تبدیل داده‌ها به فرمت مناسب با استفاده از ابزار Trimmomatic
– کنترل کیفی داده‌ها با استفاده از نرم‌افزار FastQC
به دست آوردن فراوانی باکتریایی داده‌ها
– استفاده از نرم‌افزار Metaphaln3 برای مشخص کردن فراوانی باکتریایی موجود در هر نمونه
استخراج اطلاعات بر اساس نگاشت توالی
– معرفی کاتالوگ‌های ژنی مناسب
– پیش‌پردازش اولیه بر روی کاتالوگ ژنی
– نگاشت توالی‌های نوکلئوتیدی با استفاده از نرم‌افزار Bowtie2 به کاتالوگ نوکلئوتیدی
– استخراج اطلاعات بر اساس نرم‌افزارهای Samtools
– نگاشت توالی‌های نوکلئوتیدی با استفاده از نرم‌افزار Blast-NCBI به کاتالوگ‌های پروتئینی
استخراج اطلاعات بر اساس اسمبلی توالی ها
– معرفی نرم‌افزارهای اسمبلی توالی‌های متاژنوم
– اسمبلی داده‌های متاژنوم با استفاده از نرم‌افزار Megahit و تولید کانتیگ‌های بزرگ‌تر
– استفاده از نرم‌افزار مبتنی بر وب MetaGeneMark برای پیشگویی ژن‌های موجود در توالی‌ها
– به دست آوردن توالی‌های نوکلئوتیدی و پروتئینی برای ژن‌های پیش‌گویی شده
– حذف توالی‌های تکراری و تولید کاتالوگ ژنی مناسب با استفاده از نرم‌افزار CD-HIT
استخراج اطلاعات تفسیر شده از پایگاه داده KEGG
– استخراج گروه‌های ارتولوگ بر اساس توالی ژنی (KO)
– استخراج گروه‌های آنزیمی بر اساس KOها
– استخراج واکنش‌های مرتبط با آنزیم‌ها


روش اجرا و ابزارها:

این کارگاه به‌صورت تئوری و عملی ارائه خواهد شد و ابزارهای لازم عمدتا تحت وب هست و در مواردی هم کدهای آماده‌ای برای استفاده شرکت‌کنندگان در اختیار آن‌ها قرار خواهد گرفت. همچنین پایپ‌لاین CAMAMED هم از طریق GitHub قابل‌دسترس است.


خروجی‌ها و دستاوردهاي مورد انتظار:

شرکت‌کنندگان در پایان این دوره، توانایی دانلود، پیش‌پردازش و پردازش داده‌های متاژنوم را با استفاده از وب‌سرویس گلکسی و همچنین بعضی از وب‌سرویس‌های آنلاین پیدا خواهند کرد. همچنین در انتهای کارگاه، پایپ‌لاین آماده‌ای با عنوان CAMAMED برای آنالیز این داده‌ها ارائه خواهیم کرد که بسیار کاربردی هست و تحت سیستم‌عامل لینوکس قابل‌اجرا هست.


زمان برگزاری: 14 اسفند، صبح


  • Date : 2023-03-05