تحلیل دادههای متاژنوم
ما در این کارگاه میخواهیم بهصورت عملی و کاربردی و البته بهصورت ساده فرایند تحلیل دادههای متاژنوم و استخراج اطلاعات کاربردی از آنها را آموزش دهیم. مخاطب این دوره میتواند اساتید و دانشجویان بیوانفورماتیک، زیستشناسی، ژنتیک، میکروبیولوژی، بیوتکنولوژی، پزشکی باشد. با توجه به اینکه دادهها و پردازشهای مربوط به این حوزه بسیار حجم هستند، بنابراین نیاز به سختافزار و نرمافزارهای مناسب دارد. وبسرویسهای Galaxy، سرویسهایی هستند که بهصورت رایگان خدمات سختافزاری (پردازشی و ذخیرهسازی) و همچنین نرمافزاری را در اختیار کاربران قرار میدهد. ما در این کارگاه از امکانات مربوط به این وبسرویسها برای آنالیز دادههای متاژنوم استفاده خواهیم کرد.
سرفصلهای کارگاه:
پیشپردازش دادههای توالی یابی شده
– بررسی و تبدیل دادهها به فرمت استاندارد
– هرس دادهها و تبدیل دادهها به فرمت مناسب با استفاده از ابزار Trimmomatic
– کنترل کیفی دادهها با استفاده از نرمافزار FastQC
به دست آوردن فراوانی باکتریایی دادهها
– استفاده از نرمافزار Metaphaln3 برای مشخص کردن فراوانی باکتریایی موجود در هر نمونه
استخراج اطلاعات بر اساس نگاشت توالی
– معرفی کاتالوگهای ژنی مناسب
– پیشپردازش اولیه بر روی کاتالوگ ژنی
– نگاشت توالیهای نوکلئوتیدی با استفاده از نرمافزار Bowtie2 به کاتالوگ نوکلئوتیدی
– استخراج اطلاعات بر اساس نرمافزارهای Samtools
– نگاشت توالیهای نوکلئوتیدی با استفاده از نرمافزار Blast-NCBI به کاتالوگهای پروتئینی
استخراج اطلاعات بر اساس اسمبلی توالی ها
– معرفی نرمافزارهای اسمبلی توالیهای متاژنوم
– اسمبلی دادههای متاژنوم با استفاده از نرمافزار Megahit و تولید کانتیگهای بزرگتر
– استفاده از نرمافزار مبتنی بر وب MetaGeneMark برای پیشگویی ژنهای موجود در توالیها
– به دست آوردن توالیهای نوکلئوتیدی و پروتئینی برای ژنهای پیشگویی شده
– حذف توالیهای تکراری و تولید کاتالوگ ژنی مناسب با استفاده از نرمافزار CD-HIT
استخراج اطلاعات تفسیر شده از پایگاه داده KEGG
– استخراج گروههای ارتولوگ بر اساس توالی ژنی (KO)
– استخراج گروههای آنزیمی بر اساس KOها
– استخراج واکنشهای مرتبط با آنزیمها
روش اجرا و ابزارها:
این کارگاه بهصورت تئوری و عملی ارائه خواهد شد و ابزارهای لازم عمدتا تحت وب هست و در مواردی هم کدهای آمادهای برای استفاده شرکتکنندگان در اختیار آنها قرار خواهد گرفت. همچنین پایپلاین CAMAMED هم از طریق GitHub قابلدسترس است.
خروجیها و دستاوردهاي مورد انتظار:
شرکتکنندگان در پایان این دوره، توانایی دانلود، پیشپردازش و پردازش دادههای متاژنوم را با استفاده از وبسرویس گلکسی و همچنین بعضی از وبسرویسهای آنلاین پیدا خواهند کرد. همچنین در انتهای کارگاه، پایپلاین آمادهای با عنوان CAMAMED برای آنالیز این دادهها ارائه خواهیم کرد که بسیار کاربردی هست و تحت سیستمعامل لینوکس قابلاجرا هست.
زمان برگزاری: 14 اسفند، صبح