
تحلیل دادههای متاژنوم
ما در این کارگاه میخواهیم بهصورت عملی و کاربردی و البته بهصورت ساده فرایند تحلیل دادههای متاژنوم و استخراج اطلاعات کاربردی از آنها را آموزش دهیم. مخاطب این دوره میتواند اساتید و دانشجویان بیوانفورماتیک، زیستشناسی، ژنتیک، میکروبیولوژی، بیوتکنولوژی، پزشکی باشد. با توجه به اینکه دادهها و پردازشهای مربوط به این حوزه بسیار حجم هستند، بنابراین نیاز به سختافزار و نرمافزارهای مناسب دارد. وبسرویسهای Galaxy، سرویسهایی هستند که بهصورت رایگان خدمات سختافزاری (پردازشی و ذخیرهسازی) و همچنین نرمافزاری را در اختیار کاربران قرار میدهد. ما در این کارگاه از امکانات مربوط به این وبسرویسها برای آنالیز دادههای متاژنوم استفاده خواهیم کرد.
سرفصلهای کارگاه:
پیشپردازش دادههای توالی یابی شده
–	بررسی و تبدیل دادهها به فرمت استاندارد
–	هرس دادهها و تبدیل دادهها به فرمت مناسب با استفاده از ابزار Trimmomatic
–	کنترل کیفی دادهها با استفاده از نرمافزار FastQC
به دست آوردن فراوانی باکتریایی دادهها
–	استفاده از نرمافزار Metaphaln3 برای مشخص کردن فراوانی باکتریایی موجود در هر نمونه
استخراج اطلاعات بر اساس نگاشت توالی
–	معرفی کاتالوگهای ژنی مناسب 
–	پیشپردازش اولیه بر روی کاتالوگ ژنی
–	نگاشت توالیهای نوکلئوتیدی با استفاده از نرمافزار Bowtie2 به کاتالوگ نوکلئوتیدی
–	استخراج اطلاعات بر اساس نرمافزارهای Samtools 
–	نگاشت توالیهای نوکلئوتیدی با استفاده از نرمافزار Blast-NCBI به کاتالوگهای پروتئینی 
استخراج اطلاعات بر اساس اسمبلی توالی ها
–	معرفی نرمافزارهای اسمبلی توالیهای متاژنوم
–	اسمبلی دادههای متاژنوم با استفاده از نرمافزار Megahit و تولید کانتیگهای بزرگتر
–	استفاده از نرمافزار مبتنی بر وب MetaGeneMark برای پیشگویی ژنهای موجود در توالیها
–	به دست آوردن توالیهای نوکلئوتیدی و پروتئینی برای ژنهای پیشگویی شده
–	حذف توالیهای تکراری و تولید کاتالوگ ژنی مناسب با استفاده از نرمافزار CD-HIT
استخراج اطلاعات تفسیر شده از پایگاه داده KEGG
–	استخراج گروههای ارتولوگ بر اساس توالی ژنی (KO)
–	استخراج گروههای آنزیمی بر اساس KOها
–	استخراج واکنشهای مرتبط با آنزیمها
روش اجرا و ابزارها:
این کارگاه بهصورت تئوری و عملی ارائه خواهد شد و ابزارهای لازم عمدتا تحت وب هست و در مواردی هم کدهای آمادهای برای استفاده شرکتکنندگان در اختیار آنها قرار خواهد گرفت. همچنین پایپلاین CAMAMED هم از طریق GitHub قابلدسترس است.
خروجیها و دستاوردهاي مورد انتظار:
شرکتکنندگان در پایان این دوره، توانایی دانلود، پیشپردازش و پردازش دادههای متاژنوم را با استفاده از وبسرویس گلکسی و همچنین بعضی از وبسرویسهای آنلاین پیدا خواهند کرد. همچنین در انتهای کارگاه، پایپلاین آمادهای با عنوان CAMAMED برای آنالیز این دادهها ارائه خواهیم کرد که بسیار کاربردی هست و تحت سیستمعامل لینوکس قابلاجرا هست.
زمان برگزاری: 14 اسفند، صبح