راه‌اندازی کلاستر در ESXI :HA و FT برای سرورهای ۲۴/۷

راه‌اندازی و پیکربندی پیشرفته سرور هوش مصنوعی

آموزش پیشرفته SSH در لینوکس و افزایش امنیت

امنیت وردپرس فارسی؛ افزونه‌های برتر و تجربه سایت‌های ایرانی

راهنمای پیشرفته راه‌اندازی CSF و UFW در CentOS و Ubuntu

پایش مداوم سرور با ابزارهای مانیتورینگ متن‌باز

یک کلاستر (Cluster) در VMware ESXi، مثل یک تیم فوتبال حرفه‌ای است که حتی اگر یک بازیکن مصدوم شود، باز هم بازی می‌برد! اما راه‌اندازی این کلاسترها نیاز به دانش فنی دقیق دارد. در این مقاله، به زبان ساده اما حرفه‌ای، تمام مراحل ساخت یک کلاستر آهنین با قابلیت‌های HA و FT را آموزش می‌دهیم. حتی اگر قبلاً با ESXi کار نکرده‌اید، نگران نباشید؛ مثل یک منتور شخصی کنارتان هستم!

۱. پیش‌نیازهای راه‌اندازی کلاستر (Cluster) در ESXi

سخت‌افزار:
- حداقل ۳ سرور فیزیکی همسان (ترجیحاً با CPUهای Intel Xeon یا AMD EPYC).
- ذخیره‌ساز مشترک (مثلاً SAN با پشتیبانی از NFS یا iSCSI).
نرم‌افزار:
- vCenter Server (نسخه ۸ یا بالاتر).
- لایسنس Enterprise Plus برای فعال‌سازی FT.

۲. پیکربندی هایپر اِی (High Availability) در کلاستر

الف) مفهوم Heartbeat و FDM

مثال عملی:
اگر یک نود (Node) در کلاستر به مدت ۳۰ ثانیه پاسخ ندهد، vCenter به طور خودکار VMها را به نودهای سالم منتقل می‌کند.

ب) تنظیمات پیشرفته Admission Control

پارامترهای حیاتی:

das.ignoreInsufficientHbDatastore = true  # نادیده گرفتن خطاهای جزئی
das.percentFreeInCluster = ۲۵            # رزرو ۲۵% منابع برای مواقع بحرانی

۳. فعال‌سازی فالت تولرنس (Fault Tolerance) در کلاستر

الف) تفاوت HA و FT:

HA: راه‌اندازی مجدد VMها با Downtime کوتاه.
FT: بدون Downtime! یک کپی زنده (Live Shadow) همیشه آماده است.

ب) مراحل فعال‌سازی FT:

۱. فعال‌سازی vLockstep روی ESXi.
۲. ایجاد VM Compatibility نسخه ۱۵+.
۳. راست‌کلیک روی VM → Turn On Fault Tolerance.

مثال واقعی:

یک سرویس استریمینگ با FT توانست در طول قطعی ۶ ساعته دیتاسنتر، بدون از دست دادن حتی یک بیننده به کار ادامه دهد!

۴. خطاهای رایج در کلاسترهای ESXi

خطا: “APD/PDL Condition Detected”
- دلیل: قطع ارتباط با ذخیره‌ساز مشترک.
- راهکار:

esxcli storage core adapter rescan --all  # اسکن مجدد آداپتورها

خطا: “Incompatible Network for HA”
- راهکار:
  - ایجاد شبکه مدیریتی جداگانه برای Heartbeat.

۵. بهینه‌سازی کلاستر برای عملکرد حداکثری

DRS (Distributed Resource Scheduler):
- فعال‌سازی Load-Based Automation برای توازن خودکار بار.
- تنظیم Affinity/Anti-Affinity Rules برای کنترل محل اجرای VMها.
مثال:

# جلوگیری از اجرای دو VM حیاتی روی یک نود
New-DrsRule -Name "Separate-DB-and-App" -Cluster "Cluster-01" -KeepTogether $false -VM "DB-Server","App-Server"

۶. مانیتورینگ کلاستر با ابزارهای حرفه‌ای

vRealize Operations Manager:
- مانیتورینگ پیشگویانه مصرف منابع.
- گزارش‌های سفارشی برای SLAها.
Grafana + Prometheus:
- ساخت داشبوردهای شخصی‌سازی شده برای نمایش وضعیت HA/FT.

نتیجه‌گیری:

راه‌اندازی کلاستر (Cluster) در ESXi با هایپر اِی و فالت تولرنس، مثل ساختن یک هواپیمای دو موتوره است که حتی اگر یک موتور بسوزد، باز هم پرواز می‌کند! با اجرای صحیح این تنظیمات، نه تنها Downtime را به صفر می‌رسانید، بلکه اعتماد مشتریان را هم جلب می‌کنید. به یاد داشته باشید: یک کلاستر بهینه‌شده، بهترین سرمایه‌گذاری برای کسب‌وکار دیجیتال شماست!

درفک IT