یک کلاستر (Cluster) در VMware ESXi، مثل یک تیم فوتبال حرفهای است که حتی اگر یک بازیکن مصدوم شود، باز هم بازی میبرد! اما راهاندازی این کلاسترها نیاز به دانش فنی دقیق دارد. در این مقاله، به زبان ساده اما حرفهای، تمام مراحل ساخت یک کلاستر آهنین با قابلیتهای HA و FT را آموزش میدهیم. حتی اگر قبلاً با ESXi کار نکردهاید، نگران نباشید؛ مثل یک منتور شخصی کنارتان هستم!
۱. پیشنیازهای راهاندازی کلاستر (Cluster) در ESXi
- سختافزار:
- حداقل ۳ سرور فیزیکی همسان (ترجیحاً با CPUهای Intel Xeon یا AMD EPYC).
- ذخیرهساز مشترک (مثلاً SAN با پشتیبانی از NFS یا iSCSI).
- نرمافزار:
- vCenter Server (نسخه ۸ یا بالاتر).
- لایسنس Enterprise Plus برای فعالسازی FT.
۲. پیکربندی هایپر اِی (High Availability) در کلاستر
الف) مفهوم Heartbeat و FDM
- مثال عملی:
اگر یک نود (Node) در کلاستر به مدت ۳۰ ثانیه پاسخ ندهد، vCenter به طور خودکار VMها را به نودهای سالم منتقل میکند.
ب) تنظیمات پیشرفته Admission Control
- پارامترهای حیاتی:
das.ignoreInsufficientHbDatastore = true # نادیده گرفتن خطاهای جزئی
das.percentFreeInCluster = ۲۵ # رزرو ۲۵% منابع برای مواقع بحرانی
۳. فعالسازی فالت تولرنس (Fault Tolerance) در کلاستر
الف) تفاوت HA و FT:
- HA: راهاندازی مجدد VMها با Downtime کوتاه.
- FT: بدون Downtime! یک کپی زنده (Live Shadow) همیشه آماده است.
ب) مراحل فعالسازی FT:
۱. فعالسازی vLockstep روی ESXi.
۲. ایجاد VM Compatibility نسخه ۱۵+.
۳. راستکلیک روی VM → Turn On Fault Tolerance.
مثال واقعی:
یک سرویس استریمینگ با FT توانست در طول قطعی ۶ ساعته دیتاسنتر، بدون از دست دادن حتی یک بیننده به کار ادامه دهد!
۴. خطاهای رایج در کلاسترهای ESXi

- خطا: “APD/PDL Condition Detected”
- دلیل: قطع ارتباط با ذخیرهساز مشترک.
- راهکار:
esxcli storage core adapter rescan --all # اسکن مجدد آداپتورها
- خطا: “Incompatible Network for HA”
- راهکار:
- ایجاد شبکه مدیریتی جداگانه برای Heartbeat.
- راهکار:
۵. بهینهسازی کلاستر برای عملکرد حداکثری
- DRS (Distributed Resource Scheduler):
- فعالسازی Load-Based Automation برای توازن خودکار بار.
- تنظیم Affinity/Anti-Affinity Rules برای کنترل محل اجرای VMها.
- مثال:
# جلوگیری از اجرای دو VM حیاتی روی یک نود
New-DrsRule -Name "Separate-DB-and-App" -Cluster "Cluster-01" -KeepTogether $false -VM "DB-Server","App-Server"
۶. مانیتورینگ کلاستر با ابزارهای حرفهای
- vRealize Operations Manager:
- مانیتورینگ پیشگویانه مصرف منابع.
- گزارشهای سفارشی برای SLAها.
- Grafana + Prometheus:
- ساخت داشبوردهای شخصیسازی شده برای نمایش وضعیت HA/FT.
نتیجهگیری:
راهاندازی کلاستر (Cluster) در ESXi با هایپر اِی و فالت تولرنس، مثل ساختن یک هواپیمای دو موتوره است که حتی اگر یک موتور بسوزد، باز هم پرواز میکند! با اجرای صحیح این تنظیمات، نه تنها Downtime را به صفر میرسانید، بلکه اعتماد مشتریان را هم جلب میکنید. به یاد داشته باشید: یک کلاستر بهینهشده، بهترین سرمایهگذاری برای کسبوکار دیجیتال شماست!