خطای سرور یکی از شایعترین مشکلاتی است که سرورها با آن دستوپنجه نرم میکنند. این خطاها در اثر عواملی همچونکه اشتباه صورت می گیرد، باگهای نرمافزاری، مشکلات سختافزاری و… رخ میدهند.
در این پست آموزشی از قصد داریم در رابطه با انواع خطاهای سرور باهم به گفتگو بپردازیم و با آنها آشنا شویم. لازم به ذكر است که بیشتر تمرکز ما در این مقاله خطای سرور hp خواهد بود.
فهرست مقاله
انواع خطای سرور HP
بهصورت کلی دو نوع خط سرور وجود دارند که مابقی خطاها را درخود جای میدهند. این دو نوع خطا عبارتند از:
- خطای غیر عددی
- خطای عددی
پیامها و کد خطای سرور hp به همراه تمامی پیامهایی که سرورها هنگام شروع کار با آن موجه میشوند و در اولین تست بوت شدن (Power On Self Test) یا بهاختصار POST ارائه میدهند، در این قسمت گنجاندهشده است.
بیشتر خطاهایی که سرور در حالت POST بروز میدهد، قبل از اینکه سیستمعامل را لود کرده باشد از خود یک کد نشان میدهند که با استفاده از این قطعه کد میتوان به رفع مشکل خطای سرور پرداخت. برخی از این پیامها فقط برای اهداف اطلاعاتی هستند و نامعتبر هستند.
یک نکته مهم:
ما در این مقاله در رابطه با بیشتر خطاهای سرور اچ پی از مدلهای مختلف آن به گفتگو میپردازیم و امکان مطرح کردن خطاهای همه سرورهای اچ پی در یک مقاله امکانپذیر نیست و ممکن است خطاهایی موجود باشند که در این مقاله به آنها اشاره نشده باشد.
یک نکته مهم:
خواندن مستندات شرکت سازنده سرور و کمک گرفتن از افراد و شرکتهای تخصصی مانند مشاوران در هنگام ، رویارویی با خطاهای رایج، بهترین راه برای مقابله با این مشکلات است. تماس
خطای سرور HP از نوع غیر عددی
سرورهای اچ پی پر استفاده برترین سرورها در بازار هستند و گاهی این سرورها با مشکلات و خطاهایی مواجه میشوند. در این بخش به بررسی این خطاها خواهیم پرداخت که خود در دستههای مختلفی قرار میگیرند:
- متن پیام خطا: Advanced Memory Protection mode: Advanced ECC
- تعداد بوقهایی که سرور میزند: هیچ
- علت خطا: پشتیبانی از Advanced ECC در حالت فعال قرار دارد.
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: Advanced ECC with hot-add support
- تعداد بوقهایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: پشتیبانی از Advanced ECC با Hot-Add فعال است
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: Online spare with Advanced ECC
- تعداد بوقهایی که سرور میزند: هیچ
- دلیل خطا: خطای سرور اچ پی ذکرشده نشان میدهد که Online Spare Memory در سرور فعال است.
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: Multi-board mirrored memory with Advanced ECC
- تعداد بوقهایی که سرور میزند: هیچ
- چرا خطا وجود دارد: نشان از فعال بودن Mirrored Memory در سرور را میدهد.
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: RAID memory with Advanced ECC
- تعداد بوقهایی که سرور میزند: هیچ
- مشکل چیست: نشان از فعال بودن RAID Memory در سرور را میدهد.
- اقدام لازم برای رفع آن: هیچ
خطای Unexpected Shutdown در سرور
همانطور که از نام آن معلوم است این خطا در اثر خاموش شدنهای اتفاقی و غیرمنتظره رخ میدهد که جزئیات آن بهصورت زیر است.
- متن پیام خطا: An Unexpected Shutdown occurred prior to this power-up
- تعداد بوقهایی که سرور میزند: هیچ
- خطا در چه موردی است: میتواند نشانی از خرابی سیستمعامل یا لاگ سیستم باشد.
- اقدام لازم برای رفع آن: بهروزرسانی سیستمعامل در صورت مکرر بودن خطا
این خطای سرور اچ پی یک خطای مهلک است که در اثر عوامل مختلفی به وجود میآید.
- متن پیام خطا: Critical Error Occurred Prior to this Power-Up
- تعداد بوقهایی که سرور میزند: هیچ
- دلیل خطا: در اثر خطاهای مهلک اتفاق میافتد که علت آن نیاز به بررسی کارشناسی دارد.
- اقدام لازم برای رفع آن: اجرای Insight Diagnostics برای یافتن خطا و رعایت کردن دستورالعملهای آن برای رفع خطا.
این خطای سرور در سروهای اچ پی و سایر مدلهای دیگر سرور مربوط به خطاهای فن و عدم کار کردن آن بهدرستی است که بهصورت زیر هستند:
- متن پیام خطا: Fan Solution Not Fully Redundant
- تعداد بوقهایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: ازکارافتادن برخی از فنها و یا نصب نبودن برخی از آنها.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کرد و دستورالعملهای مربوط به آن اجرا کرد. ممکن است نیاز به نصب فن بهصورت سختافزاری باشد.
- متن پیام خطا: Fan Solution Not Sufficient
- تعداد بوقهایی که سرور میزند: هیچ
- مشکل کجاست: تعداد فنها برای پشتیبانی از خنک کردن سرور کافی نیست. ممکن است فنها از کار افتاده باشند.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کرد و دستورالعملهای مربوط به آن اجرا کرد. ممکن است نیاز به نصب و جایگزینی فنها داشته باشید.
منبع:
- متن پیام خطا: Fatal DMA Error
- تعداد بوقهایی که سرور میزند: هیچ
- سبب خطا چیست: این خطا همانطور که گفته ده مرتبط با کنترلکننده DMA است که منجر به خطای NMI شده است.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و دستورالعملهای مربوط را برای جایگزینی اجزای خراب اجرا کنید.
این خطای سرور hp مربوط به خرابی پورتهای PCI Express است که جزئیات آن بهصورت زیر است:
- متن پیام خطا: Fatal DMA Error
- تعداد بوقهایی که سرور میزند: هیچ
- چ چیزی موجب خطا شده: این خطا نشان از خرابی یکی از پورتهای PCI Express است که به NMI منجر شده است.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و دستورالعملهای مربوط به PCI Express را باید پیروی کنید و تابلوهای ناموفق PCI Express را باید جایگزین یا دوباره نصب کنید.
- متن پیام خطا: Fatal Front Side Bus Error
- تعداد بوقهایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: این خطا مربوط به خرابی در Fatal Front Side Bus Error پردازنده است.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و دستورالعملهای مربوط به و باید پردازندههای خرابشده را پیدا کنید و آنها را جایگزین کنید.
- متن پیام خطا: Fatal Global Protocol Error
- تعداد بوقهایی که سرور میزند: هیچ
- چرا خطا بوجود آمده: خطای مربوط به پروتکل Fatal Global.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و اجزای خرابشده را جایگزین کنید.
این خطای سرور اچ پی مربوط به رابط هاب های خرابشده است که جزئیات آن بهصورت زیر است:
- متن پیام خطا: Fatal Hub Link Error
- تعداد بوقهایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: نقض در رابط پیوندهای هاب
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و اجزای خرابشده را جایگزین کنید.
مشکلات مربوط به ROM است که ممکن است بهدرستی برنامهنویسی نشده باشد.
- متن پیام خطا: FATAL ROM ERROR: The System ROM is not Properly Programmed.
- تعداد بوقهایی که سرور میزند: اول یک بوق بلند- بعد یک بوق کوتاه
- نقص در چیست: نقض در برنامهنویسی ROM
- اقدام لازم برای رفع خطا: باید ROM فیزیکی تعویض گردد
- متن پیام خطا: Fibre Channel Mezzanine/Balcony Not Supported
- تعداد بوقهایی که سرور میزند: دو بوق کوتاه میزند
- دلیل خطا: عدم پشتیبانی Fiber Channel توسط سرور
- اقدام لازم برای رفع خطا: باید آداپتور Fiber Channel مورد پشتیبانی را نصب کرد.
خطای درجه حرارت بالا در سرور hp
همانطور که از نام آن معلوم است این خطا مربوط به ترم شدن بیشازحد سرور است که در این حالت نیز خطا نشان میدهد.
- متن پیام خطا: High Temperature Condition detected by Processor X
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- علت ارور: دمای بیشازحد استاندارد و نبود فن کافی یا خرابی فنها جهت خنک کردن سی پی یو
- اقدام لازم برای رفع خطا: بازگرداندن سرور به حالت نرمال و نصب کردن فنهای بیشتر یا تعویض فن ازکارافتاده سرور.
این خطای سرور یکی از خطاهای نرمافزاری در سرور اچ پی است که ربطی به سختافزار ندارد. جزئیات بیشتر بهصورت زیر است.
- متن پیام خطا: Illegal Opcode – System Halted
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- علت به وجود آمدن خطا: وارد شدن سرور به حالت Illegal Operator Handler به علت خطاهای نرمافزاری
- اقدام لازم برای رفع خطا: Diagnostics را باید برای آن اجرا کنید و اجزای خرابشده نرمافزاری را جایگزین کنید.
- متن پیام خطا: iLO Generated NMI
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- مشکل از چیست: تولید خطای NMI توسط کنترلکننده iLO
- اقدام لازم برای رفع خطا: بررسی گزارشهای iLO در سیستم.
- متن پیام خطا: Internal CPU Check – Processor
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- خطای بوجود آمده: خطای داخلی مربوط به پردازندهها
- اقدام لازم برای رفع خطا: Diagnostics را باید برای آن اجرا کنید و اجزای خرابشده را جایگزین کنید. پردازندههای PPM اغلب منجر به رخداد این خطا میشوند.
این خطا مربوط به حافظههای نامعتبر است که جزئیات آن بهصورت زیر است.
- متن پیام خطا: Invalid memory types were found on the same node. Please check DIMMcompatibility. Some DIMMs may not be used
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- مشکل مربوط به چیست: سرور حافظههای نامعتبری را شناسایی کرده است.
- اقدام لازم برای رفع خطا: باید حافظههای معتبری نصب شود که در راهنمای حافظه سرور به آن اشارهشده است.
- متن پیام خطا: Invalid Password – System Halted!
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- علت ارور: واردکردن رمز عبور نامعتبر در سیستم بایوس که منجر به این خطا میشود.
- اقدام لازم برای رفع خطا: بازیابی رمز عبور معتبر و وارد کردن رمز عبور بهدرستی.
خطای شماره 2: System Restricted
- متن پیام خطا: I Invalid Password – System Restricted!
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- سبب خطا: واردکردن رمز عبور وارد اشتباه برای سرود به سیستم
- اقدام لازم برای رفع خطا: باید رمز عبور درست وارد شود.
- متن پیام خطا: Memory found on unpopulated Node.? Processor is required to be installed for memory to be used.
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- مشکل از کجاست: عدم نصب پردازندهها در سوکت مربوطه برای استفاده از DIMM
- اقدام لازم برای رفع خطا: نصب پردازندهها در سوکت مربوطه.
خطای Mixed Processor Speed در سرور hp
- متن پیام خطا: Mixed processor speeds detected. Please make sure that all processors are the same speed.? System Halted!
- تعداد بوقهایی که سرور میزند: ابتدا یک بوق بلند و به دنبال آن یک بوق کوتاه
- دلیل اشتباه: عدم پشتیبانی از پردازندهها با سرعتهای متفاوت
- اقدام لازم برای رفع خطا: مراجعه به مستندات سرور و نصب پردازندههای پشتیبانی شده- بهصورت کلی استفاده از پردازندههایی با سرعت یکسان.
خطای سرور مربوط به کیبورد
- متن پیام خطا: Network Server Mode Active and No Keyboard Attached
- تعداد بوقهایی که سرور میزند: بوق نمیزن
- مشکل چیست: وصل نبودن صفحهکلید به سرور
- اقدام لازم برای رفع خطا: چک کردن اتصال صفحهکلید به سرور.
خطاهای Nmi سروهای اچ پی
خطاهای Nmi معمولاً مربوط به وقفههای سختافزاری است که در سرورهای اتفاق میافتد.
خطای شماره 1: Button Pressed
- متن پیام خطا: NMI – Button Pressed!
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- دلیل خطا و اشتباه: احتمالاً دکمه مربوط به NMI زدهشده است و حافظه جهت تجزیه و تحلیل تخلیهشده است.
- اقدام لازم برای رفع خطا: راهاندازی مجدد سرور.
خطای شماره 2: Undetermined Source
- متن پیام خطا: NMI – Undetermined Source
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- خطا در چیست: یک وقفه NMI اتفاق افتاده است.
- اقدام لازم برای رفع خطا: راهاندازی مجدد سرور.
این خطا معمولاً مربوط به تنظیمات حافظه است که جزئیات بیشتر آن بهصورت زیر است:
- متن پیام خطا: Node Interleaving disabled – Invalid memory configuration
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- مشکل سرور چیست: یکسان نبودن تنظیمات حافظه در گرهها.
- اقدام لازم برای رفع خطا: پیکربندی یکسان حافظه در گرهها و فعال کردن interleaving را در RBSU.
خطای Floppy Drive در سرور
این خطا مربوط به مشكلات دیسک است که جزئیات آن بهصورت زیر است.
- متن پیام خطا: No Floppy Drive Present
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- علت به وجود آمدن خطا: نصب نبودن درایو دیسک و یا خراب بودن آن.
- اقدام لازم برای رفع خطا: خاموش کردن سرور، جایگزین یا غصب کردن درایو دیسک، راهاندازی مجدد سرور.
- متن پیام خطا: Parity Check 2 – System DIMM Memory
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- دلیل وجود خطا چیست: اتفاق افتادن خطاهای غیرقابل اصلاح در DIMM.
- اقدام لازم برای رفع خطا: باید در این شرایط Insight Diagnostics را اجرا کرده و خطاهای مربوط به DIMM ها را بیابید. پس از یافتن خطاها با بررسی چراغهای ال ای دی DIMM باید DIMM را بیابید و آن را جایگزین کنید.
- متن پیام خطا: PCI Bus Parity Error, PCI Slot x
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- اشتباه کجاست: ایجاد خطای برابری توسط دستگاه PCI در گذرگاههای PCI.
- اقدام لازم برای رفع خطا: دو راه وجود دارد 1_ برای PCI هایی که بهصورت افزونهاند باید کارت مربوط به آن را بردارید. 2_ برای PCI های تعبیهشده باید Insight Diagnostics اجرا کرده و دستورالعملهای جایگزینی قطعه خرابشده را اجرا کنید.
خطای PCI Slot Power
- متن پیام خطا: Power Fault Detected in Hot-Plug PCI Slot x
- تعداد بوقهایی که سرور میزند: با این خطا سرور دو بوق کوتاه میزند.
- سبب ارور چیست: Hot Plug PCI-X به درستی تغذیه نمیشود.
- اقدام لازم برای رفع خطا: راهاندازی مجدد سرور.
خطای Power Supply سرور HP
- متن پیام خطا: Power Supply Solution Not Fully Redundant
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- مشکل سرور در کجاست: ازکارافتادن یکی از منابع تغذیه و یا نصب نبودن آن.
- اقدام لازم برای رفع خطا: جایگزینی منابع تغذیه خرابشده و یا نصب کردن منابع نصبشده.
این خطای سرور مربوط به مشکلات پردازنده است که جزئیات آن بهصورت زیر است.
- متن پیام خطا: Processor X Unsupported Wattage
- تعداد بوقهایی که سرور میزند: ابتدا بوق بلند، سپس بوق کوتاه
- علت به وجود آمدن خطا: عدم پشتیبانی سرور از پردازنده نصبشده.
- اقدام لازم برای رفع خطا: مراجعه به مستندات سرور برای شناسایی پردازندههای قابل پشتیبانی و حتی بهروزرسانی ROM BIOS.
یک از رایجترین خطاهای سرور hp که مربوط به ROM است و خود به 4 نوع خطا تقسیم میشود:
- متن پیام خطا: REDUNDANT ROM ERROR: Backup ROM Invalid
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- دلیل خرابی چیست: خراب شدن رام پشتیبانی شده در سرو- رام اصلی خراب نیست.
- اقدام لازم برای رفع خطا: اجرای ROMPaq Utility برای فلش کردن سیستم و معتبر سازی رامها.
- متن پیام خطا: Redundant ROM Detected – This system contains a valid backup system ROM
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- خطا چیست: بهخودیخود یک خطا نیست و بیشتر تیک اعلان برای نشان دادن معتبر بودن رام اصلی و پشتیبان است.
- اقدام لازم برای رفع خطا: اقدامی لازم نیست.
- متن پیام خطا: REDUNDANT ROM ERROR: Bootblock Invalid
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- مشکل از چیست: خرابی بوت بلوک ROM.
- اقدام لازم برای رفع خطا: کمک گرفتن از ارائهدهنده خدمات سرور حرفهای.
- متن پیام خطا: REDUNDANT ROM ERROR: Primary ROM invalid. Booting Backup ROM
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- علت خرابی از کجاست: خرابی ROM اصلی سیستم.
- اقدام لازم برای رفع خطا: اجرای ROMPaq Utility برای بازگرداندن ROM به نسخه صحیح
- متن پیام خطا: Temperature violation detected – system Shutting Down in x seconds
- تعداد بوقهایی که سرور میزند: ابتدا یک بوق بلند و سپس یک بوق کوتاه میزند.
- دلیل خطا در سرور: رسیدن سیستم به دمای احتیاطی و خاموش شدن آن پس از x ثانیه.
- اقدام لازم برای رفع خطا: نصب فنهای کافی و تعمیر فنهای ازکارافتاده برای خنک نگهداشتن سرور
- متن پیام خطا: There must be a first DIMM in pair if second DIMM in pair is populated. Second DIMM in pair ignored
- تعداد بوقهایی که سرور میزند: بوق نمیزند.
- چه خطایی وجود دارد: عدم شناسایی و پر شدن سوکت های DIMM.
- اقدام لازم برای رفع خطا: پر کردن سوکت های DIMM
خطای Processor Bus Speed سرور
- متن پیام خطا: This system only supports 667 MHz Front Side Bus Speed Processors. یا One or more 800 MHz Front Side Bus Speed Processors have been initialized at 667 MHz. System Halted!
- تعداد بوقهایی که سرور میزند: ابتدا یک بوق بلند، سپس یک بوق کوتاه.
- سبب این خطا : عدم پیکربندی درست پردازندهها در محدوده مگاهرتزی خود.
- اقدام لازم برای رفع خطا: پیکربندی درست پردازندهها با توجه به مستندات
خطای سرور HP از نوع عددی
در این بخش به بررسی انواع خطای سرور hp از نوع عددی میپردازیم. این خطاها بیشتر از طریق بوق به کاربر اعلام میشوند.
خطای 101 سرور اچ پی
خطای شـاره 1: Error 101-I/O ROM Error
- متن پیام خطا: Error 101-I/O ROM Error
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- علت به وجود آمدن خطا: خرابی Option ROM در دستگاههای PCI، PCI-X و PCI Express.
- اقدام لازم برای رفع خطا: به بهروزرسانی Option ROM دستگاه
خطای شماره 2: 101–ROM Error
- متن پیام خطا: 101-ROM Error
- تعداد بوقهایی که سرور میزند: ابتدا بوق بلند، سپس بوق کوتاه
- دلیل به وجود آمدن خطا: این خطا مربوط به چک کردن رام سیستم است.
- اقدام لازم برای رفع خطا: اجرای Insight Diagnostics و جایگزینی موارد خرابشده در سیستم
خطای شماره 3: System 101-Option ROM Checksum Error
- متن پیام خطا: System 101-Option ROM Checksum Error
- تعداد بوقهایی که سرور میزند: ابتدا بوق بلند، سپس بوق کوتاه
- مشکل چیست: عدم کار کردن درست expansion board
- اقدام لازم برای رفع خطا: برای رفع این خطا باید ابتدا سختافزارهای اخیر نصبشده را جدا کنید و دوباره بررسی کنید که خطا وجود دارد یا خیر. در صورت ماندگاری خطا، expansion board را دوباره نصب کنید. باز هم در صورت ماندگاری خطا، با یک مرکز خدمات سرور تماس بگیرید.
خطای شماره 102 در سرور اچ پی
یکی دیگر از مشکلات سرور hp که یک نوع خطای سرور بهحساب میآیند، خطاهای 102 هستند؛ که در زیر به بررسی آنها پرداختهایم:
- متن پیام خطا: Error: 102-System Board Failure
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- خرابی از کجا منشا می گیرد: خراب شدن DMA controllers یا timers و یا قطعات مشابه آنها
- اقدام لازم برای رفع خطا: تعویض برد سیستم و اجرای server setup utility
نکته: جداسازی برد نیاز به تخصص و مهارت کافی دارد و نباید سرخود کاری انجام داد.
- متن پیام خطا: Error: 102-System Board Failure, CMOS Test Failed
- تعداد بوقهایی که سرور میزند: بوق نمیزند
- دلیل خرابی از چیست: خراب شدن DMA controllers یا timers و یا قطعات مشابه آنها.
- اقدام لازم برای رفع خطا: تعویض برد سیستم توسط ارائهدهنده خدمات تعمیر سرور
برای خرید سرور dl380 g10 که جزو پرفروشترین سرورها در ایران و جهان است به مشخصات فنی آن توجه کنید.