Kiến Thức Sản Phẩm
Hướng dẫn kiểm tra lỗi phần cứng máy chủ
Trong quá trình sử dụng, không thể nào tránh được lỗi máy chủ. Ngoài việc tối ưu máy chủ, bạn cũng cần kiểm tra phần cứng. Vì vậy, Khoserver sẽ mang đến cho bạn cách kiểm tra lỗi phần cứng máy chủ nhé!
Mục lục
Dấu hiệu lỗi phần cứng máy chủ
Máy chủ có tốc độ chậm một cách bất thường, có thể là do RAM không nhận đủ dung lượng hoặc HDD chậm dẫn và không load dữ liệu kịp.
Máy chủ treo phải reboot thường xuyên do RAM có vấn đề gây treo hay cũng có thể là bộ nguồn có vấn đề không đủ nguồn điện nên server load cao bị reboot.
>> Tham khảo ngay Các lỗi server thường gặp và cách cứu dữ liệu an toàn
Chuẩn đoán lỗi phần cứng máy chủ
Sau khi biết dấu hiệu lỗi, bạn cần sử dụng các công cụ để kiểm tra có phải lỗi phần cứng không. Khoserver sẽ giới thiệu một vài công cụ chuẩn đoán lỗi trên nền tảng Linux.
HDD
Bạn hãy dùng lệnh dd để xem tốc độ HDD. Nếu tốc độ của HDD quá chậm thì đây chính là vấn đề gây ra lỗi.
dd if=/dev/zero of=test bs=1G count=1 oflag=direct
Bạn cũng có thể dùng công cụ smartctl. Các bạn hãy phải khởi động smartd (đi kèm sẵn trong bản phân phối Linux nhưng chưa được kích hoạt).
service smartd start
Với lệnh smartctl với tham số -H, bạn đã có thể kiểm tra nhanh. Smartctl sẽ hiển thị kết quả trả về tình trạng ổ cứng, bạn chỉ cần biết Pass/Fail thôi.
smartctl -H /dev/sda
Hãy dùng tham số -a để xem chi tiết về smart.
smartctl –a /dev/sda
RAM
Bạn hãy dùng công cụ memtester có sẵn trong hệ điều hành Linux để có thể biết được bộ nhớ RAM. Một cách khác, bạn có thể cài đặt bằng cách chạy yum install memtester nếu chưa có công cụ này.
Tham số của memtester: memtester <dung lượng> <số lần>
Dung lượng: dung lượng bộ nhớ sẽ kiểm tra (có thể thêm đơn vị M, K, G).
Số lần: số lần memtester để tìm lỗi.
Chẳng hạn: máy chủ bạn gồm 8G RAM, chạy memtester 1 lần trên cả 8G. Vậy lên bạn cần sử dụng là:
memtester 8G 1
RAM của máy vẫn ổn định nếu kết quả là OK hết. Hoặc nếu RAM bạn gặp vấn đề thì hãy thay thanh RAM để đảm bảo server có thể hoạt động ổn định.
Nguồn và các linh kiện khác
Hầu hết máy chủ đều có cảm biến theo dõi phần cứng. Để theo dõi (đặc biệt là nguồn điện có bị sút áp không), bạn có thể dùng gói ứng dụng lm_sensors – có sẵn trong repo của CentOS.
Bạn có thể cài đặt bằng lệnh:
yum install lm_sensors
Sau đó, bạn cần cho lm_sensors detect các sensor có trong máy chủ bằng lệnh sensors-detect, chọn YES ở những câu hỏi để lm_sensors có thể quét tìm đến các cảm biến.
sensors-detect
Sau khi detect xong, hãy khởi động dịch vụ lm_sensors với lệnh:
service lm_sensors start
Để xem thông tin hoạt động của các linh kiện, hãy dùng lệnh sensors.
Trên Linux còn một dịch vụ để theo dõi các thiết bị phần cứng theo thời gian thực là mcelog – có sẵn trong phiên bản Linux server. Tất cả các log phần cứng đều được ghi tại file /var/log/mcelog.
Hãy dùng lệnh sau đây để khởi động mcelog:
service mcelogd start
Hãy dùng lệnh để xem các thông tin log của mcelog:
mcelog –client
Bạn cũng có thể xem file log của mcelog bằng lệnh sau đây:
cat /var/log/mcelog
Một số máy chủ đang dùng Software-RAID trong Linux thì bạn cũng có thể xem tình trạng của RAID vời lệnh:
cat /proc/mdstat
Trên hình, RAID 1 đang hoạt động bình thường, kết quả 2/2 [UU]. Nếu ổ đĩa bị lỗi, array sẽ là 1/2 [_U] hay [U_] (với _ là biểu hiện cho HDD bị lỗi).
Việc kiểm tra lỗi phần cứng server có thể thông qua việc dùng IPMI (giao thức cho phép giao tiếp máy chủ ngay khi gặp cố phần cứng, trừ sự cố bản thân IPMI controller). Bạn cần cắm dây mạng RJ45 vào port IPMI trên máy, đặt địa chỉ IP cho nó. Do đó, ít ai sử dụng phương pháp này ngoại trừ trường hợp đây là hệ thống lớn.
>> Có thể bạn quan tâm server cũ
Khoserver hy vọng cách kiểm tra lỗi phần cứng máy trên phía trên có thể giúp bạn kiểm tra được máy chủ của mình. Khoserver chúc bạn thành công nhé!
Có thể bạn quan tâm