1.1. Lý thuyết liên quan: Cấu tạo và chức năng của Card mạng (NIC)
1.1.1. Khái niệm và Chức năng của NIC (Network Interface Card)
- Khái niệm: Card mạng (NIC) là một bản mạch cung cấp khả năng truyền thông mạng cho máy tính hoặc máy chủ.
- Chức năng chính:
- Chuyển đổi dữ liệu: Chuyển đổi dữ liệu từ dạng byte/bit của máy tính sang tín hiệu điện (đối với cáp đồng) hoặc tín hiệu ánh sáng (đối với cáp quang) để truyền đi trên môi trường truyền dẫn.
- Đóng gói và giải mã: Thực hiện đóng gói các gói tin theo tiêu chuẩn hạ tầng (ví dụ: Ethernet IEEE 802.3) khi gửi và giải mã tín hiệu khi nhận.
- Định danh vật lý: Mỗi NIC chứa một địa chỉ duy nhất được ghi trên phần cứng gọi là địa chỉ MAC (Media Access Control) để phân biệt các thiết bị trong mạng LAN.
- Điều khiển lưu lượng: Quản lý việc truyền và nhận dữ liệu, đảm bảo tốc độ truyền tải phù hợp với thiết bị mạng kết nối (Switch/Hub).
1.1.2. Cấu tạo của Card mạng hiện đại
- Chip điều khiển (Controller): Đây là “bộ não” của NIC, chịu trách nhiệm xử lý các giao thức mạng lớp 2 (Data Link Layer) và điều phối việc truyền nhận dữ liệu.
- Bộ nhớ đệm (Buffer): Lưu trữ tạm thời dữ liệu trong quá trình truyền/nhận để tránh mất mát thông tin khi có sự chênh lệch về tốc độ giữa máy tính và mạng.
- Cổng kết nối (Interface):
- Cổng RJ45: Dùng cho cáp xoắn đôi (Cat5e, Cat6), phổ biến ở tốc độ 1Gbps.
- Khe cắm SFP/SFP+: Dùng cho các Module quang hoặc cáp DAC, cho phép kết nối linh hoạt và hỗ trợ tốc độ cao hơn từ 10Gbps trở lên.
- Đèn tín hiệu (LED):
- Đèn Link: Sáng khi có kết nối vật lý thành công với thiết bị đầu kia.
- Đèn Activity: Nhấp nháy khi có dữ liệu đang được truyền tải qua cổng.
- Chân cắm mở rộng (Bus Interface): Thường là chuẩn PCIe (PCI Express) dùng để cắm vào bo mạch chủ của máy tính hoặc máy chủ.
1.1.3. Phân loại theo môi trường truyền và tốc độ
- Theo môi trường truyền:
- Card mạng dây (Wired NIC): Kết nối qua cáp đồng hoặc cáp quang.
- Card mạng không dây (Wireless NIC): Sử dụng ăng-ten để truyền nhận dữ liệu qua sóng vô tuyến (Wi-Fi).
- Theo tốc độ truyền dẫn:
- Standard/Fast Ethernet: 10/100 Mbps (đã lạc hậu).
- Gigabit Ethernet: 1Gbps (phổ biến hiện nay cho máy trạm).
- 10 Gigabit Ethernet (10GbE): Chuẩn phổ biến cho máy chủ và thiết bị lõi doanh nghiệp hiện nay nhằm đáp ứng băng thông lớn.
1.2. Quy trình bảo trì Card mạng (NIC) chi tiết
Việc bảo trì Card mạng cần được thực hiện định kỳ để đảm bảo tốc độ truyền tải dữ liệu luôn đạt mức tối đa và tránh các sự cố mất kết nối đột ngột.
Bước 1: Kiểm tra vật lý và vệ sinh phần cứng
Đây là bước quan trọng nhất đối với các thiết bị hoạt động trong môi trường có nhiều bụi bẩn hoặc độ ẩm cao.
- Chuẩn bị: Vòng tay chống tĩnh điện (ESD), bình khí nén, cồn 90 độ, gôm (tẩy) sạch, khăn lau không xơ.
- Thao tác thực hiện:
- Ngắt nguồn điện: Tắt máy chủ/máy tính hoàn toàn và rút dây nguồn trước khi tháo vỏ máy.
- Tháo Card mạng: Cẩn thận tháo vít cố định và rút NIC ra khỏi khe cắm PCIe trên bo mạch chủ.
- Vệ sinh chân tiếp xúc: Dùng gôm (tẩy) chà nhẹ lên các chân tiếp xúc bằng đồng (Gold fingers) để loại bỏ lớp oxy hóa, sau đó lau sạch lại bằng cồn 90 độ.
- Kiểm tra cổng cắm: * Đối với cổng RJ45: Dùng đèn pin soi vào trong cổng xem các chân đồng có bị cong, gãy hay bám bụi không. Dùng bình khí nén xịt sạch bụi.
- Đối với khe SFP/SFP+: Sử dụng bộ vệ sinh quang chuyên dụng để lau sạch bụi bên trong khe cắm trước khi cắm Module.
- Lắp đặt lại: Cắm chặt NIC vào khe cắm, đảm bảo không bị lỏng lẻo và bắt vít cố định.
Bước 2: Cập nhật phần mềm (Driver) và Firmware
Phần mềm điều khiển lỗi thời thường là nguyên nhân gây ra sự cố không tương thích với hệ điều hành mới hoặc làm giảm tốc độ mạng.
- Thao tác thực hiện:
- Kiểm tra phiên bản hiện tại: Chuột phải vào Start -> Device Manager -> Network adapters -> Chuột phải vào Card mạng chọn Properties -> Thẻ Driver để xem phiên bản hiện tại.
- Tải Driver từ nhà sản xuất: Truy cập trang chủ của hãng (Intel, Broadcom, Realtek…) tìm đúng mã thiết bị và tải bản Driver mới nhất.
- Cài đặt: Chạy tệp cài đặt và khởi động lại máy tính để thay đổi có hiệu lực.
- Cập nhật Firmware: Đối với các Card mạng cao cấp (10Gbps), cần chạy các công cụ cập nhật Firmware của hãng để sửa lỗi ở mức phần cứng và tối ưu hóa khả năng xử lý của chip Controller.
- Hãy cho biết Công cụ cập nhật Driver & Firmware?
Bước 3: Giám sát trạng thái và tối ưu hóa hiệu suất
Sau khi vệ sinh và cập nhật, cần theo dõi hoạt động thực tế của Card để đảm bảo tính ổn định.
- Thao tác thực hiện:
- Kiểm tra nhiệt độ: Sử dụng phần mềm quản trị hệ thống (như vCenter cho ảo hóa hoặc các tool chuyên dụng của hãng) để xem nhiệt độ hoạt động. Nếu Card mạng quá nóng (>70°C), cần kiểm tra lại quạt tản nhiệt của thùng máy.
- Giám sát lưu lượng (Traffic): * Sử dụng Task Manager -> Thẻ Performance -> Ethernet để xem biểu đồ lưu lượng truyền nhận thực tế.
- Nếu thấy biểu đồ trồi sụt thất thường (spikes) dù tải ổn định, cần kiểm tra lại dây cáp mạng.
- Kiểm tra lỗi gói tin (Errors/Discards): Sử dụng các lệnh trong PowerShell hoặc phần mềm giám sát mạng (như PRTG) để xem tỷ lệ gói tin bị lỗi. Nếu tỷ lệ này cao, chứng tỏ cổng cắm hoặc dây cáp có vấn đề.
- Tối ưu hóa thông số: Vào Advanced settings trong Driver để kích hoạt Jumbo Packet (nếu Switch hỗ trợ) nhằm tăng hiệu suất truyền tải dữ liệu lớn.
- Hãy cài đặt phần mềm và công cụ chuyên dụng để giám sát trạng thái và tối ưu hóa hiệu suất của card mạng.
Lưu ý quan trọng: Trong suốt quy trình, luôn phải ghi chép lại các thông số trước và sau khi bảo trì để có cơ sở so sánh và đánh giá hiệu quả công việc.
2. Xử lý sự cố phần cứng thiết bị mạng tập trung (Switch, Router, Firewall)
2.1. Lý thuyết liên quan: Chức năng và cấu tạo của Switch, Router trong hệ thống
Switch (Thiết bị chuyển mạch): Đóng vai trò kết nối các thiết bị trong cùng một mạng nội bộ (LAN). Switch Layer 3 có khả năng định tuyến dữ liệu giữa các VLAN khác nhau.
Router (Thiết bị định tuyến): Kết nối các mạng khác nhau (ví dụ từ LAN ra Internet). Nó quyết định đường đi tốt nhất cho gói tin dựa trên địa chỉ IP.
Cấu tạo phần cứng cần lưu ý khi bảo trì:
CPU & RAM: Xử lý bảng định tuyến và bảng địa chỉ MAC. Nếu quá tải, thiết bị sẽ treo hoặc phản hồi chậm.
Hệ thống quạt (Fan) và tản nhiệt: Duy trì nhiệt độ ổn định cho các Chip xử lý tốc độ cao.
Cổng (Port) và Module: Các khe cắm SFP/SFP+ để kết nối cáp quang hoặc cáp đồng tốc độ cao.
2.2. Quy trình bảo trì và xử lý sự cố chi tiết
Việc bảo trì các thiết bị tập trung là cực kỳ quan trọng vì nếu một thiết bị này lỗi, toàn bộ hệ thống mạng sẽ bị tê liệt (Single Point of Failure).
Bước 1: Kiểm tra hệ thống tản nhiệt và môi trường
Nguyên nhân: Bụi bẩn bám dày làm cản trở luồng khí, gây quá nhiệt dẫn đến thiết bị tự khởi động lại hoặc cháy linh kiện.
Thao tác thực hiện:
Quan sát đèn quạt (Fan LED): Nhìn vào mặt trước hoặc sau thiết bị, nếu đèn Fan báo đỏ hoặc cam là quạt đã hỏng.
Vệ sinh khe gió: Dùng máy hút bụi hoặc bình khí nén thổi sạch bụi tại các khe thông gió và lưới lọc bụi của tủ Rack.
Kiểm tra lưu thông khí: Đảm bảo không có dây cáp mạng nào che lấp lối thoát khí của quạt tản nhiệt.
Bước 2: Kiểm tra nguồn điện và nguồn dự phòng (Redundant Power)
Nguyên nhân: Nguồn điện không ổn định hoặc bộ nguồn (PSU) bị suy giảm công suất sau thời gian dài sử dụng.
Thao tác thực hiện:
Đo điện áp: Sử dụng đồng hồ đo để kiểm tra điện áp đầu vào từ UPS.
Kiểm tra nguồn phụ: Đối với thiết bị có 2 nguồn (Dual PSU), hãy thử rút thử một nguồn để đảm bảo nguồn còn lại vẫn duy trì được hệ thống hoạt động (Hot-swappable).
Vệ sinh đầu cắm: Kiểm tra dây nguồn, đảm bảo phích cắm chắc chắn, không bị lỏng gây ra hiện tượng phóng điện hồ quang.
Bước 3: Kiểm tra vật lý các cổng (Port) và Module quang
Nguyên nhân: Chân đồng trong cổng RJ45 bị rỉ sét, gãy hoặc Module quang (SFP) bị suy giảm công suất phát do bụi bẩn bám vào thấu kính.
Biểu hiện: Đèn cổng mạng không sáng dù đã cắm dây, hoặc báo lỗi “Input errors” khi kiểm tra bằng câu lệnh.
Thao tác thực hiện:
Kiểm tra đèn tín hiệu (LED):
Đèn Link: Phải sáng xanh ổn định.
Đèn Activity: Phải nháy xanh liên tục khi có dữ liệu.
Vệ sinh cổng: Sử dụng tăm bông tẩm cồn 90 độ lau nhẹ các chân đồng của cổng RJ45.
Thay thế thử nghiệm: Nếu nghi ngờ một cổng hỏng, hãy cắm dây sang cổng bên cạnh để xác định lỗi do cổng hay do dây cáp.
Kiểm tra Module SFP: Rút Module ra, vệ sinh bụi và cắm lại chắc chắn vào khe cắm.
Bước 4: Giám sát phần mềm và tối ưu hóa hệ thống
Thao tác thực hiện:
Kiểm tra Log: Truy cập giao diện Web hoặc dòng lệnh (CLI), dùng lệnh
show log(trên Cisco/Switch chuyên dụng) để tìm các thông báo lỗi phần cứng.Kiểm tra tải (Load): Xem mức độ chiếm dụng CPU và RAM. Nếu thường xuyên > 80%, cần xem xét nâng cấp thiết bị hoặc tối ưu lại cấu hình.
Cập nhật Firmware: Thực hiện cập nhật hệ điều hành (OS) của thiết bị mạng để sửa các lỗi (bugs) phần cứng đã được nhà sản xuất công bố.
Lưu ý khi thực hành: Khi bảo trì Switch/Router đang hoạt động (Online), phải thông báo cho người dùng và thực hiện vào giờ thấp điểm để tránh làm gián đoạn công việc của đơn vị.
3. Kỹ thuật kiểm tra hạ tầng cáp cấu trúc
3.1. Lý thuyết liên quan: Cấu tạo và tiêu chuẩn cáp truyền dẫn hiện đại
3.1.1. Hệ thống cáp đồng xoắn đôi (Twisted Pair)
Cấu tạo: Gồm 8 lõi dây đồng xoắn thành 4 cặp với bước xoắn khác nhau để triệt tiêu nhiễu điện từ.
Tiêu chuẩn Cat6/Cat6A: * Cat6: Hỗ trợ tốc độ lên đến 1Gbps ở khoảng cách 100m, băng thông 250MHz.
Cat6A: Có thêm lớp bọc chống nhiễu hoặc cấu trúc lõi đặc biệt, hỗ trợ tốc độ 10Gbps ở khoảng cách 100m, băng thông 500MHz. Đây là tiêu chuẩn đang dần thay thế hoàn toàn Cat5e trong các doanh nghiệp.
Chuẩn bấm dây: T568A và T568B (thường dùng chuẩn B cho các hệ thống hiện nay).
3.1.2. Hệ thống cáp quang (Fiber Optic)
Cấu tạo: Gồm lõi (Core) làm bằng thủy tinh tinh khiết, lớp vỏ phản xạ (Cladding) và lớp bảo vệ (Buffer).
Phân loại:
Single-mode (Đơn mốt): Lõi nhỏ (9 micron), ánh sáng truyền thẳng, dùng Laser. Ưu điểm: Khoảng cách truyền rất xa (hàng chục km). Nhận diện: Thường có vỏ màu Vàng.
Multi-mode (Đa mốt): Lõi lớn (50 hoặc 62.5 micron), ánh sáng truyền theo nhiều hướng, dùng LED. Ưu điểm: Giá thành thiết bị rẻ, phù hợp mạng nội bộ. Nhận diện: Màu Aqua (OM3/OM4) hoặc Tím (OM4).
3.2. Quy trình kiểm tra và xử lý sự cố hạ tầng cáp
3.2.1. Đối với hệ thống cáp đồng (Cat6/Cat6A)
Nguyên nhân sự cố: Bấm sai chuẩn, đầu bấm (RJ45) bị lỏng chân đồng, cáp bị nhiễu do đi gần dây điện lưới.
Biểu hiện: Máy tính báo “Network Cable Unplugged”, tốc độ chỉ đạt 100Mbps dù dùng Card 1Gbps, hoặc hay bị mất kết nối khi có thiết bị điện lớn hoạt động gần đó.
Quy trình xử lý:
Kiểm tra thông mạch (Wiremap): Sử dụng máy đo LAN Tester cắm vào hai đầu cáp. Quan sát thứ tự đèn từ 1 đến 8. Nếu đèn nhảy sai thứ tự hoặc có đèn không sáng -> Bấm lại đầu mạng.
Đo nhiễu xuyên kênh (Crosstalk): Sử dụng máy đo chuyên dụng (như Fluke) để kiểm tra xem các cặp dây có bị nhiễu sang nhau không. Nếu nhiễu cao -> Thay đổi lộ trình đi dây tránh xa nguồn điện.
Kiểm tra ổ cắm (Outlet/Patch Panel): Dùng dụng cụ nhấn dây (Punch down tool) nhấn lại các đầu dây tại nhân mạng để đảm bảo tiếp xúc tốt.
3.2.2. Đối với hệ thống cáp quang (Single-mode/Multi-mode)
Nguyên nhân sự cố: Sợi quang bị gập (vượt quá bán kính uốn cong), đầu Fast Connector bị tuột, hoặc bụi bám vào mặt sứ của đầu nối.
Biểu hiện: Mất tín hiệu hoàn toàn (Modem báo đèn LOS đỏ), suy hao lớn dẫn đến tốc độ mạng cực chậm.
Quy trình xử lý:
Tìm điểm đứt bằng bút soi quang (VFL): Cắm bút soi vào một đầu sợi quang. Quan sát dọc dây cáp, nếu thấy ánh sáng đỏ rò rỉ ra ngoài tại vị trí nào thì đó là điểm bị gãy/đứt.
Đo công suất bằng Power Meter: * Cắm một đầu vào nguồn phát, một đầu vào máy đo.
So sánh chỉ số thu được với công suất tiêu chuẩn. Nếu chỉ số dưới -25dBm là tín hiệu rất yếu, cần kiểm tra lại các mối nối hoặc hàn nối lại.
Vệ sinh đầu nối: Sử dụng bút vệ sinh hoặc khăn tẩm cồn lau sạch đầu sứ (Ferrule) của đầu cáp quang trước khi cắm lại vào thiết bị.
4. Bảo trì hệ thống nguồn điện tập trung (UPS) và thiết bị chống sét
4.1. Lý thuyết liên quan: Vai trò của nguồn điện và tiếp địa trong bảo vệ hệ thống.
4.1.1. Hệ thống lưu điện UPS (Uninterruptible Power Supply)
Khái niệm: Là thiết bị lưu trữ điện năng dự phòng, đảm bảo duy trì nguồn điện liên tục cho máy chủ và thiết bị mạng khi có sự cố mất điện lưới hoặc điện áp trồi sụt.
Phân loại: * Offline: Chỉ hoạt động khi mất điện, có thời gian trễ khi chuyển mạch.
Online Double Conversion: Luôn luôn cung cấp điện sạch thông qua bộ chuyển đổi, không có thời gian trễ, phù hợp cho máy chủ quan trọng.
Chức năng: Bảo vệ thiết bị khỏi sốc điện, ổn định điện áp (AVR) và cung cấp thời gian đủ để người quản trị tắt hệ thống an toàn.
4.1.2. Hệ thống Tiếp địa (Grounding) và Chống sét
Tiếp địa: Là việc kết nối vỏ các thiết bị (Server, Switch) với đất. Mục đích là triệt tiêu các dòng điện rò rỉ, bảo vệ người vận hành khỏi bị điện giật và tránh nhiễu cho tín hiệu mạng.
Chống sét: Sử dụng các thiết bị cắt lọc sét (SPD) để dẫn luồng điện cực lớn từ sét xuống đất, ngăn chặn việc phá hủy bo mạch của thiết bị mạng thông qua đường dây điện hoặc dây cáp quang có lõi thép.
4.2. Quy trình bảo trì và xử lý sự cố chi tiết
4.2.1. Kiểm tra vật lý và trạng thái ắc quy (Battery)
Nguyên nhân: Ắc quy có tuổi thọ giới hạn (thường 2-3 năm). Nếu không kiểm tra, khi mất điện thật, UPS sẽ bị sập ngay lập tức.
Biểu hiện: Đèn “Replace Battery” sáng, có tiếng bíp kéo dài, hoặc vỏ ắc quy bị phồng, có mùi axit.
Thao tác thực hiện:
Kiểm tra ngoại quan: Xem các đầu cực có bị rỉ sét (sunfat hóa) không. Vệ sinh các đầu cắm bằng bàn chải mềm.
Thực hiện quy trình Xả/Nạp (Self-test): Sử dụng nút bấm trên UPS hoặc phần mềm để kích hoạt chế độ tự kiểm tra. Cho phép UPS chạy bằng pin trong khoảng 5-10 phút để đánh giá độ sụt áp.
Thay thế định kỳ: Ghi chú ngày lắp đặt pin để có kế hoạch thay thế chủ động trước khi pin hỏng hoàn toàn.
4.2.2. Cấu hình quản trị và hệ thống cảnh báo
Nguyên nhân: Người quản trị không phải lúc nào cũng có mặt tại phòng máy để biết sự cố điện.
Thao tác thực hiện:
Kết nối quản trị: Cắm dây USB hoặc dây mạng (Card SNMP) từ UPS vào máy chủ.
Thiết lập thông số: Cấu hình thời gian tự động tắt máy chủ (Auto Shutdown) khi pin chỉ còn 15-20% để tránh lỗi hệ điều hành.
Cấu hình cảnh báo: Thiết lập SMTP để UPS gửi Email/SMS thông báo khi có các sự kiện: Mất điện (On Battery), Pin yếu (Low Battery), hoặc Nhiệt độ quá cao.
4.2.3. Kiểm tra hệ thống chống sét và tiếp địa (Grounding)
Nguyên nhân: Dây tiếp địa bị đứt hoặc điện trở đất quá cao (> 5 Ohm) làm mất khả năng bảo vệ.
Biểu hiện: Người vận hành bị tê tay khi chạm vào tủ Rack; các cổng mạng thường xuyên bị hỏng trong mùa mưa bão.
Nhận biết: Nhìn vào đèn “Site Wiring Fault” trên UPS. Nếu đèn này đỏ, nghĩa là hệ thống điện đang bị lỗi tiếp địa hoặc đảo cực.
Quy trình xử lý:
Kiểm tra liên kết: Đảm bảo tất cả vỏ thiết bị trong tủ Rack đều được nối dây đồng vào thanh đồng tiếp địa của tủ.
Đo điện trở đất: Sử dụng máy đo chuyên dụng. Nếu điện trở cao, cần thực hiện đổ thêm hóa chất giảm điện trở hoặc đóng thêm cọc đồng.
Kiểm tra thiết bị cắt lọc sét: Xem các viên chống sét trên tủ điện. Nếu chuyển sang màu đỏ (mất tác dụng), cần thực hiện thay thế ngay.
5. Quy trình vệ sinh công nghiệp cho phòng Server và tủ Rack
5.1. Lý thuyết liên quan: Tiêu chuẩn phòng máy và tủ Rack hiện đại
5.1.1. Khái niệm về Vệ sinh công nghiệp trong CNTT
Tầm quan trọng: Bụi bẩn là “kẻ thù thầm lặng” gây ra hiện tượng phóng điện bề mặt, làm tăng nhiệt độ thiết bị và gây kẹt quạt tản nhiệt. Vệ sinh công nghiệp không chỉ là làm sạch mà là quá trình kiểm soát môi trường hoạt động của thiết bị.
Tĩnh điện (ESD): Trong quá trình vệ sinh, sự ma sát có thể tạo ra tĩnh điện hàng ngàn Vol. Nếu không kiểm soát, tĩnh điện sẽ đánh thủng các vi mạch nhạy cảm trên máy chủ.
5.1.2. Cấu tạo và tiêu chuẩn sắp xếp tủ Rack (Cabinet)
Đơn vị U (Rack Unit): 1U = 1.75 inch (4.45 cm). Đây là đơn vị tiêu chuẩn để tính chiều cao thiết bị lắp trong tủ.
Nguyên tắc đối lưu không khí: Không khí lạnh đi vào từ mặt trước, đi xuyên qua thiết bị để lấy nhiệt và khí nóng được đẩy ra mặt sau (Nguyên tắc Hot aisle/Cold aisle).
Quản lý cáp (Cable Management): Việc sắp xếp dây dẫn không chỉ vì thẩm mỹ mà còn để đảm bảo luồng khí không bị cản trở và dễ dàng truy xuất khi có sự cố.
5.2. Quy trình vệ sinh công nghiệp và sắp xếp chi tiết
Bước 1: Chuẩn bị dụng cụ chuyên dụng
Dụng cụ: Máy hút bụi chống tĩnh điện (HEPA filter), bình khí nén (Canned air), bộ vòng tay chống tĩnh điện (ESD Wrist Strap), khăn lau Microfiber (không để lại sợi vải), dung dịch vệ sinh chuyên dụng (không dẫn điện).
Lưu ý: Tuyệt đối không dùng máy nén khí công suất lớn (có thể chứa hơi nước) hoặc chổi lông gà (tạo tĩnh điện cao).
Bước 2: Vệ sinh mặt ngoài và môi trường xung quanh
Thao tác thực hiện:
Làm sạch sàn nâng: Hút bụi dưới sàn nâng và xung quanh chân tủ Rack để tránh bụi bị hút ngược vào thiết bị.
Lau chùi vỏ tủ: Vệ sinh cánh cửa lưới, các tấm panel hông tủ. Kiểm tra các lỗ thông hơi đảm bảo không bị bít kín.
Kiểm tra hệ thống làm mát: Vệ sinh lưới lọc bụi của máy lạnh phòng Server.
Bước 3: Vệ sinh bên trong thiết bị mạng và Máy chủ
Nguyên nhân: Bụi bám trên bo mạch gây hiện tượng “nhiệt cục bộ”, làm giảm tuổi thọ tụ điện.
Thao tác thực hiện:
Tắt thiết bị (nếu được phép): Thông báo và tắt các thiết bị không có chế độ chạy dự phòng.
Hút bụi: Đưa đầu hút bụi lại gần các khe thông gió, dùng khí nén thổi nhẹ từ trong ra ngoài để bụi bay ra và máy hút bụi thu gom lại.
Lau cánh quạt: Dùng tăm bông tẩm cồn lau sạch bụi bám trên cánh quạt tản nhiệt của Switch và Server.
Bước 4: Sắp xếp thiết bị và quản lý cáp (Cable Management)
Nguyên tắc sắp xếp:
Thiết bị nặng ở dưới: UPS và các máy chủ nặng lắp ở dưới cùng để đảm bảo trọng tâm tủ, tránh đổ tủ.
Thiết bị kết nối ở trên: Patch Panel và Switch thường đặt ở ngang tầm mắt (giữa tủ) để dễ dàng thao tác cắm rút dây nhảy.
Quản lý dây dẫn:
Sử dụng thanh quản lý cáp: Chạy dây mạng dọc theo hai bên hông tủ, sử dụng thanh quản lý cáp ngang để giấu dây thừa.
Dây buộc Velcro: Tuyệt đối không dùng lạt nhựa (Zip ties) thắt quá chặt gây gãy lõi cáp quang/cáp đồng; sử dụng dây dán Velcro để bó cáp.
Đánh nhãn (Labeling): Dán nhãn ở cả hai đầu dây nhảy (ví dụ: “Server01 – Port 05”) để nhận diện tức thì khi bảo trì.
6. Kỹ thuật chuẩn đoán lỗi phần cứng qua LED và Beep code
6.1. Lý thuyết liên quan: Hệ thống cảnh báo không qua màn hình
6.1.1. Tầm quan trọng của chuẩn đoán nhanh
Trong quản trị hệ thống, đặc biệt là với máy chủ (Server), thiết bị thường được đặt trong tủ Rack và không kết nối màn hình liên tục. Khi hệ thống gặp sự cố không thể khởi động (No Post), các tín hiệu thị giác (Đèn LED) và thính giác (Âm thanh Beep) là phương thức duy nhất để thiết bị “giao tiếp” với người bảo trì.
6.1.2. Cơ chế POST (Power-On Self-Test)
Mọi thiết bị điện tử (Server, Switch, Router) khi bật nguồn đều thực hiện quy trình tự kiểm tra. Nếu một linh kiện thiết yếu (CPU, RAM, Chipset) bị lỗi, quy trình này sẽ dừng lại và phát ra tín hiệu cảnh báo thông qua mã đèn hoặc mã âm thanh tương ứng.
6.2. Quy trình chẩn đoán lỗi chi tiết
6.2.1. Chuẩn đoán qua hệ thống đèn LED tín hiệu
Nguyên nhân: Lỗi nguồn, quá nhiệt, hỏng linh kiện hoặc mất kết nối vật lý.
Biểu hiện & Cách nhận biết:
Đèn trạng thái hệ thống (System Status LED):
Xanh (Steady Green): Hệ thống hoạt động bình thường.
Cam/Vàng (Amber/Yellow): Cảnh báo lỗi nhẹ (Ví dụ: Một nguồn phụ bị hỏng, nhiệt độ cao, hoặc một ổ cứng trong dãy RAID bị lỗi).
Đỏ (Red): Lỗi nghiêm trọng, hệ thống thường sẽ tự ngắt để bảo vệ linh kiện (Ví dụ: Lỗi CPU, lỗi bo mạch chủ).
Đèn cổng mạng (Network Port LED):
Đèn Link (L): Sáng xanh báo hiệu có kết nối vật lý lớp 1 thành công. Nếu tắt, cần kiểm tra cáp hoặc cổng đối diện.
Đèn Activity (A): Nhấp nháy xanh báo hiệu có dữ liệu đang truyền nhận. Nếu sáng đứng hoặc tắt lịm trong khi đèn Link vẫn sáng, có thể cổng bị treo hoặc lỗi cấu hình phần mềm.
6.2.2. Chuẩn đoán qua mã âm thanh (Beep Code)
Nguyên nhân: Thường dùng cho Máy chủ (Server) hoặc máy trạm khi không thể xuất hình ảnh ra màn hình do lỗi phần cứng lõi.
Cách nhận biết: Ngay sau khi nhấn nút nguồn, đếm số lượng tiếng bíp (ngắn/dài).
Quy trình xử lý các mã phổ biến:
1 tiếng Bíp ngắn: Khởi động thành công (Bình thường).
Tiếng Bíp dài liên tục hoặc bíp ngắn liên tục: Thường là lỗi RAM.
Xử lý: Tháo RAM, vệ sinh chân đồng bằng gôm/tẩy và cắm lại chắc chắn.
1 bíp dài, 2 hoặc 3 bíp ngắn: Thường là lỗi Card đồ họa (VGA) hoặc cổng xuất hình.
Tiếng bíp ngắt quãng cao độ (tiếng còi hú): Cảnh báo CPU quá nhiệt.
Xử lý: Kiểm tra ngay quạt tản nhiệt CPU và keo tản nhiệt.
6.3. Bảng tổng hợp chẩn đoán nhanh (Dành cho túi đồ nghề kỹ thuật)
| Tín hiệu | Ý nghĩa | Hành động khắc phục |
| LED đỏ tại PSU | Lỗi nguồn điện | Kiểm tra dây nguồn, đổi bộ nguồn dự phòng |
| LED cam tại Disk | Ổ cứng sắp hỏng | Sao lưu dữ liệu ngay và thay ổ cứng mới |
| Beep liên tục | Lỗi nhận diện RAM | Vệ sinh lại khe cắm và chân RAM |
| LED Link tắt | Mất kết nối vật lý | Kiểm tra cáp mạng, đầu bấm hoặc cổng Switch |
Bài tập 1.1: Bảo trì vật lý Server và Switch.
Tháo vỏ máy chủ, sử dụng khí nén vệ sinh bụi bẩn.
Kiểm tra các module RAM, quạt tản nhiệt.
Đeo vòng chống tĩnh điện khi thực hiện thao tác.
Bài tập 1.2: Kiểm tra cáp quang và cáp đồng.
Sử dụng bút soi quang để kiểm tra tính thông suốt của dây nhảy quang (Patch cord).
Sử dụng máy đo LAN để kiểm tra độ dài và chất lượng cáp Cat6.
Bài tập 1.3: Quản trị UPS.
Kết nối máy tính với UPS qua cổng USB/Network.
Đọc các thông số: Điện áp vào, công suất tải, thời gian dự phòng còn lại.
Câu hỏi ôn tập
Tại sao phải đeo vòng chống tĩnh điện khi bảo trì linh kiện bên trong máy chủ?
Cáp quang Single-mode và Multi-mode khác nhau như thế nào về màu sắc và phạm vi sử dụng?
Khi đèn trạng thái trên Switch chuyển sang màu Cam nhấp nháy, điều đó thường báo hiệu sự cố gì?
Nêu các bước cơ bản để vệ sinh một tủ Rack đang hoạt động.
Việc kiểm tra định kỳ ắc quy UPS có ý nghĩa gì đối với sự an toàn của dữ liệu?
