SupremeRAID: Hiệu suất vượt trội và khả năng phục hồi ôn hòa cho công việc AI và HPC

Graid Technology đặt ra các tiêu chuẩn mới về hiệu suất và bảo vệ dữ liệu với SupremeRAID, đặc biệt dành cho khối lượng công việc AI và HPC.

SupremeRAID của Graid Technology tiếp tục định nghĩa lại bối cảnh lưu trữ bằng cách thiết lập các tiêu chuẩn bảo vệ dữ liệu và hiệu suất mới, đặc biệt là đối với các khối lượng công việc hiện đại như AI và Điện toán hiệu suất cao (HPC). Các cấu hình RAID truyền thống thường gặp khó khăn trong việc đáp ứng nhu cầu của các môi trường dữ liệu chuyên sâu này, đặc biệt là khi phụ thuộc vào các card RAID phần cứng bị hạn chế bởi các hạn chế của bus PCIe. Tận dụng khả năng tăng tốc GPU, Graid phá vỡ các rào cản này, mang lại hiệu suất vượt trội với tác động tối thiểu đến tài nguyên CPU trong khi vẫn đảm bảo khả năng bảo vệ RAID mạnh mẽ.

Graid SupremeRAID cho AI và HPC

Máy chủ Gigabyte S183-SH0-AAV1

Trong các khối lượng công việc nâng cao như AI và HPC, các cấu hình thay thế như JBOD (Just a Bunch of Disks) và RAID phần mềm (mdadm) cũng thường được sử dụng. Mặc dù thực tế khi kết hợp với kiểm tra điểm để ngăn ngừa mất dữ liệu, JBOD lại tạo ra nhiều điểm lỗi hơn và gây gánh nặng cho quản trị viên CNTT với các quy trình khôi phục đầy thách thức. RAID phần mềm cung cấp khả năng phục hồi dữ liệu nhưng lại làm cạn kiệt các tài nguyên CPU có giá trị để quản lý dữ liệu chẵn lẻ RAID và hoạt động kém hiệu quả ở nhiều khía cạnh. Ngược lại, SupremeRAID của Graid cung cấp giải pháp hợp lý, hiệu suất cao giúp đơn giản hóa việc quản lý dữ liệu mà không ảnh hưởng đến tốc độ hoặc độ tin cậy.

Thẻ Graid SupremeRAID

Bài viết này sẽ khám phá sự so sánh hiệu suất giữa SupremeRAID, JBOD và RAID phần mềm của Graid, minh họa lý do tại sao Graid nổi lên như sự lựa chọn vượt trội cho môi trường CNTT nơi hiệu suất và bảo vệ dữ liệu là tối quan trọng.

Nền tảng thử nghiệm hiệu suất

Chúng tôi đã sử dụng Gigabyte S183-SH0-AAV1 Máy chủ Intel thế hệ thứ 5 Scalable 1U kép cho giường thử nghiệm này. Chúng tôi muốn tìm một máy chủ nhỏ gọn với nhiều sức mạnh tính toán và tình cờ là máy chủ hỗ trợ 32 SSD E1.S, tối đa được hỗ trợ bởi một Graid SupremeRAID SR-1010. Máy chủ Gigabyte có 32 khe cắm DIMM, với hỗ trợ 96GB RDIMM và 256GB 3DS RDIMM. Nền tảng này cung cấp ba khe cắm FHHL PCIe Gen5 ở phía sau, mang đến nhiều tùy chọn cho kết nối mạng tốc độ cao. Ngoài ra, bo mạch chủ cung cấp mạng tích hợp 1GbE kép và cổng quản lý 1GbE.

DRAM HPC Graid

Kingston 96GB DDR5-5600 ECC RDIMM

Máy chủ hỗ trợ 32 khe cắm DIMM, nhưng trong trường hợp này, chúng tôi đã lắp 16 Kingston DIMM, 1 DIMM cho mỗi kênh (1DPC) để có tốc độ DRAM tối đa. Nếu khối lượng công việc đòi hỏi diện tích lớn hơn, có thể chuyển sang DIMM mật độ cao hơn hoặc cấu hình 2DPC, nhưng cấu hình sau sẽ giảm tốc độ DRAM xuống còn 4400MT/giây. Các Kingston 96GB DDR5-5600 ECC RDIMM trong máy chủ này cung cấp sự kết hợp tuyệt vời giữa hiệu suất trên mỗi đô la, khiến chúng trở thành lựa chọn hấp dẫn cho khối lượng công việc cần DRAM tốc độ cao và diện tích DRAM hợp lý mà không phải trả thêm chi phí cho DIMM 128GB. Các mô-đun này cung cấp những điều tốt nhất của cả hai thế giới cho khối lượng công việc HPC và AI chuyên sâu.

Ổ cứng SSD KIOXIA 7.68TB XD7P

32 khay ổ SSD E1.S được lắp đặt các ổ SSD KIOXIA 7.68TB XD7P. Các ổ đĩa này sử dụng giao diện PCIe Gen4 x2 và cung cấp băng thông tối đa là 7,2GB/giây đọc và 4,8GB/giây ghi. KIOXIA đã thiết kế các ổ đĩa này dành riêng cho khối lượng công việc siêu quy mô và HPC chuyên sâu, trong đó lợi thế về mật độ của ổ SSD E1.S rất có lợi. Điều quan trọng là KIOXIA đã đảm bảo thiết kế nhiệt của XD7P sẵn sàng theo kịp thiết kế máy chủ dày đặc này, ngay cả khi tải nặng.

I/O phía sau máy chủ Gigabyte S183-SH0-AAV1

Thông số kỹ thuật của hệ thống kiểm tra

  • Máy chủ Gigabyte S183-SH0-AAV1
  • 2 x CPU Intel Xeon Platinum 8592+ (64 lõi, 1,9 GHz)
  • 16 x 96GB Kingston DDR5-5600
  • 32 x KIOXIA XD7P 7.68TB E1.S SSD
  • SupremeRAID SR-1010
  • Máy chủ Ubuntu 22.04.4

Kết quả kiểm tra hiệu suất

Khối lượng công việc HPC có thể hoạt động trong nhiều ngày, nhiều tuần hoặc nhiều tháng và nếu không có bộ lưu trữ backend phục hồi, một lỗi ổ đĩa đơn có thể khiến các công việc này trở lại vạch xuất phát. Để đánh giá tác động của Graid đối với cả khả năng phục hồi và hiệu suất cho khối lượng công việc HPC và Ai, chúng tôi xem xét hiệu suất của chuẩn lưu trữ nội bộ của y-cruncher. Mục tiêu là so sánh nhiều cấu hình lưu trữ, JBOD, RAID phần mềm và Graid SupremeRAID, để hiểu tác động của chúng đối với khối lượng công việc sử dụng nhiều CPU.

Cấu hình RAID

Chúng tôi biết rằng mdadm software RAID thấy một cú đánh ghi đáng kể cho dữ liệu chẵn lẻ. Trong khi RAID10 sẽ đạt được hiệu suất cao hơn, nó cũng sẽ làm giảm đáng kể dung lượng sử dụng được. Để tối ưu hóa hiệu suất RAID5 của phần mềm tốt nhất, chúng tôi đã cấu hình hai nhóm RAID5, chia thành các ổ SSD 0-15 và 16-31. Điều này cân bằng chúng trên cả hai CPU.

So sánh Graid cũng được điều chỉnh để sử dụng hai nhóm RAID5, với sự phân chia đều một nửa số SSD trên CPU0 và một nửa còn lại trên CPU1 để cân bằng NUMA. Chúng tôi đã thử nghiệm với một ổ đĩa duy nhất trên mỗi nhóm RAID5 cũng như hai ổ đĩa trên mỗi nhóm RAID5.

Mỗi ổ đĩa được ánh xạ riêng trong cấu hình JBOD, đảm bảo cân bằng NUMA đồng đều.

Chúng tôi không thể đưa RAID phần cứng vào báo cáo này vì cách các ổ đĩa được kết nối bằng cáp trong máy chủ này khiến các card RIAD phần cứng truyền thống không được hỗ trợ. Tuy nhiên, cần lưu ý rằng ngay cả khi chúng tôi có thể, kịch bản tốt nhất sẽ là đạt đến giới hạn băng thông của khe cắm PCIe Gen4 x16 cho một card duy nhất, khoảng 28GB/giây.

Cấu hình phần mềm

Đối với những tình huống lưu trữ khác nhau này, chúng tôi đã sử dụng máy nghiền yCông cụ kiểm tra hiệu suất nội bộ của '. Kết quả kiểm tra được chia thành hiệu suất đọc và ghi tuần tự, tốc độ I/O tính toán, tốc độ I/O đĩa và tỷ lệ giữa tốc độ I/O đĩa và tốc độ tính toán. Chúng tôi đã chọn công cụ này vì nó đồng thời gây áp lực lên CPU, bộ nhớ và I/O ổ đĩa. Mặc dù nó không đại diện cho bất kỳ khối lượng công việc cụ thể nào, nhưng chúng tôi thấy rằng dữ liệu mà nó tạo ra có mối tương quan chặt chẽ với hiệu suất hệ thống tổng thể trong các ứng dụng nặng về I/O. Đáng chú ý là thử nghiệm I/O bao gồm xử lý dữ liệu thực tế thay vì chỉ đẩy bit qua giao diện nhanh nhất có thể, khiến nó phản ánh chính xác hơn hiệu suất hệ thống trong tải thực tế.

Hiệu suất đọc và ghi tuần tự cho biết tốc độ thô của mảng đĩa. Tốc độ tính toán là tốc độ mà CPU xử lý dữ liệu, trong khi tốc độ I/O của đĩa là tốc độ dữ liệu có thể truyền đến CPU khi công việc tính toán diễn ra. Các khối lượng công việc chuyển đến đĩa cần tốc độ I/O của đĩa cao hơn tốc độ tính toán để không bị chậm lại. Nếu tỷ lệ này nhỏ hơn 1.0, đĩa là nút thắt cổ chai, trong khi trên 1.0, CPU là nút thắt cổ chai. y-cruncher cho khối lượng công việc lớn hoạt động tốt nhất khi tỷ lệ là 2.0 hoặc cao hơn.

Cấu hình lưu trữ Đọc tuần tự GB/giây Ghi tuần tự GB/giây Tính toán GB/giây Đĩa I/O GB/giây Tỷ lệ
JBOD trực tiếp 102 102 18.4 81,5 4,42
RAID5 x 2 2VD 64,3 43,8 23.1 70,4 3.05
RAID5 x 2 4VD 85,2 73,7 22.1 69,4 3.14
Phần mềm RAID5 x 2 122 3.6 25,7 10.9 0,42

Với JBOD trực tiếp tới 32 ổ SSD E1.S riêng lẻ, y-cruncher đã thấy hiệu suất đọc 102GB/giây và ghi 102GB/giây với quy trình phân chia dữ liệu nội bộ của nó. Đây thường là hiệu suất cao nhất mà y-cruncher sẽ thấy đối với nền tảng này, mặc dù sự đánh đổi là không có sự ngang bằng dữ liệu. Khi cấu hình được chuyển sang ổ đĩa RAID5 phần mềm (trải rộng trên cả hai CPU) với mdadm, hiệu suất tuần tự giảm mạnh xuống chỉ còn 3,6GB/giây ghi và 122GB/giây đọc. Graid với hai nhóm RAID5 và hai ổ đĩa đo được 64,3Gb/giây đọc với hiệu suất ghi là 43,8GB/giây. Chia thành hai nhóm RAID5 nhưng với bốn ổ đĩa, Graid đã thấy băng thông tăng lên 85,2GB/giây đọc và 73,7GB/giây ghi.

Với các số băng thông được giải quyết và phổ các tùy chọn cấu hình lưu trữ được hiểu rõ, chúng tôi đi sâu vào tác động của quyết định này đối với ứng dụng. Tỷ lệ tính toán trên băng thông I/O của đĩa đạt tỷ lệ cao nhất là 4,43 từ cấu hình JBOD. RAID5 phần mềm chỉ là 0,42, trong khi RAID5 Graid là 3,05 với 2VD và 3,14 với 4VD.

Trong ví dụ y-cruncher này, bao gồm tất cả các khả năng hiệu suất của máy chủ, tỷ lệ 2.0 trở lên là cần thiết để có hiệu suất tối ưu. Mặc dù cấu hình JBOD mang lại kết quả tổng thể tốt nhất, nhưng nó phải trả giá bằng dữ liệu chẵn lẻ, nghĩa là lỗi của bất kỳ ổ đĩa nào, ngay cả trong một khoảnh khắc, cũng có nghĩa là mất dữ liệu. Mặt khác, RAID phần mềm có thể cung cấp khả năng truy cập dữ liệu và tốc độ đọc cao hơn JBOD, nhưng các lần ghi bị ảnh hưởng nghiêm trọng đến mức I/O của đĩa không thể theo kịp CPU, dẫn đến kết quả tệ hại là .42.

Hai điểm dữ liệu đó rất quan trọng để hiểu được lợi ích mà Graid SupremeRAID mang lại cho các khối lượng công việc này. Đối với trường hợp sử dụng này, các số liệu hiệu suất tổng hợp nằm giữa JBOD và RAID phần mềm, nhưng I/O thô không phải là toàn bộ câu chuyện. Ví dụ này cho thấy Graid có thể cung cấp nhiều hơn hiệu suất ứng dụng cần thiết trong khi vẫn cung cấp tính khả dụng của dữ liệu. Sự kết hợp này có nghĩa là các tổ chức sử dụng Graid có thể mong đợi khả năng bảo vệ RAID, lưu trữ và hiệu suất ứng dụng với kiến ​​trúc không chặn vượt xa những gì một thẻ RAID truyền thống có thể cung cấp.

Phần kết luận

SupremeRAID của Graid Technology liên tục đẩy mạnh ranh giới bảo vệ dữ liệu và hiệu suất, thiết lập một tiêu chuẩn mới trong ngành. Bằng cách khai thác sức mạnh của khả năng tăng tốc GPU, Graid mang lại tốc độ và hiệu quả vô song trong cấu hình RAID, giảm đáng kể áp lực cho CPU trong khi tối đa hóa thông lượng.

Dữ liệu chúng tôi thu thập cho báo cáo này chứng minh khả năng của Graid trong việc đảm bảo bảo vệ dữ liệu mạnh mẽ trong khi vẫn đáp ứng các yêu cầu khắt khe của khối lượng công việc AI và HPC hiện đại—những lĩnh vực mà các giải pháp RAID truyền thống và RAID phần mềm thường không đáp ứng được. Hiệu quả này cho phép các tài nguyên hệ thống quan trọng như CPU, DRAM và lưu trữ đóng góp đầy đủ vào hiệu suất của các ứng dụng mà chúng được thiết kế để hỗ trợ, nâng cao giá trị và hiệu quả chung của hệ thống.

Công nghệ Graid

Báo cáo này được tài trợ bởi Graid Technology. Mọi quan điểm và ý kiến ​​được nêu trong báo cáo này đều dựa trên quan điểm khách quan của chúng tôi về sản phẩm đang được xem xét.

Tham gia với StorageReview

Bản tin | YouTube | Tập tin âm thanh iTunes/Spotify | Instagram | Twitter | TikTok | Nguồn cấp RSS


Xem chi tiết và đăng kýXem chi tiết và đăng ký