RAID là một công nghệ lưu trữ dữ liệu phổ biến hiện nay. Trong đó , RAID 0 là một công nghệ đơn giản, có thể bảo vệ dữ liệu khi drive bị lỗi. Vậy đặc điểm của RAID 0 và các RAID khác là gì? Chúng được dùng trong những trường hợp nào?
Xem thêm: RAID là gì? Nó được tổ chức như thế nào?
Nội dung
RAID là gì?
RAID là một công nghệ được sử dụng để tăng hiệu suất và độ tin cậy của việc lưu trữ dữ liệu. Đây là viết tắt của cụm từ Redundant Array of Independent Drives hoặc Redundant Array of Inexpensive Disks. Cụm từ ở sau là phiên bản cũ hơn và ít được sử dụng hơn. Một hệ thống RAID bao gồm hai hoặc nhiều ổ đĩa hoạt động song song. Đây có thể là đĩa cứng (hard discs), nhưng cũng có xu hướng sử dụng công nghệ dành cho SSD (Solid State Drives).
Có các cấp độ RAID khác nhau, mỗi cấp được tối ưu hóa cho một tình huống cụ thể. Chúng không được tiêu chuẩn hóa bởi một nhóm ngành hoặc chứng nhận tiêu chuẩn hóa. Điều này giải thích tại sao các công ty đôi khi đưa ra những con số và cách triển khai độc đáo của riêng họ. Bài viết này đề cập đến các cấp độ RAID sau:
Các cấp độ RAID phổ biến
- RAID 0 – striping
- RAID 1 – mirroring
- Cấp độ 5 (RAID 5) – striping with parity
- Cấp độ 6 (RAID 6) – striping with double parity
- RAID 10 – kết hợp mirroring và striping
Phần mềm để thực hiện chức năng RAID và điều khiển các ổ đĩa có thể được đặt trên một thẻ điều khiển riêng biệt (bộ điều khiển phần cứng RAID). Hoặc nó có thể đơn giản là một driver. Một số phiên bản của Windows, chẳng hạn như Windows Server 2012 cũng như Mac OS X, chứa chức năng RAID phần mềm. Bộ điều khiển RAID phần cứng đắt hơn phần mềm thuần túy. Nhưng chúng cũng mang lại hiệu suất tốt hơn, đặc biệt là với RAID 5 và 6.
Các RAID-system có thể được sử dụng với nhiều giao diện khác nhau. Bao gồm SATA, SCSI, IDE hoặc FC (kênh cáp quang.) Có những hệ thống sử dụng các đĩa SATA bên trong. Nhưng lại có giao diện FireWire hoặc SCSI cho hệ thống máy chủ (host).
Đôi khi các đĩa trong hệ thống lưu trữ được định nghĩa là JBOD, viết tắt của Just a Bunch Of Disks. Điều này có nghĩa là những đĩa đó không sử dụng một cấp độ RAID cụ thể. Và chúng cũng hoạt động như những đĩa độc lập. Điều này thường được thực hiện đối với các ổ đĩa chứa files hoán đổi hoặc data đệm.
Dưới đây là tổng quan về các mức RAID phổ biến nhất:
RAID 0 – Stripping
Trong RAID 0, dữ liệu hệ thống được chia thành các block được ghi trên tất cả các ổ đĩa nằm trong mảng. Khi sử dụng nhiều đĩa (ít nhất 2) cùng một lúc, hiệu suất I / O sẽ được cải thiện vượt trội. Hiệu suất này có thể được nâng cao hơn nữa bằng cách sử dụng nhiều bộ điều khiển. Lý tưởng nhất là một bộ điều khiển trên từng đĩa.
Ưu điểm của RAID 0
- RAID 0 cung cấp hiệu suất tuyệt vời, cả trong hoạt động đọc và ghi. Không bị overhead do parity control.
- Tất cả dung lượng lưu trữ được sử dụng, không bị overhead.
- Dễ thực hiện.
Nhược điểm của RAID 0
- RAID 0 không có khả năng chịu lỗi. Nếu một ổ đĩa bị lỗi, tất cả dữ liệu trong mảng RAID 0 sẽ bị mất. Nó không nên được sử dụng cho các hệ thống có nhiệm vụ quan trọng.
Các trường hợp sử dụng lý tưởng
RAID 0 lý tưởng cho việc lưu trữ dữ liệu không quan trọng cần được đọc / ghi ở tốc độ cao. Chẳng hạn như trên chỉnh sửa hình ảnh hoặc video.
Giả sử bạn muốn sử dụng RAID 0 thuần túy để kết hợp dung lượng lưu trữ của các ổ đĩa twee trong một ổ đĩa duy nhất. Khi đó, hãy cân nhắc việc mount một ổ đĩa vào đường dẫn thư mục (folder) của ổ đĩa kia. Điều này được hỗ trợ trong Linux, OS X cũng như Windows. Ngoài ra, nó có ưu điểm là một drive đơn bị lỗi không ảnh hưởng đến dữ liệu của disk thứ hai drive SSD.
RAID cấp độ 1 – Mirroring
Dữ liệu được lưu trữ hai lần bằng cách ghi chúng vào cả ổ dữ liệu data drive (hoặc tập hợp các ổ dữ liệu) và ổ mirror (hoặc tập hợp các ổ dữ liệu). Nếu một drive bị lỗi, bộ điều khiển sử dụng data drive hoặc mirror drive để khôi phục dữ liệu nhằm hoạt động liên tục. Bạn cần ít nhất 2 ổ đĩa cho một array RAID 1.
Ưu điểm của RAID 1
- RAID 1 cung cấp tốc độ đọc tuyệt vời và tốc độ ghi có thể so sánh với tốc độ của một ổ đĩa duy nhất.
- Trong trường hợp một ổ đĩa bị lỗi, dữ liệu không cần phải được xây dựng lại. Chỉ cần sao chép chúng vào ổ đĩa drive thay thế.
- Tính đơn giản.
Nhược điểm của RAID 1
- Nhược điểm chính là dung lượng lưu trữ hiệu quả chỉ bằng một nửa tổng dung lượng drive. Vì tất cả dữ liệu đều được ghi hai lần.
- Các giải pháp phần mềm RAID 1 không phải lúc nào cũng cho phép hoán đổi nhanh ở drive bị lỗi. Điều đó có nghĩa là drive bị lỗi chỉ có thể được thay thế sau khi tắt nguồn máy tính mà nó được gắn vào. Đối với các server được sử dụng đồng thời bởi nhiều người, điều này có thể không được chấp nhận. Các hệ thống như vậy thường sử dụng bộ điều khiển phần cứng hỗ trợ hoán đổi nhanh.
Sử dụng lý tưởng
RAID-1 lý tưởng cho nhiệm vụ lưu trữ quan trọng, chẳng hạn như cho các hệ thống kế toán. Nó cũng thích hợp cho các server nhỏ, trong đó chỉ có hai drive dữ liệu sẽ được sử dụng.
RAID cấp độ 5 – Striping with parity
RAID 5 là cấp độ RAID an toàn phổ biến nhất. Nó yêu cầu ít nhất 3 drives nhưng có thể hoạt động lên tối đa tới 16. Các khối dữ liệu được phân chia dọc các ổ drive. Và trên một drive, một parity checksum của tất cả block dữ liệu đều được ghi. Dữ liệu parity (chẵn lẻ) không được ghi vào một drive cố định, chúng được trải rộng trên tất cả các drives. Như hình vẽ bên dưới cho thấy.
Sử dụng dữ liệu parity, máy tính có thể tính toán lại dữ liệu của một trong các khối dữ liệu khác, nếu những dữ liệu đó không còn nữa. Điều đó có nghĩa là, một array RAID 5 có thể chịu được một lỗi drive đơn lẻ mà không làm mất dữ liệu hoặc quyền truy cập vào dữ liệu. Mặc dù có thể sqr dụng RAID 5 trong phần mềm, nhưng ta nên sử dụng bộ điều khiển phần cứng. Thường thì bộ nhớ đệm (cache) bổ sung được sử dụng trên các bộ điều khiển này để cải thiện hiệu suất ghi.
Ưu điểm của RAID 5
- Các giao dịch dữ liệu đọc rất nhanh trong khi các giao dịch dữ liệu ghi có phần chậm hơn (do parity phải được tính toán).
- Nếu một drive bị lỗi, bạn vẫn có quyền truy cập vào tất cả dữ liệu. Ngay cả khi drive bị lỗi đang được thay thế và bộ điều khiển lưu trữ rebuild dữ liệu trên ổ đĩa mới.
Nhược điểm của RAID 5
- Lỗi drive có ảnh hưởng đến thông lượng, mặc dù điều này vẫn có thể chấp nhận được.
- Đây là công nghệ phức tạp. Nếu một trong các đĩa trong mảng sử dụng đĩa 4TB bị lỗi và cần thay thế, việc khôi phục dữ liệu có thể mất một ngày hoặc lâu hơn. Việc này tùy thuộc vào load trên array và tốc độ của bộ điều khiển. Nếu một đĩa khác bị hỏng trong thời gian đó, dữ liệu sẽ bị mất vĩnh viễn.
Sử dụng lý tưởng
RAID 5 là một hệ thống toàn diện tốt, kết hợp khả năng lưu trữ hiệu quả với khả năng bảo mật tuyệt vời và hiệu suất tốt. Nó lý tưởng cho các server file và ứng dụng có số lượng ổ đĩa dữ liệu hạn chế.
RAID cấp độ 6 – Stripping with double parity
RAID 6 giống như RAID 5, nhưng dữ liệu chẵn lẻ (parity) được ghi vào hai ổ đĩa. Điều đó có nghĩa là nó cần ít nhất 4 drive và có thể chịu được 2 drive đồng thời. Tất nhiên, khả năng hai drive bị hỏng vào cùng một thời điểm là rất nhỏ. Tuy nhiên, nếu một drive trong hệ thống RAID 5 bị chết và được thay thế bằng một drive mới, thì phải mất hàng giờ hoặc thậm chí hơn một ngày để rebuild drive đã hoán đổi. Nếu một drive khác bị chết trong thời gian đó, bạn vẫn mất tất cả dữ liệu của mình. Ở trường hợp thứ hai, với RAID 6, array RAID thậm chí vẫn sẽ tồn tại.
Ưu điểm của RAID 6
- Giống như với RAID 5, các chuyển đổi dữ liệu đọc rất nhanh.
- Nếu hai drive bị lỗi, bạn vẫn có quyền truy cập vào tất cả dữ liệu. Nngay cả khi các drive bị lỗi đang được thay thế. Vì vậy RAID 6 bảo mật hơn RAID 5.
Nhược điểm của RAID 6
- Ghi dữ liệu chuyển đổi chậm hơn RAID 5 do dữ liệu parity bổ sung phải được tính toán. Một báo cáo từng cho thấy hiệu suất ghi của RAID 6 thấp hơn 20% so với RAID 5.
- Lỗi drive có ảnh hưởng đến thông lượng, mặc dù điều này vẫn có thể chấp nhận được.
- Đây là công nghệ phức tạp. Việc rebuild một array có drive bị lỗi có thể mất nhiều thời gian.
Sử dụng lý tưởng
RAID 6 là một hệ thống toàn diện, kết hợp khả năng lưu trữ hiệu quả với bảo mật tuyệt vời và hiệu suất cao. Nó được ưu tiên hơn RAID 5 trong các server ứng dụng và file mà sử dụng nhiều drive lớn để lưu trữ dữ liệu.
RAID cấp độ 10 – kết hợp RAID 1 & RAID 0
Có thể kết hợp những ưu điểm (và nhược điểm) của RAID 0 và RAID 1 trong một hệ thống duy nhất. Đây là cấu hình RAID lồng nhau (nested) hoặc kết hợp (hybrid). Nó cung cấp bảo mật bằng cách mirroring tất cả dữ liệu trên các drive thứ cấp. Đồng thời sử dụng tính năng stripping trên từng bộ drive để tăng tốc độ truyền dữ liệu.
Ưu điểm của RAID 10
- Nếu xảy ra sự cố với một trong các đĩa trong cấu hình RAID 10, thời gian rebuild rất nhanh. Vì chỉ cần sao chép tất cả dữ liệu từ máy mirror còn sót lại sang drive mới. Quá trình này có thể mất ít nhất 30 phút đối với drive 1TB.
Nhược điểm của RAID 10
- Một nửa dung lượng lưu trữ dành cho việc mirroring. Vì vậy so với các array RAID 5 hoặc RAID 6 lớn, đây là một cách tốn kém để có dự phòng.
Còn RAID cấp độ 2, 3, 4 và 7 thì như thế nào?
Các cấp độ này có tồn tại nhưng không phổ biến (RAID 3 về cơ bản giống như RAID. Nhưng dữ liệu parity luôn được ghi vào cùng một drive). Đây chỉ là một giới thiệu đơn giản về hệ thống RAID. Bạn có thể tìm thêm thông tin chuyên sâu trên các trang của Wikipedia hoặc đón chờ những bài viết tiếp theo về RAID của Vietnix!
RAID không thể thay thế cho các back-up!
Tất cả các cấp độ RAID ngoại trừ RAID 0 đều cung cấp khả năng bảo vệ một khỏi lỗi drive. Hệ thống RAID 6 thậm chí còn sống sót khi 2 drive chết đồng thời. Để bảo mật hoàn toàn, bạn vẫn cần back-up dữ liệu được lưu trữ trên hệ thống RAID.
- Việc back-up đó sẽ có ích nếu tất cả các ổ drive bị lỗi đồng thời do tăng đột biến điện năng.
- Phương án dự phòng khi hệ thống lưu trữ bị đánh cắp.
- Các bản sao lưu có thể được giữ bên ngoài cơ sở tại một địa điểm khác. Điều này có thể hữu ích nếu một thảm họa tự nhiên hoặc hỏa hoạn phá hủy nơi làm việc của bạn.
- Lý do quan trọng nhất để back-up nhiều lớp dữ liệu là do lỗi của người dùng. Nếu ai đó vô tình xóa một số dữ liệu quan trọng và điều này không được thông báo trong vài giờ, vài ngày hoặc vài tuần, thì một tập hợp các bản back-up tốt đảm bảo rằng bạn vẫn có thể truy xuất các file đó.
Theo Prepressure.