it-swarm-vi.tech

Có một lợi thế nhất định hoặc có thể đo lường được khi sử dụng ECC RAM trong máy tính để bàn không?

Tôi lo lắng rất nhiều về việc xây dựng các máy ổn định - trong đó tôi cực kỳ ghét sự cố, khởi động lại, hành vi buồn cười, v.v. - và vì vậy, sửa lỗi hay còn gọi là ECC RAM dường như sẽ giải quyết một vấn đề lớn: lỗi bộ nhớ .

Nhưng nó thực sự làm việc? Có một lợi thế có thể đo lường được, ví dụ: ít tai nạn hoặc hành vi khác?

Ngoài chi phí, tại sao không sử dụng bộ nhớ ECC cho bản dựng PC mới? Tại sao tính năng ECC chủ yếu có sẵn và được hỗ trợ cho các máy chủ lớp máy chủ/máy trạm, nhưng không có trong bo mạch chủ hướng đến người tiêu dùng?

21
Chris W. Rea

Tôi đã sử dụng ram ECC trong các máy chủ được vài năm rồi. ECC thực sự tỏa sáng khi bạn đang sử dụng máy của mình rất nhiều, như trong "nó hoạt động hơn 12-16 giờ một ngày". Các máy chủ whitebox nhỏ mà tôi đã xây dựng mà không có ECC, sớm hay muộn, đã phát triển các "vấn đề" cần khởi động lại, nhưng các máy ECC có không bao giờ .

Vì vậy, câu trả lời của tôi là: nếu bạn sử dụng máy tính của mình rất nhiều , thì rất có thể là có. Nếu bạn sử dụng máy tính 24/7, thì nó là thứ bắt buộc phải có.

Có một số bo mạch chủ hỗ trợ ECC ngoài kia. Chúng thường ở phần cuối "cao hơn", nhưng với một ít nghiên cứu, bạn có thể tìm thấy chúng từ các nhà sản xuất khác nhau. Việc xem xét duy nhất khác là nhớ bật hỗ trợ ECC trong BIOS.


Google đã đưa ra vấn đề về vấn đề này. Xem http://bloss.zdnet.com/st Storage /? P = 638 để biết điều này thực sự ảnh hưởng đến các hệ thống hiện đại như thế nào .

10
Avery Payne

Tôi chỉ nghĩ ECC có giá trị sử dụng khi máy chủ yêu cầu . Wikipedia :

Phát hiện lỗi và sửa lỗi trong các hệ thống máy tính dường như đi vào và ra khỏi thời trang. Seymour Cray đã nói một cách nổi tiếng "sự tương đương là dành cho nông dân" khi được hỏi tại sao ông lại bỏ cái này ra khỏi CDC 6600. Ông đã đưa tính chẵn lẻ vào CDC 7600 và nói rằng "Tôi đã học được rằng rất nhiều nông dân mua máy tính."

Tôi không thể tìm thấy một nguồn chính xác trên internet, ngoài những tuyên bố mơ hồ về lỗi một bit mỗi tháng trên mỗi gigabyte, điều này thật vô lý; các máy chủ sẽ bị sập trái và phải trên toàn thế giới nếu điều này là từ xa đúng.

Một số điểm nổi bật từ một luồng MetaFilter từ quản trị viên máy chủ thực tế:

Tôi nghĩ ECC là một thứ tuyệt vời, nhưng tôi đã có máy chủ cả có và không có nó, và tôi cũng chưa bao giờ có sự hiện diện hay vắng mặt của nó.

Tôi hiểu mục đích của RAM ECC, nhưng không phải là vấn đề. Ý tôi là, tôi chưa bao giờ nhận thấy bất kỳ vấn đề nào xảy ra do lật bit tia vũ trụ. Ngay cả trên các máy chủ tính toán/biên dịch cá nhân với thời gian tăng nhiều năm. Không phải nói rằng các bit không lật, nhưng chúng chắc chắn không thành vấn đề.

Theo kinh nghiệm của tôi khi điều hành các trang trại của một vài nghìn máy ở đây và đó, bạn có nhiều khả năng có Ext3 âm thầm làm phiền bạn hơn là có vấn đề có thể sửa được ECC.

Cá nhân, tôi nghĩ ECC hơi sùng bái hàng hóa, nhưng đó là một chính sách bảo hiểm hợp lý trên một máy chủ lớn, miễn là phí bảo hiểm không quá cao.

6
Jeff Atwood

Chúng tôi đã xem xét nó cho các hệ thống quan trọng. Một vấn đề trở thành, làm thế nào để bạn phát hiện lỗi trong phần mềm để kiểm tra tính toàn vẹn bộ nhớ của bạn, khi chương trình được sử dụng để chạy kiểm tra tính toàn vẹn bộ nhớ có thể dễ bị lỗi bộ nhớ không ??? Về cơ bản, bạn không thể và nó làm cho việc phân tích/giảm thiểu thất bại ở chế độ thất bại trở nên khó khăn, vì vậy ECC là một cơ chế giảm thiểu.

Đây là một trong những trường hợp nếu có vấn đề, bạn thực sự có thể đổ lỗi tia vũ trụ ;)

3
Jason S

Tôi sẽ xem xét ram ECC cho các ứng dụng "nhiệm vụ quan trọng". Nếu một lỗi máy chủ sẽ khiến bạn mất một số tiền đáng kể (hoặc giết người, hoặc bất cứ điều gì), hãy sử dụng ram ECC. Về cơ bản, cân nhắc chi phí của ram ECC so với những gì bạn sẽ mất trong trường hợp xảy ra lỗi.

Nhưng bất kể bạn quyết định điều gì, tôi khuyên bạn nên chạy MemTest86 + qua đêm (hoặc đủ lâu để thực hiện nhiều lần vượt qua toàn bộ không gian địa chỉ). Và nếu bạn có thể tăng nhiệt (theo nghĩa đen), điều đó sẽ cho bạn ý tưởng về cách ram của bạn sẽ hoạt động khi hệ thống đang nóng.

Tôi đã gặp lỗi hoàn toàn mới RAM trong MemTest. Theo thời gian, MemTest đã phát hiện ra lỗi "tốt". Đó là một công cụ tuyệt vời và là một trong những điều đầu tiên tôi chạy trên một hệ thống mới.

2
ijprest