Какво е ECC памет?

Какво е ECC памет?

Някои RAM или памет с произволен достъп се рекламират като ECC памет. ECC е съкращение от Error Correcting Code и е процес на идентифициране и коригиране на грешки в паметта. Грешките в RAM паметта могат да причинят повреда или промяна на данните, което може да доведе до сривове на устройството и дори до уязвимости в сигурността. ECC RAM обикновено не е съвместим с компютърен хардуер от потребителски клас.

Какво представляват грешките в паметта?

Грешките в паметта са проблем, при който стойността, съхранена в паметта, се променя. Данните в RAM паметта се съхраняват в двоичен вид със стойности от 1 или 0. Ако стойността на 1 се превключи на 0 или обратно, в процес, наречен „превъртане на битове“, данните, които се съхраняват в RAM, се променят.

Например, промененият бит може да се използва за съхраняване на стойност в електронна таблица. В този случай стойността в електронната таблица може да бъде променена на напълно различно число, което би повлияло на резултата за всякакви изчисления, например промяна на икономическите прогнози на даден бизнес. В други случаи промененият бит може да деактивира защитна функция или да създаде печатна грешка, която променя начина, по който се изпълнява програмата. Тези два примера са изключително трудни за откриване и разрешаване без използване на ECC памет. В краен сценарий, обръщането на един бит може да причини катастрофална грешка, която да причини срив на системата.

Преобръщането на битове има много потенциални причини, най-честата причина е резултат от фоново излъчване, основно причинено от неутрони, създадени от събития на космически лъчи. Космическият лъч е частица с висока енергия, обикновено протон, която се движи с почти скоростта на светлината. Те се излъчват от звездни тела, включително Слънцето и други високоенергийни астрономически обекти. Когато космически лъч удари атом, се създава дъжд от неутрони и други субатомни частици, след това тези неутрони продължават да имат вторични взаимодействия.

Смята се, че тези вторични неутронни взаимодействия са основният източник на грешки при преобръщане на битове. Космическите лъчи са по-чести на по-високи височини с 3,5 пъти увеличение на 1,5 км над морското равнище и 300 пъти увеличение на крейсерската височина на самолетите. Този повишен риск на височина налага допълнителни мерки за надеждност.

Колко чести са грешките в паметта?

Повечето хора не виждат компютрите си да се сриват всеки ден, така че би било лесно да си помислим, че това е предимно теоретичен риск. Изследвания от хипермащабни центрове за данни са използвани за анализиране на честотата на инцидентите с преобръщане на битове. Изследванията, извършени от Google в неговите центрове за данни, показват честота на грешки от приблизително 1 еднобитова грешка на гигабайт RAM на всеки 1,8 часа.

Мисията на НАСА Cassini-Huygens, която стартира през 1997 г. за пътуване до Сатурн, беше конфигурирана с два идентични летателни компютъра, всеки с 2,5 Gb RAM. През първите две години и половина от пътуването си космическият кораб наблюдава последователни 280 еднобитови грешки на ден. По време на един ден, когато Касини-Хюйгенс беше на пътя на слънчево изригване, беше наблюдавано четирикратно увеличение на битовите грешки, предоставяйки допълнителни доказателства, че Слънцето е причината за повечето проблеми с обръщането на битовете.

Имаше опасения, че продължаващото увеличаване на плътността на RAM модулите ще доведе до по-късните версии на RAM паметта да бъдат все по-уязвими към преобръщане на битове. По-новите проучвания показват, че всъщност е точно обратното, тъй като грешките са намалели, тъй като геометрията на процеса е намаляла.

Как ECC паметта предпазва от грешки?

ECC паметта използва кодове за коригиране на грешки, като кодове на Хаминг, за коригиране на еднобитови грешки в RAM. Двойни битови грешки могат да бъдат открити, но не и коригирани. Кодовете за коригиране на грешки на Хеминг работят чрез използване на масив от битове за четност. Заедно тези битове за четност могат да се използват за откриване на промяна на битовете на данните. Ако битът бъде идентифициран като обърнат, той автоматично се променя обратно.

Съвет: Еднобитова грешка е инцидент с обръщане на битове, когато е обърнат само един бит. При грешки с двойно 0 бита се обръщат два бита. Двата бита не трябва да се обръщат в един и същи инцидент, второто преобръщане на бит трябва да се случи само преди да бъде коригиран първият обърнат бит.

Един повече бит за четност, отколкото е необходимо, е включен в кодовете за коригиране на грешки на Хаминг. Този допълнителен бит за четност дава на кода възможността да открие появата на двойни битови грешки, но тези грешки не могат да бъдат коригирани.

Процесът на извършване на откриване и коригиране на грешки се извършва на контролера на паметта на борда на RAM паметта.

Наличност и поддръжка на потребителите

Повечето компютърен хардуер от потребителски клас не поддържа ECC памет. Това е отчасти като метод за изкуствено разграничаване на сървърния хардуер от потребителския хардуер. ECC RAM обаче струва повече и работи малко по-бавно. Освен това допълнителната стабилност, която би осигурила на домашните потребители, е минимална, тъй като грешките при преобръщане на битове не са основната причина за сривове на системата.

Нито един от процесорите на Intel за потребители и ентусиасти не поддържа ECC памет, а само неговите сървърни процесори, като процесорите от гамата Xeon. Потребителските процесори на AMD не поддържат ECC, но техните работни станции и процесори от сървърен клас, съответно Threadripper и EPYC, поддържат ECC памет.


Как да клонирате твърд диск

Как да клонирате твърд диск

В съвременната цифрова ера, където данните са ценен актив, клонирането на твърд диск в Windows може да бъде решаващ процес за мнозина. Това изчерпателно ръководство

Как да коригирам неуспешно зареждане на драйвер WUDFRd на Windows 10?

Как да коригирам неуспешно зареждане на драйвер WUDFRd на Windows 10?

Изправени ли сте пред съобщението за грешка при зареждане на компютъра, което казва, че драйверът WUDFRd не успя да се зареди на вашия компютър?

Как да коригирате код за грешка на NVIDIA GeForce Experience 0x0003

Как да коригирате код за грешка на NVIDIA GeForce Experience 0x0003

Срещате ли NVIDIA GeForce код за грешка 0x0003 на вашия работен плот? Ако да, прочетете блога, за да разберете как да поправите тази грешка бързо и лесно.

Какво е SMPS?

Какво е SMPS?

Научете какво е SMPS и значението на различните рейтинги на ефективност, преди да изберете SMPS за вашия компютър.

Защо моят Chromebook не се включва

Защо моят Chromebook не се включва

Получете отговори на въпроса Защо моят Chromebook не се включва? В това полезно ръководство за потребителите на Chromebook.

Как да докладвате на Google за фишинг измами

Как да докладвате на Google за фишинг измами

Научете как да докладвате измамник на Google, за да му попречите да мами други с това ръководство.

Roomba спира, залепва и се обръща – Коригирайте

Roomba спира, залепва и се обръща – Коригирайте

Коригирайте проблем, при който прахосмукачката робот Roomba спира, залепва и продължава да се върти.

Как да промените графичните настройки на Steam Deck

Как да промените графичните настройки на Steam Deck

Steam Deck предлага стабилно и многостранно игрово изживяване на една ръка разстояние. Въпреки това, за да оптимизирате играта си и да осигурите възможно най-доброто

Какво представлява сигурността, базирана на изолация?

Какво представлява сигурността, базирана на изолация?

Щях да се задълбоча в тема, която става все по-важна в света на киберсигурността: сигурност, базирана на изолация. Този подход към

Как да използвате Auto Clicker за Chromebook

Как да използвате Auto Clicker за Chromebook

Днес щях да разгледам инструмент, който може да автоматизира повтарящи се задачи за щракване на вашия Chromebook: Auto Clicker. Този инструмент може да ви спести време и