вобщем то не раз обсуждали уже эти темы. Понятно, что с радиатором лучше. Но хочу сам затестить без радика, чет я сомневаюсь что при копировании с Хдд на 970 он нагреется выше 70
вобщем то не раз обсуждали уже эти темы. Понятно, что с радиатором лучше. Но хочу сам затестить без радика, чет я сомневаюсь что при копировании с Хдд на 970 он нагреется выше 70
LonerKO:в SSD чаще всего из строя выходят контроллеры (они больше всего и греются).
Заблуждаетесь. Анализ огромного количества отказавших SSD показывает разного рода проблемы с NAND памятью и когда это затрагивает данные микропрограммы накопителя ответственные за трансляцию, тогда и получаем самые причудливые формы "окирпичивания" устройств. Зная как стартовать эти "кирпичи" в режиме bootROM без загрузки микропрограммы из NAND (как правило замыканием парочки точек на платах) более, чем в 90% случаев получаем нормальный старт кусочка микропрограммы в MCU и после загрузки необходимого оверлея в ОЗУ накопителя читаем служебную информацию, где и обнаруживаем проблемы.
Специалисты по обслуживанию компьютеров очень часто ошибаются в диагностике неисправных SSD, делая вывод о неисправности контроллера лишь потому, что SSD не реагирует на команды со стороны интерфейса. В нашей практике при анализе проблем SSD такие диагнозы подтверждались менее, чем в 5% случаев.
LonerKO:контроллеры влёгкую могут раскалятся до сотни градусов что в дальнейшем приводит к скорой кончине контроллера.
Высокая температура не так страшна для контроллеров, а вот, что касается NAND памяти то запись в нее при высокой температуре устройства представляет проблему о которой упоминается у JEDEC
На практике же, когда читаем полумертвые микросхемы NAND на SSD и пытаемся добыть то, что не читается в штатных условиях, то с помощью подогревочных столов плавно греем весь SSD доходя до температур более 200-250 градусов. Процесс вычитки в технологическом режиме длится достаточно долго и при таких температурах редко наблюдаются сбои в работе контроллеров SSD.
офлайн
nasty_z_xt
Senior Member
|
|
16336 |
13 лет на сайте Город:
|
ASM:LonerKO:в SSD чаще всего из строя выходят контроллеры (они больше всего и греются).
Заблуждаетесь. Анализ огромного количества отказавших SSD показывает разного рода проблемы с NAND памятью и когда это затрагивает данные микропрограммы накопителя ответственные за трансляцию, тогда и получаем самые причудливые формы "окирпичивания" устройств. Зная как стартовать эти "кирпичи" в режиме bootROM без загрузки микропрограммы из NAND (как правило замыканием парочки точек на платах) более, чем в 90% случаев получаем нормальный старт кусочка микропрограммы в MCU и после загрузки необходимого оверлея в ОЗУ накопителя читаем служебную информацию, где и обнаруживаем проблемы.
Специалисты по обслуживанию компьютеров очень часто ошибаются в диагностике неисправных SSD, делая вывод о неисправности контроллера лишь потому, что SSD не реагирует на команды со стороны интерфейса. В нашей практике при анализе проблем SSD такие диагнозы подтверждались менее, чем в 5% случаев.
LonerKO:контроллеры влёгкую могут раскалятся до сотни градусов что в дальнейшем приводит к скорой кончине контроллера.
Высокая температура не так страшна для контроллеров, а вот, что касается NAND памяти то запись в нее при высокой температуре устройства представляет проблему о которой упоминается у JEDEC
На практике же, когда читаем полумертвые микросхемы NAND на SSD и пытаемся добыть то, что не читается в штатных условиях, то с помощью подогревочных столов плавно греем весь SSD доходя до температур более 200-250 градусов. Процесс вычитки в технологическом режиме длится достаточно долго и при таких температурах редко наблюдаются сбои в работе контроллеров SSD.
Достаточно интересное чтиво. Появилось несколько вопросов.
1. Если отбросить бичевые ssd из поднебесной и оставить условные топы у каждого производителя как поменяется соотношение битой памяти к битым контроллерам?
2. Если контроллеры работают при температуре в 200 градусов то зачем производитель вообще занимается проблемами тротлинга? Очень часто (по моим наблюдениям) тротлинг начинается из-за перегрева контроллера а не памяти на многих топовых дисках. Причем температуры там могут быть и меньше 90 градусов.
3. Постоянные большие перепады температур плохо влияют на любые чипы. И если рассматривать контроллеры в ssd то по вашему опыту сколько процентов приходится на обычные отвалы памяти/контроллеров?
Ибо если рассматривать бюджетные варианты там в целом ничего не греется почти и в бой вступает не самая качественная память. Отсюда и статистика.
А большинство дисков в ремонте это скорее что-то из бичево-низко-среднего сегмента. Или я и тут не прав?
LonerKO:1. Если отбросить бичевые ssd из поднебесной и оставить условные топы у каждого производителя как поменяется соотношение битой памяти к битым контроллерам?
Массовой смерти контроллеров нет. Это достаточно живучие микросхемы, которые не спешат отойти в мир иной в отличие от содержимого NAND памяти. Сама NAND память тоже не спешит окончательно умереть, а вот её способность удержать заряды будет сильно зависеть от многих факторов.
LonerKO:2. Если контроллеры работают при температуре в 200 градусов то зачем производитель вообще занимается проблемами тротлинга? Очень часто (по моим наблюдениям) тротлинг начинается из-за перегрева контроллера а не памяти на многих топовых дисках. Причем температуры там могут быть и меньше 90 градусов.
говоря о работе при высокой температуре я отметил запас прочности этих микросхем, разумеется если при такой температуре работать месяцами, то сбои в работе возможны, как и отказы. Поэтому и нормируется температурный коридор при котором маловероятны сбои в работе и нет слишком большого негативного влияния температуры на все компоненты SSD.
LonerKO:3. Постоянные большие перепады температур плохо влияют на любые чипы. И если рассматривать контроллеры в ssd то по вашему опыту сколько процентов приходится на обычные отвалы памяти/контроллеров?
Да перепады температур представляют большую проблему в том числе и для содержимого NAND памяти. SSD намного чаще успевает выйти из строя до того, как дойдет дело до отвалов чипов из-за испорченного содержимого в NAND (служебных данных, в частности FTL).
LonerKO:Ибо если рассматривать бюджетные варианты там в целом ничего не греется почти и в бой вступает не самая качественная память.
к сожалению сегодняшняя "качественная" память оставляет желать лучшего. В топовых моделях массовых SSD отказы аналогичные, впрочем как и в серверном сегменте.
LonerKO:А большинство дисков в ремонте это скорее что-то из бичево-низко-среднего сегмента.
на восстановление данных попадают самые разные неисправные изделия.
и в продолжение моего прошлого поста типичный пример. SSD, где специалисты сервис-центров по обслуживанию компьютеров ошибочно ставили диагноз о неисправности контроллера. Но если к этому SSD подступиться с пинцетом, UART и технологическими командами, то выясняется повреждение небольшого фрагмента структур FTL в NAND из-за чего диск зависает при старте намертво.
на примере самого горячего диска, который попадал мне в руки и самого дешевого радиатора
тут точно есть о чем говорить? напомню цена вопроса 12 руб...
По поводу массовых ошибочных диагнозов SSD в сервисных центрах обслуживающих ПК и ноутбуки, а также в гарантийных отделах продавцов. Обычно в этих местах нет нужды разбираться, что произошло с устройством, а устанавливается лишь факт его неисправности.
Далее рассмотрим пример, который приведён мною выше, где специалисты по ремонту компьютеров выставили диагноз "неисправный контроллер".
На скриншоте видим по состоянию регистров флажок BSY (BUSY). Это означает для хост контроллера к которому-подключен SSD, что ответов на команды не будет. Т.е. для пользователя SSD в таком состоянии не лучше кирпича ибо ни на что не реагирует.
При это видно, что по линии 5В "кушается" 0,55А.
Выключим питание, закоротим накопителю пинцетом точки для перехода в режим старта bootROM без загрузки чего-либо из NAND и подадим питание
Далее подключим терминальный адаптер к USB порту и М.2 адаптер к PC3000 Portable 3.
По состоянию регистров DRD (Drive ready) и DSC (Drive seek complete) видно, что SSD готов к приему команд. Потребление по линии 5В снизилось до 0,47А. (так как не загружена микропрограмма из NAND и никаких попыток прочитать нечитаемое не осуществляется). Входим в технологическую утилиту
Накопитель успешно отдал паспорт, где в режиме bootROM нет информации о его точной модели, серийном номере. Есть только версия микропрограммы bootROM и неверный объем, который свидетельствует, что система трансляции на данный момент не работает.
диагноз о неисправности контроллера опровергнут, так как контроллер выполняет микропрограмму, которая находится внутри его ROM без зависаний и неадекватной реакции.
ASM:загрузки микропрограммы из NAND
Т.е. внутри контроллера недостаточно флэша для микроррограммы? Прикольно, экономят на спичках...
itto:Т.е. внутри контроллера недостаточно флэша для микроррограммы? Прикольно, экономят на спичках...
для кодовой части достаточно, а вот для данных программы недостаточно, так как FTL (Flash Translator Layer) достаточно велик по размеру относительно емкости NAND накопителей. Данные для трансляции целиком и в ОЗУ накопителя не загружаются, а оперируется ими по частям.
Так было с самых истоков развития NAND накопителей USB flash, карт памяти, SSD. В ROM контроллера находится микропрограмма в задачах которой произвести загрузку всех необходимых структур из NAND памяти, прогрузить необходимые данные для запуска системы трансляции и после обслуживать команды со сторону хост-контроллера к которому подключен накопитель.
Идеология хранения постоянно изменяющихся данных в NAND выглядит заметно менее затратной, чем размещать для этого очень дорогую NOR микросхему или встраивать её в MCU.
ASM:По поводу массовых ошибочных диагнозов SSD в сервисных центрах обслуживающих ПК и ноутбуки, а также в гарантийных отделах продавцов. Обычно в этих местах нет нужды разбираться, что произошло с устройством, а устанавливается лишь факт его неисправности.
Обычно диски либо несут по гарантии , либо отправляют в мусорку и идут за новым, процент который попадает к вам от общего количество отказов, мизер, как мне кажется, единицы процентов. Потому говорить за статистику, что там чаще выходит из строя... не очень корректно, имхо
Hyperiоn:тут точно есть о чем говорить? напомню цена вопроса 12 руб..
а с дешевым радиатором какая температура у 990?
Злой_Жук:Hyperiоn:тут точно есть о чем говорить? напомню цена вопроса 12 руб..
а с дешевым радиатором какая температура у 990?
не понял вопроса, на видео же все есть, или еще более дешевый надо )))
Hyperiоn:Потому говорить за статистику, что там чаще выходит из строя... не очень корректно, имхо
Если говорим о статистике, то оперируем выборкой устройств.
1. Ко мне попадают самые разные накопители от людей и организаций нуждающихся в восстановлении данных. То есть выборка из весьма разнообразных накопителей (нет засилья одного бренда или модели).
2. С этими накопителями проводится глубокое исследование их проблематики, где можно установить, что именно представляет проблему и как решить задачу получения данных.
3. За почти два десятилетия работы счет неисправных SSD из которых были получены данные идёт на тысячи штук. При этом еще больше накопителей были продиагностированы, но не попали в работу по экономическим причинам.
Итого имеем выборку за продолжительный временной интервал из различных отказавших накопителей (нескольких тысяч штук), где доля отвала чипов, неисправностей контроллеров или NAND микросхем не составила более 5% случаев.
Да относительно всех проданных устройств - это мизерная статистика, но учитывая особенности этой выборки можно полагать с высокой вероятностью, что в других отказавших устройствах картина была схожей.
Верить моей статистике или нет пусть каждый прочитавший решит сам. Лично мне она кажется несколько более достоверной, чем например статистика гарантийного отдела продавца, где только устанавливался факт неисправности изделия, но не исследовались реальные причины отказа.
JNE:ASM, В данном описываемом случае данные поднимаются или нужен донор?
При восстановлении данных с SSD в подавляющем количестве случаев доноры не требуются.
Доноры или новые smd элементы требуются в случаях когда действительно неисправна микросхема MCU (что крайне редко), либо когда есть иные неисправности с выгоревшими smd элементами.
Описанный выше случай - это SSD Samsung 840 Evo, где в boot ROM еще не было процедур проверки цифровой подписи исполняемого кода, который грузится из NAND памяти (или команде загрузки микрокода через интерфейс). Данные получить возможно при условии, что структуры ответственные за трансляцию по большей части читабельны.
itto, дополню прошлый ответ, что структуры FTL весьма объемные. Применительно к случаю выше это около 3ГБ
Ааа, теперь ясно. Не думал, что оно такое объемное.
А есть какая-то юарт команда чтобы обнулить/перенести на другой адрес этот FTL и восстановить работоспособность диска?
itto:А есть какая-то юарт команда чтобы обнулить/перенести на другой адрес этот FTL и восстановить работоспособность диска?
Служебные блоки не лежат на одно месте и так.
Восстановление работоспособности выглядит так:
1. Старт в режиме bootROM.
2. Загрузка необходимого микрокода, который должен выполнить серию тестов (с полной очисткой NAND памяти) и сформировать новые служебные данные.
и дальше как повезет. если память "уставшая", то вероятность быстрого повторного отказа будет высокой.
Когда ищете ремонтные утилиты и микрокод, то придётся анализировать информацию на чем построен ваш SSD (точные версии контроллера и памяти) для верной настройки параметров. Вроде бы ничего особо сложного, но есть вопрос с доступностью нужных версий и наличия документации в свободном доступе.
Для ремонта SSD с потерей данных в большинстве случаев не требуется доступ по UART.