L’affidabilità di un alimentatore è importante: nessuno vuole che linea di produzione, strumento di misura, sistema di comunicazione o prodotto elettronico smettano di funzionare prematuramente a causa di un guasto. Su quali basi si definisce il concetto di affidabilità, quali metodi possono adottare i progettisti per migliorare l’affidabilità e come si può garantire che un determinato prodotto soddisfi le aspettative?
Definizione di MTBF e MTTF
Il MTBF (Mean time between failures), cioè il tempo medio tra i guasti, è un parametro utilizzato per stabilire l’affidabilità di un alimentatore, ma è anche un concetto spesso frainteso e utilizzato in modo improprio come fattore determinante. Se la scheda tecnica di un produttore riporta un valore MTBF pari a 300.000 ore, non significa che l’alimentatore durerà così a lungo prima di guastarsi. Un funzionamento di 24 ore al giorno, 365 giorni l’anno rappresenta un tempo di funzionamento pari a 8.760 ore in un anno. 300.000 ore corrispondono a oltre 34 anni e pochissimi componenti installati nel 1982 funzionano ancora oggi in maniera affidabile. Il MTBF è il tempo che intercorre tra due guasti successivi ed è un concetto diverso dal MTTF (Mean time to failure), ovvero il tempo medio al guasto. Il MTTF è un parametro statistico che fa riferimento al tempo intercorso tra l’entrata in funzionamento e il primo guasto. Presuppone che il modello matematico di affidabilità sia la funzione esponenziale, il che risulterebbe ragionevole in base agli esempi tratti dal mondo reale. Il valore di MTTF rappresenta il momento in cui il 63% dei campioni sottoposti a test subisce il primo guasto e viene spesso utilizzato per stimare il numero di unità da tenere a magazzino per eventuali sostituzioni. Allora perché, nonostante questo sembri un metodo più ragionevole per stabilire la durata di funzionamento di un alimentatore, spesso si fa riferimento al valore di MTBF? Per rispondere a questa domanda, è necessario esaminare la Fig. 1, che rappresenta l’andamento del tasso di guasto in un periodo di tempo. La curva a vasca da bagno rappresenta il tipico andamento dei guasti nel corso del tempo. Si individuano tre aree: l’area dei guasti precoci; l’area del tasso di guasto costante; e l’area dei guasti generalizzati. Nell’area corrispondente al tasso di guasto costante, i guasti si verificano secondo un ordine casuale - che rende difficile prevedere la modalità con cui avverrà il guasto - ma il tasso di guasto è prevedibile. È in quest’area che i modelli matematici di MTBF e MTTF convergono, motivo per cui il valore del MTBF viene preso in considerazione più di frequente. Sfortunatamente, ciò non significa che un alimentatore sia affidabile. Dire che un alimentatore ha un MTBF di 80.000 ore (circa 9 anni) non significa che durerà in media 80.000 ore. Quando si considerano 2 unità, i 9 anni diventano 9/2 = 4,5 anni, o 9/4 = 2,25 anni per 4 unità. Quando si eseguono test di durata, si può calcolare la probabilità di un guasto. Se si testano 100 alimentatori per un anno (8.760 ore) e durante questo periodo dieci si guastano, il valore di MTBF stimato è il numero totale di ore dei dispositivi (876.000) diviso per il numero di guasti, ossia 87.600 ore / guasto. Le probabilità che un alimentatore superi il MTBF calcolato sono del 36,8%, indipendentemente dal valore del MTBF:
R(t) = e –t / MTBF = e-1 (dove t = MTBF)
Un sistema composto da “n” componenti separati è definito, a livello statistico, come un sistema in serie; una pratica comune nel caso di alimentatori composti da più componenti. Il sistema è definito funzionante quando tutte le parti funzionano correttamente, e si trova in uno stato di guasto quando anche uno solo dei componenti risulta difettoso. Ogni singolo pezzo che compone il sistema è indipendente dagli altri, sia in termini di affidabilità sia a livello di tasso di guasto. Per semplicità, il modello matematico utilizzato per descrivere l’affidabilità come funzione del tasso di guasto è di tipo esponenziale. In un sistema in serie, l’affidabilità globale del sistema è pari al prodotto dell’affidabilità dei singoli componenti. Il tasso di guasto globale, tuttavia, è pari alla somma dei singoli tassi di guasto. Ciò significa che, poiché l’affidabilità è un numero più basso dell’unità, il prodotto totale sarà inferiore all’affidabilità di ogni singolo componente, mentre il tasso di guasto sarà superiore.
Miglioramento dell’affidabilità
L’affidabilità di un prodotto o di un sistema dovrebbe essere un punto centrale della fase di progettazione e sviluppo. In caso contrario, la capacità di identificare i problemi e di valutare le criticità non può essere gestita durante la fase di ideazione e progettazione. È troppo tardi considerare le implicazioni legate all’affidabilità alla fine del processo di sviluppo. Perché un alimentatore sia affidabile, deve essere concepito all’insegna della semplicità. Una progettazione eseguita in quest’ottica produrrà un alimentatore più affidabile rispetto a uno complesso. Per esempio, un convertitore base di bassa potenza a singola uscita avrà un’affidabilità maggiore rispetto a quella di un convertitore di alta potenza multiplo. L’aggiunta di circuiti di protezione aumenterà la durata di vita effettiva dell’alimentatore. Nelle prime fasi di sviluppo, il circuito dell’alimentatore deve essere suddiviso in due macro-blocchi: applicazioni critiche e applicazioni non critiche. Tale suddivisione faciliterà la selezione dei componenti e dei coefficienti di derating da parte del progettista. Le applicazioni critiche includeranno le aree in cui un guasto provocherebbe l’interruzione di funzionamento dell’alimentatore; le aree non critiche comprenderanno le applicazioni ausiliarie. Per le applicazioni critiche, i pezzi devono essere della massima qualità ed è necessario ridurre al minimo l’uso di componenti destinati a deteriorarsi nel tempo, come condensatori elettrolitici, ventole e relè.
Due degli standard accettati per le analisi di previsione dell’affidabilità sono il MIL-HDBK-217 e il Bellcore/Telcordia Technical Reference TR-332. Questi due metodi di previsione empirica hanno diversi presupposti in comune - il tasso di guasto costante, l’utilizzo di fattori di accelerazione termica e di stress, i fattori di qualità e le condizioni d’uso. Sono entrambi basati su modelli sviluppati a partire dal curve FITting statistico dei dati storici relativi ai guasti, che possono essere stati raccolti sul campo, in-house o dai produttori. Il manuale di previsione dell’affidabilità più conosciuto e utilizzato è il MIL-HDBK-217. Negli standard militari si trovano alcune delle migliori indicazioni sui coefficienti di correzione applicabili ai tassi di guasto in base ai vari componenti. Questi dipendono dalle condizioni d’uso, dalla temperatura, dalle informazioni sui test di affidabilità e sull’affidabilità di progetto. Per esempio, il modello matematico del tasso di guasto globale per un MOSFET di potenza secondo il manuale MIL-HDBK-217F, corrisponde al tasso di guasto di base moltiplicato per i fattori specifici di Temperatura, Applicazione, Qualità e Ambiente. Si noti che l’affidabilità è un fattore compreso tra 0 e 1 e non ha una dimensione. Il tasso di guasto, tuttavia, viene misurato, in particolare nel campo dell’elettronica. Il FIT (Failures in Time), cioè i guasti nel tempo di un dispositivo corrisponde al numero di guasti previsti nell’arco di un miliardo (109) di ore di funzionamento. Considerando un MOSFET di potenza adeguato per un alimentatore di 250 W (tasso di guasto pari a 12 FIT), che lavora a una temperatura prossima ai 100°C (coefficiente termico pari a 3,7), con un fattore di qualità Jantx (secondo il MIL-S-19500 è pari a 8) e un fattore ambientale GF (Ground Fixed pari a 1,6), il tasso di guasto totale sarà di 2,312 guasti/106 ore. Una volta presi in considerazione i fattori ambientali, il tasso di guasto base di 12 FIT è aumentato a 2.131,2 FIT. Poiché il MTTF è inverso al tasso di guasto, questo esita in un MTTF per il MOSFET di potenza di circa 470.000 ore. Il valore di MTTF iniziale, tuttavia, senza calcolare i fattori ambientali e termici, era di 83.000.000 ore. Per migliorare l’affidabilità del MOSFET e dell’alimentatore, il progettista potrebbe aumentare il derating termico del componente. Raffreddando il componente in questione e impostando la temperatura di esercizio del MOSFET a 80°C anziché a 100°C, il coefficiente termico passerebbe da 3,7 a 2,7, producendo un MTTF di 643.000 ore - un miglioramento del 36%. La riduzione del tasso di guasto, in condizioni operative e ambientali preimpostate, è possibile solo attraverso un’attenta analisi dei fattori di stress elettrico e termico per il corretto dimensionamento del MOSFET di potenza. Ciò è possibile tramite un controllo eseguito con un piano di derating (Figg. 2 e 3), debitamente costruito sulla base dell’applicazione e del tipo di componente. Lo standard Technical Reference TR-332 è stato sviluppato per il settore delle telecomunicazioni dove i produttori ritenevano che il MIL-HDBK-217 fosse troppo rigido. La sua diffusione è in aumento, ma in genere i risultati calcolati con il MIL-HDBK-217 mostrano un tasso di guasto più elevato rispetto al Bellcore/Telcordia. La differenza tra gli standard deriva dall’uso previsto originario dello standard MIL per i settori militare e aerospaziale o per applicazioni mission critical.
Raccolta e analisi dei dati
È possibile calcolare i valori di affidabilità, con un buon grado di accuratezza, utilizzando i dati raccolti dai test HALT (Highly accelerated life test) ovvero la prova di durata ad accelerazione elevata. Il numero di campioni da testare, però, è in genere limitato, il numero di stazioni di prova è fisso e la quantità di tempo disponibile per l’esecuzione dei test è limitata, con un impatto sull’intervallo di confidenza entro il quale il progettista vuole che rientri il parametro calcolato. Questo tipo di analisi richiede l’uso di una funzione statistica chiamata chi quadrato X2 (a,b) - una funzione di due variabili, presente in formato tabulare nei principali test statistici, oltre che nei principali fogli di calcolo elettronici. Per semplicità, le funzioni di calcolo di un “intervallo di confidenza unilaterale inferiore” sono riprodotte in due casi speciali: “Test interrotti con sostituzione” e “Test interrotti senza sostituzione”. Il primo caso riguarda principalmente il calcolo del MTTF effettivo nel caso di ritorni dal campo, benché questo metodo non sia soddisfacente in quanto il produttore non sa da quanto tempo le unità sono in funzione o quali siano le condizioni operative. Il secondo caso riguarda i test HALT. Una volta completato il processo HALT, e adottate le appropriate azioni correttive, è possibile creare un processo di screening della produzione personalizzato per individuare i difetti di processo. L’HASS (Highly accelerated stress screening) applica tutte le situazioni di stress contemporaneamente. Basati sui limiti HALT, i livelli di stress HASS valutano l’alimentatore in condizioni prossime ai suoi limiti operativi.