Facendo leva sul successo della linea UltraScale da 20 nm, Xilinx ha compiuto un ulteriore passo avanti con la nuova serie da 16 nm UltraScale+. La proposta abbraccia varie soluzioni, e in particolare comprende Fpga, il 3D IC e i SoC multi-processing MPSoC. Oltre a garantire un livello di prestazioni/watt decisamente superiore, la famiglia UltraScale+ sviluppata da Xilinx prevede l'impiego di una nuova soluzione ottimizzata di interconnessione denominata SmartConnect. Questi dispositivi ampliano il portafoglio UltraScale Xilinx con una serie di soluzioni basate su transistor FinFet tridimensionali in tecnologia 16FF+ di Tsmc.
Incremento di prestazioni
Ottimizzata a livello di sistema, la famiglia UltraScale+ mette a disposizione un valore che va ben oltre la semplice migrazione di processo. Le numerose migliorie introdotte assicurano un incremento di prestazioni da 2 a 5 volte rispetto alle soluzioni da 28 nm rendendo inoltre disponibile una serie di dotazioni avanzate di sicurezza e protezione che vanno incontro alle esigenze dei progetti di prossima generazione. Essendo basata sulla collaudata architettura UltraScale da 20nm, sui tool di progettazione Vivado e sulla tecnologia da 16nm FF+ di Tsmc, la piattaforma UltraScale+ rappresenta una soluzione tecnologica programmabile, basata su FinFet 3D, a bassissimo rischio. Lo sviluppo dei processi offerti da Tsmc è infatti in linea con i le previsioni, che danno per completi già nel 2015 ben 50 tape-out di progetti FF+ a 16 nm. Come accennato, l'estensione UltraScale+ del portafoglio abbraccia le linee di Fpga Kintex e Virtex, la famiglia 3D IC e la famiglia Zynq, cui fa capo il primo Soc multi-processing totalmente programmabile disponibile in commercio. Grazie a questa nuova proposta, Xilinx è in grado di affermarsi in un ampio spettro di applicazioni di nuova generazione legate ai sistemi wireless Lte Advanced e 5G, alle comunicazioni cablate terabit, all'Internet of Things industriale e a numerosi altri contesti. I prodotti UltraScale+ indirizzano infatti uno dei colli di bottiglia più limitanti per quanto riguarda le prestazioni e i consumi dei sistemi basati su Fpga e SoC: l'interfacciamento di memoria. A tale proposito la nuova architettura prevede l'integrazione diretta dalla Sram, apportando notevoli risparmi in termini di budget energetico. Questa tecnologia, denominata UltraRam, può essere sfruttata per creare grosse aree di memoria on-chip caratterizzate da tempi di latenza prevedibili, perciò ideali nelle numerose applicazioni che implicano la gestione di grosse quantità di pacchetti dati come ad esempio il buffering video.
Memoria ultra integrata e silicio-silicio
L'integrazione di una memoria ad alta capacità accessibile direttamente in prossimità dei motori di elaborazione permette ai progettisti di conseguire livelli superiori di prestazioni/watt e di ridurre la distinta materiali associata non solo alla memoria ma anche ai componenti d'interfacciamento esterni. La dotazione UltraRam può essere dimensionata fino a 432 Mbit secondo un'ampia varietà di configurazioni. In un tipico progetto questo può comportare un miglioramento di almeno il 25% del rapporto prestazioni/watt. In termini di soluzioni innovative, è da segnalare anche la tecnologia SmartConnect, la quale permette di ottimizzare le interconnessioni direttamente a livello di Fpga. L'adozione di questo schema di connessione contribuisce a migliorare di un altro 20-30% le prestazioni, l'area e i consumi attraverso un'ottimizzazione intelligente dei collegamenti a livello di sistema. Mentre l'architettura UltraScale prevede una completa rivisitazione a livello di silicio degli instradamenti, delle temporizzazioni e della struttura logica, SmartConnect permette di razionalizzare in modo automatico la struttura di collegamento per rispettare gli specifici requisiti di latenza e di throughput a livello di progetto, riducendo contemporaneamente l'area dedicata alla logica d'interconnessione.
3D su 3D
I prodotti di fascia alta del portafoglio UltraScale+ sfruttano la combinazione tra transistor tridimensionali e IC 3D Xilinx. Se da un lato i FinFet tridimensionali consentono di ottenere un miglioramento non lineare del livello prestazioni/watt rispetto ai transistor planari, i 3D IC garantiscono un incremento non-lineare dell'integrazione di sistema e del rapporto banda/watt rispetto ai dispositivi monolitici. L'architettura 3D IC si basa sulla tecnologia Ssi (Stacked Silicon Interconnect) per garantire delle connessioni dirette e veloci (con un miglioramento anche di 100 volte della banda inter-die/per watt rispetto alle architetture multi-chip o multi-Fpga) tra vari chip contenuti in uno stesso package. Ciò permette di ottenere dispositivi "virtualmente monolitici" di dimensioni superiori alla media, ma composti da blocchi di silicio più piccoli. Tale soluzione permette di aggirare la riduzione dei rendimenti di produzione tipici delle rigide soluzioni monolitiche tradizionali, riduzione che determina un sostanziale aumento dei costi di sistema man mano che il livello d'integrazione e le dimensioni del die crescono.
Quando i Soc diventano programmabili
La tecnologia Ultrascale+ e tutte le soluzioni tecniche illustrate sopra sono utilizzate anche sugli MPSoC Zynq. Questi dispositivi offrono una serie di capacità inedite di multielaborazione mettendo a disposizione una serie di motori ottimizzati in funzione della task da eseguire. Rispetto alle alternative concorrenti, i dispositivi Zinq offrono un livello di prestazioni/watt fino a 5 volte superiore. L'architettura integra una serie di engine specializzati supportati da una dotazione Fpga e da un corredo di memoria di dimensioni variabili. Centro del sottosistema di elaborazione è il quad-core a 64-bit Arm Cortex-A53 con supporto Arm TrustZone, capace di eseguire funzioni di virtualizzazione hardware e di elaborazione asimmetrica. Il sottosistema di processing include anche un processore dual-core real-time Arm Cortex-R5 per le operazioni deterministiche che tutela la tempestività, il throughput elevato e la bassa latenza per il massimo della sicurezza e dell'affidabilità. Un'unità di sicurezza separata permette di sopportare funzioni di categoria militare - come ad esempio la protezione in fase di boot, la gestione e l'assegnazione di chiavi e l'anti-effrazione - che rappresentano ormai dei requisiti standard anche nelle comunicazioni machine-to-machine e IoT industriali. Il nuovo MPSoC integra anche un motore completo di accelerazione grafica e di compressione/decompressione video: l'engine utilizzato è un processore Arm Mali-400MP dedicato. Infine, il quadro si completa con una potente unità di power management che si occupa di monitorare il sistema e di gestire in modo dinamico l'alimentazione di ciascun motore di elaborazione. A questa dotazione standard si affianca un blocco Fpga UltraScale+ in cui è possibile implementare nell'hardware funzioni di elaborazione specifiche in precedenza svolte a livello software (per esempio processi di ricerca o di manipolazione delle immagini), un video codec H.265 con supporto per Displayport, Mipi e Hdmi, una serie di blocchi integrati e una memoria UltraRam. Grazie al livello d'integrazione e alla programmabilità, a parità di perimetro una soluzione Zinq in tecnologia UltraScale+ dotata di Fpga e memoria UltraRam è in grado di raggiungere prestazioni 5 volte migliori in termini di prestazioni/watt rispetto a una soluzione realizzata con 2 Soc Zinq 7000 di generazione precedente.