Skip to main content

ITT Italia

ITT Logo

Il Caso ITT Italia: innovare per includere

“Innovare per includere”: da questa esigenza nasce il nuovo progetto sviluppato da Cloudia Research per ITT Italia Srl, azienda leader nel settore delle tecnologie per la mobilità e parte del gruppo internazionale ITT, presente in oltre 35 paesi con più di 11.700 dipendenti.

La missione di ITT è racchiusa nel motto “We solve it”: trasformare idee uniche in soluzioni innovative e sostenibili, al fianco dei clienti nella risoluzione delle loro sfide quotidiane.
Progetta e sviluppa soluzioni tecnologiche personalizzate per i mercati dei trasporti e dell’industria, con una forte attenzione alla ricerca e allo sviluppo.

La trascrizione intelligente che riconosce chi parla

È proprio questa cultura dell’innovazione che ha portato ITT a pensare a una soluzione concreta per migliorare l’accessibilità e l’inclusione all’interno dei propri processi aziendali.
L’idea è nata da un’esigenza reale di inclusione: un dipendente con disabilità uditiva che, durante le riunioni aziendali, aveva difficoltà a identificare chi stesse parlando all’interno delle trascrizioni automatiche.

Da questa specificità è nata una web app basata su tecnologia speech-to-text, progettata per riconoscere automaticamente l’interlocutore in base al contesto, senza alcun campionamento vocale.
Una soluzione che unisce intelligenza artificiale e inclusione, migliorando la comunicazione e rendendo l’esperienza più accessibile a tutti.

Cos’è e perchè fa la differenza

L’obiettivo del progetto è chiaro: rendere la trascrizione del parlato un processo fluido, accurato e completamente automatizzato.
Quando un utente dice “Buongiorno, sono Marco”, la web app non si limita a trascrivere la frase: comprende che si tratta di una presentazione e associa correttamente il nome all’interlocutore.

Non si basa su campionamenti vocali né su archiviazioni audio: il riconoscimento avviene interamente attraverso la comprensione del contesto linguistico.

Come funziona

Il sistema si basa su GPT-4.1 mini, un modello linguistico avanzato capace di comprendere il linguaggio naturale e i rapporti semantici tra le parole.
A differenza dei tradizionali sistemi di speech-to-text, questa app non sfrutta il machine learning continuo: non si evolve nel tempo, ma opera in modo costante e preciso grazie alla sua capacità di interpretare il contesto in tempo reale.

L’interfaccia è semplice, moderna e intuitiva. Durante una conversazione mostra la trascrizione in diretta e l’elenco dei guest partecipanti, identificandoli man mano che intervengono.
Al termine la trascrizione può essere esportata in formato DOCX, pronta per essere condivisa o utilizzata in report e documentazioni ufficiali.

Un modello ideale per aziende come ITT che puntano su strumenti affidabili, sicuri e perfettamente integrabili nei flussi di lavoro quotidiani.

Gestione intelligente delle omonimie

Uno degli aspetti più evoluti della piattaforma è la capacità di gestire le omonimie.
Quando più interlocutori condividono lo stesso nome, l’intelligenza artificiale non si confonde: analizza il contesto, la sequenza degli interventi e la struttura del dialogo per distinguere correttamente ciascun partecipante.

In questo modo, la trascrizione mantiene coerenza e precisione, anche in situazioni complesse o con più voci simili.
Un risultato possibile grazie all’approccio linguistico e contestuale del sistema, che riconosce non la voce, ma il significato.

ITT Screen

Accessibilità e inclusione

Questa web app rappresenta un passo avanti anche sul fronte dell’accessibilità.
Grazie al riconoscimento contestuale degli interlocutori, il sistema consente anche a chi ha difficoltà uditive, come le persone sorde o ipoudenti, di seguire con precisione chi sta parlando durante una conversazione.

Ogni intervento viene identificato e associato all’interlocutore corretto, permettendo a chi legge la trascrizione di comprendere immediatamente il flusso del dialogo e distinguere con chiarezza le voci presenti.
In questo modo, la piattaforma non solo semplifica la comunicazione, ma rende l’informazione più accessibile e inclusiva, garantendo un’esperienza realmente universale.

Un approccio che dimostra come l’intelligenza artificiale, quando progettata con attenzione, possa abbattere barriere e favorire la partecipazione in ogni contesto.

Perché è una rivoluzione

La vera innovazione risiede nella capacità di riconoscere gli interlocutori senza alcuna base vocale.

L’IA si affida unicamente alla comprensione del linguaggio e del contesto, una prospettiva che ribalta il paradigma dei sistemi tradizionali di riconoscimento vocale.

I vantaggi sono concreti:

  • Nessuna raccolta di dati vocali – la privacy è pienamente tutelata

  • Riconoscimento contestuale – l’IA capisce chi parla in base alle frasi e alle dinamiche della conversazione

  • Efficienza immediata – non richiede training o configurazioni preliminari

  • Output professionale – la trascrizione è pronta per essere scaricata e condivisa

Un sistema che unisce precisione, privacy e semplicità, portando la trascrizione automatica a un livello di naturalezza mai raggiunto prima.

Per ITT, questo progetto rappresenta un passo avanti verso una gestione più efficiente, sicura e moderna della comunicazione aziendale.

Innovazione e precisione in un’unica piattaforma

Questa soluzione, sviluppata da Cloudia Research per ITT, rappresenta un nuovo standard per la trascrizione automatica: un sistema capace di trasformare la voce in informazione, riconoscendo i parlanti e restituendo chiarezza e valore a ogni parola.

Un passo concreto verso un’era in cui l’intelligenza artificiale non ascolta soltanto, ma comprende.