Dati non strutturati: un ostacolo nell’adozione della tecnologia AI
CasaCasa > Blog > Dati non strutturati: un ostacolo nell’adozione della tecnologia AI

Dati non strutturati: un ostacolo nell’adozione della tecnologia AI

Jul 12, 2023

Kaushik è un architetto tecnico e consulente software, con oltre 20 anni di esperienza nel settore dell'analisi, dello sviluppo, dell'architettura, della progettazione, dei test e della formazione del software. Lui…

Eddie Wrenn è un reporter e redattore di notizie che ha lavorato in redazioni nazionali e internazionali nel Regno Unito e in Australia, concentrandosi su...

L’intelligenza artificiale sta già dimostrando il suo valore in compiti quali l’analisi delle tendenze e il supporto alla diagnosi medica. Tuttavia, la sua efficacia dipende dai dati strutturati, che possono rappresentare un punto debole a causa della scarsità di dati. La dipendenza dell’intelligenza artificiale dai dati strutturati pone ostacoli quando si confronta con dati non strutturati o difficili da analizzare, limitandone le capacità. È incoraggiante che siano in corso sforzi per migliorare la capacità dell’intelligenza artificiale di gestire dati non strutturati.

L’intelligenza artificiale (AI) è in grado di fare cose prima inimmaginabili.

Può distinguere tra un pedone e un segnale stradale per guidare un'auto a guida autonoma, rivedere il tono di un articolo e fornire feedback, fornire dati utili sul paziente a un medico e svolgere mille altri lavori ponderati e che fanno risparmiare tempo.

Tuttavia, per fare ciò che fa, l’intelligenza artificiale spesso dipende da dati strutturati e tale dipendenza può diventare il suo tallone d’Achille.

L’intelligenza artificiale può gestire tutti i tipi di dati provenienti da varie fonti, strutturate o non strutturate. Esempi inclusi:

I sistemi di intelligenza artificiale necessitano di un formato dati coerente, almeno per compiti su larga scala, ma applicare l’uniformità è una sfida quando i dati provenienti da fonti diverse sono ostinatamente vari e difficili da inserire in una struttura.

Per dare forma ai dati, il processo di pre-elaborazione, come la rimozione di errori, spazi indesiderati e valori anomali, è un processo che richiede tempo.

I dati possono anche arrivare in vari formati, essendo inseriti da API, file JSON o fogli di calcolo, e nel tempo emergono nuovi formati di dati che possono complicare ulteriormente il problema.

Anche la riservatezza dei dati può aumentare la complessità e i fornitori devono essere estremamente cauti per prevenire fughe di dati.

Usiamo l'intelligenza artificiale e l'imaging medico per comprendere in che modo i dati non strutturati ostacolano l'adozione dell'intelligenza artificiale, utilizzando raggi X, scansioni TC e risonanza magnetica come casi di prova.

Idealmente, l’intelligenza artificiale dovrebbe analizzare i referti delle immagini e consentire ai radiografi e ai medici di diagnosticare la malattia in modo accurato e rapido. Tuttavia, i seguenti fattori limitano gravemente la capacità dell'intelligenza artificiale di interpretare correttamente gli output di imaging:

La variabilità in termini di qualità, angolazione, illuminazione e posizionamento del paziente rende difficile per l’intelligenza artificiale comprendere l’imaging, restituendo potenzialmente errori o risultati errati.

La variabilità in termini di anatomia dei diversi pazienti è una sfida da comprendere per i sistemi di intelligenza artificiale. L’intelligenza artificiale ama l’uniformità e sta ancora facendo i conti con la diversità dell’anatomia umana.

Le annotazioni consentono all’intelligenza artificiale di comprendere meglio l’imaging e la loro mancanza lascia l’intelligenza artificiale a capire da sola le lastre di imaging, il che, senza alcuna risorsa utile, è una sfida.

L’intelligenza artificiale richiede uniformità e coerenza dei dati, ma l’imaging su condizioni mediche non comuni o rare limita gravemente la sua capacità di elaborare i dati. Per comprendere tali condizioni è necessario che i sistemi di intelligenza artificiale apprendano man mano che procedono.

L'imaging può contenere rumore, artefatti e distorsioni dovuti a vari fattori quali problemi della macchina, non conformità dei protocolli di imaging o modifiche alle posizioni del corpo del paziente. I dati non strutturati derivano da tali problemi e rendono difficile la comprensione per l’intelligenza artificiale.

L’intelligenza artificiale ha ancora molta strada da fare per risolvere molteplici casi d’uso a causa della dipendenza dai dati strutturati. Nel frattempo, per le organizzazioni, fornire dati strutturati è ancora un compito costoso e dispendioso in termini di tempo.

Il provisioning e l’analisi dei dati devono essere migliorati per sfruttare appieno il potenziale dell’intelligenza artificiale e, allo stesso tempo, è necessario molto lavoro per dotare i sistemi di intelligenza artificiale della gestione dei dati non strutturati.

Kaushik è un architetto tecnico e consulente software, con oltre 23 anni di esperienza nel settore dell'analisi, dello sviluppo, dell'architettura, della progettazione, dei test e della formazione del software. Ha un interesse per le nuove tecnologie e le aree di innovazione. Si concentra su architettura web, tecnologie web, Java/J2EE, open source, WebRTC, big data e tecnologie semantiche. Ha dimostrato la sua esperienza nell'analisi dei requisiti, nella progettazione e implementazione dell'architettura, nella preparazione di casi d'uso tecnici e nello sviluppo di software. La sua esperienza ha abbracciato diversi settori come assicurazioni, banche, compagnie aeree, spedizioni, gestione dei documenti e sviluppo di prodotti, ecc. Ha lavorato con un'ampia varietà di tecnologie a partire dal mainframe (IBM S/390),...