Proseguono gli sviluppi sulla nuova funzione, introdotta ieri, per la descrizione delle immagini.

Avevo promesso che avrei esteso la descrizione anche alle immagini che prendete con lo scanner o con la fotocamera: e quello l'ho fatto.

Quindi adesso quando eseguite una acquisizione di immagine con lo scanner, nel menu che elenca le possibilità di uso dell'immagine acquisita compare anche "Descrizione immagine".

In alcune circostanze, può risultare persino più utile del riconoscimento.

Ad esempio, quando avete un pacco di fogli di carta, tra cui dovete cercare un certo documento e, non essendo presente nessuno che possa aiutarvi, non vi resta che farlo con lo scanner, scansionando i fogli uno per uno finché non trovate quello che cercate.

Col riconoscimento, infatti, leggete brutalmente tutto quello che è scritto nel documento, e questo non sempre rende facile capire di che documento si tratta, almeno finché non si arriva a leggerne con attenzione una buona parte, se non tutto.

La descrizione immagine, invece, vi dà una risposta sintetica il cui inizio può essere già sufficiente a farvelo capire, come ad esempio: "Questa immagine rappresenta una bolletta elettrica", oppure "Questa immagine rappresenta un volantino pubblicitario", "Questa immagine costituisce un certificato".

Avevo poi promesso che avrei aggiunto la descrizione delle immagini contenute dei file Word o Pdf o Powerpoint, oppure nei siti Internet, ma su questo sono ancora indietro.

Invece ho aggiunto una interessante novità che ieri non avevo promesso perché ancora non ci avevo pensato, ma poi mi è venuto in mente di farlo e ci sono già riuscito.

L'idea mi è venuta leggendo l'esempio di descrizione di una immagine che Salvatore ha riportato come commento alla notizia di ieri.

L'esempio iniziava così:

"L'immagine mostra un gruppo di persone riunite intorno a un tavolo in un ambiente che sembra essere un ristorante o una cantina, data la presenza di scaffali pieni di bottiglie di vino sullo sfondo."

Ed è qui che mi sono chiesto: e se Salvatore volesse sapere qualcosa di più? Ad esempio, quante persone si vedono esattamente nella foto?

Salvatore dovrebbe poter rivolgere questa domanda al programma.

Ed ecco l'idea: la possibilità, dopo aver letto la descrizione, di rivolgere al programma delle domande, per approfondire i dettagli che interessano. Ad esempio: delle persone presenti, quanti sono donne e quanti maschi? E il programma risponde: Nell'immagine ci sono tre donne e quattro uomini.

Mi sono regolato così: quando il programma legge la descrizione dell'immagine, tra le funzioni locali ho aggiunto: "Fai una domanda", che si può attivare anche con il comando Alt D.

Con la funzione "Fai una domanda", si può scegliere tra: "Domande suggerite", e: "Scrivi una domanda".

Con "Domande suggerite", si entra in un menu che presenta varie domande che il programma ritiene, in base all'immagine, che potreste volergli rivolgere. Se ne sceglie una, e il programma risponde.

Altrimenti, se si preferisce, oppure se tra le domande suggerite non si è trovata quella che si desidera, si sceglie "Scrivi una domanda".

Lì si scrive liberamente la domanda che di desidera rivolgere riguardo quella immagine.

Insomma, sfruttando la potenza dell'intelligenza artificiale, si possono rivolgere domande in modo da approfondire gli aspetti della descrizione dell'immagine che interessano.

Credo che siamo soltanto al principio di qualche cosa di importante.

Eh sì, perché queste tecniche di riconoscimento del contenuto delle immagini basate sull'intelligenza artificiale potranno portare grandi miglioramenti nella vostra autonomia personale.

Immagino un futuro ormai non lontano in cui i ciechi potranno uscire di casa in piena autonomia, con l'ausilio di un sistema da portarsi dietro che si potrà installare anche su un comune telefono cellulare.

Un sistema che, analizzando le immagini inquadrate da una o più fotocamere, fornisca in tempo reali indicazioni su dove devono andare, dove e quando devono svoltare, quando possono attraversare, che negozi ci sono.

E nei supermercati poter fare la spesa in autonomia, perché il sistema dirà dove sono gli scaffali e quali prodotti ci sono sopra, fornendo indicazioni per prendere proprio quello desiderato.

Tutte cose che ormai non sono più fantascienza, perché le tecniche per realizzarle esistono.

Ritorno.