20.7 C
São Paulo
26 de julho de 2025

Cerca de 80% das aplicações e softwares corporativos serão multimodais até 2030

Segundo o Gartner, nos próximos anos os modelos multimodais de Inteligência Artificial Generativa enriquecerão cada vez mais as aplicações

 Os analistas do Gartner estimam que oitenta por cento das aplicações e softwares corporativos serão multimodais até 2030. No ano passado este número era de apenas 10%.

A mudança para o software corporativo multimodal é uma transformação fundamental nas operações de negócios e na inovação, segundo aponta Roberta Cozza, Diretora Analista Sênior do Gartner. Segundo ela, a Inteligência Artificial Generativa (GenAI) multimodal revolucionará as aplicações corporativas ao adicionar recursos e funcionalidades antes inatingíveis, impactando setores como saúde, finanças e manufatura.

“Ao aprimorar os modelos de linguagem específicos do domínio, ela irá melhorar a precisão, automatizar as operações e impulsionar a inteligência de decisão contextual, permitindo que a Inteligência Artificial tome ações proativas em todas as tarefas.”, afirma ela.

Tecnologias de alto impacto, como modelos multimodais de GenAI, estão no centro do Radar de Impacto de Tecnologias Emergentes do Gartner para Inteligência Artificial Generativa. Os líderes de produtos terão que tomar decisões críticas sobre o investimento nessas tecnologias emergentes de GenAI para permitir que os clientes alcancem novos patamares de valor em seus negócios.

Radar de Impacto de Tecnologias Emergentes: IA Generativa



A GenAI multimodal oferece a capacidade de usar vários tipos de dados em entradas (inputs) e saídas (outputs), como imagens, vídeos, áudio (fala), texto e dados numéricos, em um único modelo generativo. A multimodalidade amplia a usabilidade da GenAI ao permitir que os modelos interajam e criem saídas entre dados em várias modalidades.

Muitos modelos oferecem processamento em duas ou três modalidades (por exemplo, texto para vídeo ou fala para imagem). Isso aumentará nos próximos anos para incluir modalidades novas e mais diversas.

“As empresas devem se concentrar na integração de recursos multimodais em softwares para aprimorar a experiência do usuário e a eficiência operacional. Ao aproveitar as diversas entradas e saídas de dados que a GenAI multimodal oferece, as empresas podem desbloquear novos níveis de produtividade e inovação”, diz Cozza.

A GenAI multimodal oferece a capacidade de usar vários tipos de dados em entradas (inputs) e saídas (outputs), como imagens, vídeos, áudio (fala), texto e dados numéricos, em um único modelo generativo. A multimodalidade amplia a usabilidade da GenAI ao permitir que os modelos interajam e criem saídas entre dados em várias modalidades.

 Atualmente, muitos modelos multimodais oferecem processamento em duas ou três modalidades (por exemplo, texto para vídeo ou fala para imagem). Isso aumentará nos próximos anos para incluir modalidades novas e mais diversas.

“As empresas devem se concentrar na integração de recursos multimodais em softwares para aprimorar a experiência do usuário e a eficiência operacional. Ao aproveitar as diversas entradas e saídas de dados que a GenAI multimodal oferece, as empresas podem desbloquear novos níveis de produtividade e inovação”, diz Cozza.