21.5 C
São Paulo
21 de novembro de 2024

O que falta para confiarmos às LLMs as decisões tomadas sobre dados?

Guilherme Welter (*) 

Os LLMs (grandes modelos de linguagem, da sigla em inglês) são um gigantesco avanço tecnológico que está sendo integrados ao nosso cotidiano rapidamento, por via direta, através de assistentes como o ChatGPT ou Gemini, ou por via indireta, à medida que mais e mais serviços tecnológicos incorporam estes recursos de inteligência artificial.

Para quem está na indústria e busca inovar e desenvolver tecnologia, provavelmente vê os LLMs como uma via de enormes possibilidades e muitas facilitações, já que não é mais necessário falar com computadores unicamente com linguagem de programação. E, os que possuem o objetivo de extrair valor dos dados de sua empresa ou setor industrial, também possuem a mais factível possibilidade de obter um relatório de insights profundos, e talvez elaborar a projeção de cenários futuros e estratégias para cada um deles.

As ambições acima não devem soar futuristas nem novas, pois têm sido repetidas e especuladas desde o impulsionamento de transformação digital das empresas e o propósito de tomar decisões embasadas em dados. Considerando o salto tecnológico que os LLMs representam por si sós, mais o desenvolvimento acelerado que se projeta nessas tecnologias e as enormes apostas financeiras e tecnológicas das big techs, surge a seguinte questão: o que falta para confiar aos LLMs as interpretações e decisões sobre os dados?

Complexidade necessária para decisões

É claro que existe uma escala ilimitada em relação ao grau de sofisticação requerido para uma decisão, neste caso, relevante a um problema de negócios. No início desta escala estão decisões como “se ocorrer isso, então aquilo, senão o outro”, como no caso de compra de uma ação na bolsa de valores, dada a confiança em uma projeção de preços futuros para a ação. Em caminho ao outro extremo, têm-se decisões que requerem imaginar muitos cenários possíveis e considerar as incertezas envolvidas, como no caso de um jogador de xadrez, planejando uma sequência de movimentos, levando em consideração as reações do adversário.

Esta escala de sofisticação mencionada é chamada de complexidade algorítmica, e é um termo mais conhecido em aplicações que envolvem compressão de informação. Quando nos deparamos com um problema novo, diferente de todos os outros que conhecíamos até então, precisamos de capacidade para desenvolver em nossa mente o algoritmo necessário para sua solução, sendo ele sofisticado ou não. Isto mostra que podemos planejar e interagir com o ambiente de forma simulada (imaginada).

Quanta informação há nos dados?

O segundo aspecto a ser analisado é, em realidade, mais elementar, a informação que obtemos dos dados.

Ao invés de uma escala contínua, existe uma denominação chamada de Hierarquia da Informação, também conhecida como Hierarquia do Conhecimento [1]. De acordo com esta ideia, há uma sequência hierárquica, na seguinte ordem: Dados – Informação – Conhecimento – Sabedoria.

Segundo Rowley e suas referências [1], há certo entendimento de que dados podem ser levados à informação através de dois tipos de processos: estruturação e ordenação dos dados, e atribuição de significados aos dados. O terceiro degrau da hierarquia, o conhecimento, há menos consenso entre autores, mas há uma proposição mais restrita que postula conhecimento como “informação acionável”. O quarto grau, sabedoria, há ainda menos consenso.

Dos dois processos que podem levar da categoria de “Dado” à de “Informação”, o primeiro é relacionado a uma ideia de padrão, do qual se poderia imaginar algo deduzível por um algoritmo de reconhecimento. O segundo, no entanto, é uma convenção do significado, algo que não pode ser simplesmente deduzido por um procedimento, sem o recurso de uma Pedra de Roseta.

LLMs para tomada de decisão

Apesar de já demonstrarem características iniciais do que se pode esperar de inteligência artificial geral [2], os LLMs possuem limitações inerentes importantes, como a incapacidade de planejar e imaginar a consequência de ações, como argumentado por Yann Lecun [3]. Estas habilidades são elementos necessários para o desenvolvimento de raciocínios mais complexos e, consequentemente, encontrar as melhores decisões para um problema.

Uma maneira de contornar esta limitação, ao menos em parte, é com a utilização de uma abordagem de agentes, onde se abandona a ideia de utilização do LLM como ferramenta monolítica e passa a utilizar LLMs como parte de um sistema com várias componentes. Como justificado por Andrew Ng [4], esta abordagem traz enorme flexibilidade e mais possibilidades, além de diminuir a dependência de modelos mais robustos.

Para o caso específico de tomada de decisões, Liu et al. (2024, [5]) propõem uma abordagem de agentes combinando engenharia de instruções, teoria de decisão e simulação de Monte Carlo. Isto mostra que, se LLMs sozinhos podem não ser capazes de resolver problemas mais complexos, eles são, para dizer o mínimo, elementos que contribuem para a construção de sistemas mais avançados que sim, são capazes de resolver tais problemas.

LLMs para entender dados

Nos voltando para o segundo aspecto levantado na conceitualização, que é em relação aos dados e informação.

Tipicamente, os conjuntos de dados do meio corporativo e industrial são heterogêneos, estruturados e não-estruturados, são esparsos em termos de conteúdo, com grande variedade de formatos e fontes. Por si só, estas características são desafiadoras para a aplicação de metodologias analíticas.

Um humano, especialista em uma determinada área de negócios, pode analisar a coleção de dados com seus métodos, extrair informações relevantes, e assim fazer descobertas importantes e não-triviais a partir da interpretação destes dados.

Enquanto existem camadas de fusão para transformar formatos de dados como áudio e imagem em linguagem, no caso de dados como na coleção mencionada acima, não há uma forma ou regra geral para se estruturar e ordenar os dados, que possa ser estabelecida de antemão.

Cada possibilidade de se estruturar e ordenar os dados seria um processo novo a ser descoberto, que, no caso de uma coleção de dados heterogênea e de conteúdo esparso, pode haver um número muito grande de possibilidades a serem testadas.

Conclusões

A principal barreira para que os LLMs possam entender dados, obter insights e elaborar cenários para a tomada de decisões de negócios não é relacionada ao poder de raciocínio, especificamente. A dificuldade reside a um nível mais fundamental: determinar o que é informação relevante a partir de uma coleção de dados não-estruturados.

Esse desafio se relaciona diretamente com a Hierarquia da Informação, onde a transformação de dado em informação requer identificação de estruturas a atribuição de significado ao dado. A solução para essa dificuldade é caso-específica e exige compreensão profunda do contexto e domínio do problema.

Para este propósito, a abordagem de agentes talvez seja a mais importante ferramenta que possuímos.

(*) Cientista de Dados Sr. da Dshbird.