Porque a Inteligência Artificial não compreende realmente o que diz (e porque isso é mais importante do que parece)

Desde o lançamento do ChatGPT, uma das perguntas que mais ouvi foi:
“Será que isto já pensa como um ser humano?”
É uma pergunta legítima.
Quando conversamos com um modelo de Inteligência Artificial moderno, a experiência pode
ser surpreendente. Conseguimos discutir história, ciência, programação, filosofia, negócios
ou praticamente qualquer outro tema. Muitas vezes as respostas parecem mais claras e
organizadas do que aquelas que receberíamos de uma pessoa.
Perante isto, é natural concluir que a máquina compreende aquilo que está a dizer.
Mas será mesmo assim?
Ao estudar Machine Learning e Inteligência Artificial, uma das ideias que mais me
surpreendeu foi precisamente esta:
A Inteligência Artificial atual consegue produzir respostas extremamente inteligentes sem
compreender verdadeiramente aquilo que está a dizer.
Esta distinção parece subtil, mas tem implicações enormes.

O que significa compreender?

Antes de respondermos à pergunta principal, vale a pena refletir sobre algo mais básico.
O que significa realmente compreender?
Imagine que lhe peço para explicar o que é uma bicicleta.
Provavelmente não irá apenas descrever duas rodas, um guiador e um quadro.
Consegue imaginar uma bicicleta.
Consegue recordar experiências.
Consegue antecipar o que acontece se travar demasiado bruscamente.
Consegue imaginar alguém a aprender a andar de bicicleta.
Ou seja, existe um conjunto de experiências, memórias, contexto e significado associado ao
conceito.
É isso que normalmente chamamos compreensão.

Os seres humanos não lidam apenas com palavras.
Lidam com significado.

Como funciona um modelo como o ChatGPT?

Agora imaginemos o funcionamento de um modelo de linguagem.
Durante o treino, o sistema analisa milhares de milhões de frases.
Livros.
Artigos.
Sites.
Documentação técnica.
Código.
Conversas.
A partir desses dados aprende padrões estatísticos.
Aprende que determinadas palavras tendem a surgir próximas umas das outras.
Aprende estruturas gramaticais.
Aprende relações entre conceitos.
Quando fazemos uma pergunta, o modelo não procura uma resposta numa base de dados.
Também não raciocina da mesma forma que uma pessoa.
Aquilo que faz é calcular qual a sequência de palavras mais provável para responder ao
contexto recebido.
Por outras palavras:
O modelo está constantemente a prever a palavra seguinte.
Parece demasiado simples para explicar resultados tão impressionantes.
Mas é exatamente isso que acontece.

Uma metáfora simples

Imagine um músico que ouviu toda a música produzida pela humanidade.
Não sabe tocar nenhum instrumento.
Não compreende teoria musical.
Mas conhece todos os padrões possíveis.
Quando lhe pedimos uma nova música, consegue gerar algo coerente porque reconhece
padrões estatísticos existentes.
Os grandes modelos de linguagem funcionam de forma semelhante.
Não possuem conhecimento da mesma forma que uma pessoa.
Possuem uma representação matemática dos padrões encontrados nos dados.

Porque parece então tão inteligente?

Porque a linguagem humana possui uma enorme quantidade de regularidades.
Quando dizemos:
A capital de Portugal é…
A palavra mais provável é:
Lisboa.
Quando dizemos:
A água congela a…
A continuação mais provável será:
0 graus Celsius.
Os modelos aprendem estas relações em escalas gigantescas.
O resultado final é tão convincente que o nosso cérebro tende automaticamente a atribuir
inteligência e compreensão ao sistema.
Na realidade estamos a observar uma forma extremamente sofisticada de previsão
estatística.

O problema da Sala Chinesa

Existe uma experiência mental muito interessante proposta pelo filósofo John Searle
chamada “Chinese Room”.
Imagine uma pessoa que não fala chinês.
Essa pessoa encontra-se fechada numa sala.
Recebe perguntas escritas em chinês.
Possui um livro gigantesco com regras que lhe dizem exatamente como responder a cada
símbolo.
Seguindo essas regras consegue produzir respostas perfeitas em chinês.
Do lado de fora, qualquer observador concluiria que a pessoa compreende chinês.
Mas será verdade?
Na realidade, a pessoa está apenas a seguir instruções.
Não compreende o significado das palavras.
Não compreende as perguntas.
Não compreende as respostas.
Searle utilizou este exemplo para questionar se os computadores realmente compreendem
aquilo que processam.
Décadas depois, a discussão continua extremamente atual.

O que isto significa para as empresas?

Pode parecer uma discussão filosófica sem relevância prática.
Mas não é.
Imagine uma empresa que pretende utilizar Inteligência Artificial para analisar contratos.
Ou apoiar decisões financeiras.
Ou interpretar legislação.
Se assumirmos que a IA compreende verdadeiramente o contexto, podemos confiar
excessivamente nas respostas.
Esse é um erro perigoso.
Os modelos atuais podem produzir respostas muito convincentes e simultaneamente
incorretas.
Este fenómeno é conhecido por “alucinação”.
A IA não está a mentir.
Não está a tentar enganar.
Está simplesmente a gerar a sequência de palavras que considera mais provável.
Por vezes essa sequência corresponde à realidade.
Por vezes não.

O exemplo da eficiência energética

Na área da energia encontramos um excelente exemplo desta limitação.
Imagine um sistema de Inteligência Artificial que analisa os consumos de um edifício
municipal.
O modelo pode identificar padrões.
Pode prever consumos futuros.
Pode detetar comportamentos anómalos.
Pode até sugerir medidas de eficiência energética.
Mas não compreende verdadeiramente o edifício.
Não conhece os utilizadores.
Não sabe que determinada escola realizou um evento extraordinário.
Não sabe que uma piscina municipal recebeu uma competição regional.
Não sabe que um equipamento avariou recentemente.
O sistema vê padrões.
O gestor energético vê contexto.
É precisamente por isso que acredito que o futuro não passa pela substituição dos
especialistas.
Passa pela colaboração entre especialistas e sistemas inteligentes.

O exemplo do Gestor Virtual de Energia

Ao longo dos últimos anos tenho trabalhado em soluções relacionadas com eficiência
energética e apoio à decisão.
Uma das conclusões mais importantes a que cheguei é que os dados, por si só, raramente
contam toda a história.
Um algoritmo pode concluir que determinado edifício apresenta consumos elevados.
Mas a decisão correta depende de fatores adicionais:
Utilização do espaço.
Condições climatéricas.
Estado dos equipamentos.
Eventos extraordinários.
Estratégia da organização.
A Inteligência Artificial ajuda-nos a identificar padrões invisíveis.
Mas continua a ser necessária interpretação humana.

Então a IA não é inteligente?

Depende da forma como definimos inteligência.
Se entendermos inteligência como a capacidade de resolver problemas complexos, então a
resposta é claramente sim.
Os sistemas atuais conseguem:
Escrever código.
Traduzir documentos.
Resumir informação.
Analisar grandes volumes de dados.
Apoiar diagnósticos médicos.
Otimizar processos industriais.
Mas se entendermos inteligência como consciência, compreensão ou experiência subjetiva,
então a resposta é muito menos clara.
Até hoje não existe evidência de que os modelos atuais possuam qualquer forma de
consciência.

O futuro

Uma das perguntas mais fascinantes da atualidade é perceber se a compreensão
verdadeira
será necessária para criar sistemas ainda mais capazes.
Alguns investigadores acreditam que sim.
Outros defendem que a inteligência pode emergir apenas através da escala e dos dados.
Independentemente da resposta, estamos a assistir a uma transformação tecnológica sem
precedentes.
E compreender as limitações dos modelos é tão importante quanto compreender as suas
capacidades.

Conclusão

Uma das maiores lições que retirei dos meus estudos em Machine Learning é que a
Inteligência Artificial atual não funciona da forma que muitas pessoas imaginam.
Os modelos modernos não possuem consciência.
Não possuem emoções.
Não possuem experiências.
Não compreendem o mundo da mesma forma que nós.
Mas conseguem identificar padrões numa escala impossível para qualquer ser humano.
Talvez a verdadeira questão não seja se a Inteligência Artificial compreende.
Talvez a questão seja:
Como podemos utilizar esta extraordinária capacidade de identificar padrões para tomar
melhores decisões?
Na minha opinião, é precisamente aí que reside o maior potencial da Inteligência Artificial
para empresas, organizações e sociedade.

Helder Valdez