Avatar do usuário logado
Usuário
OLÁ, Usuário
Ícone de fechar alerta de notificações
Avatar do usuário logado
Usuário

Usuário

email@usuario.com.br
Black Friday: 4 Revistas pelo preço de uma!

Entenda o método que permite a máquinas aprender sozinhas a melhorar o desempenho

Inspirado na curiosidade humana, o controle extremal permite que sistemas testem, errem e se ajustem sozinhos para atingir o melhor desempenho

Por Tiago Roux Oliveira*, para The Conversation
28 out 2025, 17h00


Simples assim. Imagine que você está cozinhando e tenta acertar o tempero de uma sopa. Coloca um pouco de sal, prova, percebe que está sem graça, acrescenta mais um pouco e experimenta novamente — até encontrar o ponto ideal.

Esse processo de tentativa e erro é natural para nós, humanos. Mas como fazer uma máquina ou um sistema automático encontrar, sozinha, o seu “melhor ponto de operação”?

É justamente isso que o controle extremal, conhecido internacionalmente como extremum seeking control (ou controle extremal, em português), busca resolver. Essa técnica permite que sistemas ajustem automaticamente seu comportamento para alcançar o desempenho ótimo, mesmo sem conhecer exatamente o modelo matemático que descreve seu funcionamento.

A busca pelo “ótimo”

A ideia de otimizar — ou seja, buscar o melhor possível dentro de certas condições — está em praticamente tudo ao nosso redor. Queremos o maior rendimento energético, o menor consumo de combustível, o melhor sinal de internet, a maior eficiência industrial.

Na prática, porém, nem sempre sabemos como um sistema reage a cada ajuste. Pequenas mudanças de temperatura ou pressão, por exemplo, podem alterar drasticamente o desempenho de uma máquina. Em muitos casos, é difícil construir um modelo matemático preciso para prever isso.

O controle extremal oferece uma alternativa simples e poderosa: em vez de depender de equações complexas, ele aprende diretamente com a experiência, testando pequenas variações e observando o resultado.

Como o controle extremal funciona: um pitada de intuição e outra de matemática

O princípio é semelhante ao de um cozinheiro que experimenta o sabor da comida a cada novo tempero. O sistema faz pequenas perturbações — muda um pouco o parâmetro de controle — e observa como o desempenho varia.

Continua após a publicidade

Se a mudança melhora o resultado, o sistema continua nessa direção. Se piora, ajusta para o lado oposto. Com o tempo, ele se aproxima do ponto ótimo.

Trata-se de um aprendizado adaptativo em tempo real, incorporado ao controle automático. Diferentemente de técnicas de inteligência artificial que exigem grandes quantidades de dados, o controle extremal aprende enquanto opera, sem precisar parar o sistema para recalibrar.

Essa característica o torna ideal para ambientes que mudam rapidamente, como veículos em movimento, processos industriais complexos ou redes de energia com alta variação de carga.

Um pouco de história

As contribuições para o controle extremal, também conhecido como “busca de pico”, datam das décadas de 1950-1960. Na verdade, ele foi inventado em 1922 por Maurice Leblanc. E o algoritmo não era complicado — continha apenas um integrador, combinado com um sinal senoidal usado tanto como perturbação quanto para demodulação. A versão mais sofisticada já inclui os filtros passa-baixa e passa-alta que ajudam a melhorar seu desempenho.

O antigo nome “busca de pico” deixava claro que o objetivo do algoritmo era otimização.

Continua após a publicidade

Draper e Li, em 1951, introduziram a busca de pico nos Estados Unidos, de uma história que já era contada meia década anterior na União Soviética. A literatura que se seguiu nas décadas de 1950 e 1960, concentrava-se em heurísticas criativas, mas não havia qualquer teoria consolidada. Não havia teoremas com propriedades claras, nem provas baseadas em hipóteses precisas.

Cerca de trinta anos se passaram desde então, quando Åström e Wittenmark, em 1995, colocaram o controle extremal entre as áreas mais promissoras para controle adaptativo. Nesse estágio, surgiu uma figura central, o professor Miroslav Krstic da University of California – San Diego (UCSD). Em retrospectiva, ele estabeleceu alguns passos fundamentais para uma prova rigorosa: uma aproximação por perturbação singular da planta e uma aproximação por uma análise da média da malha do controlador extremal.

Assim conseguiu-se estabelecer a estabilidade prática exponencial local do sistema em malha fechada, de modo a obter-se a convergência para uma vizinhança pequena do equilíbrio (extremo), culminando num artigo na prestigiosa revista Automatica em 2000.

Posteriormente, o controle extremal cresceu em milhares de novos artigos ao longo dos anos. Essa pesquisa abrangente foi detalhada por Alexander Scheinker e publicada em seu Survey paper, cobrindo a maioria das realizações conhecidas em teoria e aplicações desse método.

A contribuição da pesquisa científica

Desde então, o controle extremal tem sido tema de pesquisa em universidades e centros tecnológicos ao redor do mundo. Nos últimos anos, avanços teóricos e computacionais têm ampliado seu alcance e confiabilidade.

Continua após a publicidade

No Brasil, nosso grupo de pesquisa, do Centro de Tecnologia e Ciências da Faculdade de Engenharia, da Universidade do Estado do Rio de Janeiro, é pioneiro e desenvolve métodos que combinam controle adaptativo e otimização em tempo real.

O desenvolvimento do controle extremal avançou, ao longo dos últimos cem anos, de mapas estáticos, para sistemas dinâmicos de dimensão finita, até redes de agentes estáticos e dinâmicos. Em particular, nossa contribuição é na extensão para mapeamentos e agentes que incorporam atrasos ou até equações diferenciais parciais e um passo natural nessa progressão.

Em coautoria com o professor Miroslav Krstic, publiquei um livro que discute resultados sobre o projeto de algoritmos e a teoria de controle extremal para tais sistemas de dimensão infinita. São apresentadas tanto dinâmicas hiperbólicas quanto parabólicas: equações com atraso ou de transporte, equações dominadas pelo calor, equações de onda e equações de reação-adveção-difusão.

Métodos são introduzidos para otimização de um agente único e estendidos a cenários de jogos não cooperativos livres de modelos. Até jogos heterogêneos, como um duopólio com um agente parabólico e um hiperbólico, são considerados.

Várias aplicações de engenharia são abordadas para ilustração, incluindo controle de fluxo e tráfego para mobilidade urbana, sistemas de perfuração de petróleo, busca de fontes em cabos submersos, manufatura aditiva, reatores biológicos, busca de fontes de luz com estruturas de feixe flexível e estimulação elétrica neuromuscular.

Continua após a publicidade

Essa área também dialoga com a transição digital que estamos vivendo. O conceito de Indústria 4.0, por exemplo, depende de sistemas capazes de operar de forma autônoma e eficiente. Nesse contexto, o controle extremal é um dos mecanismos que permitem que sensores, atuadores e algoritmos trabalhem juntos para extrair o máximo desempenho de máquinas e processos.

Muitas outras aplicações que já fazem parte do nosso dia a dia

Embora pareça algo de laboratório, o controle extremal já está presente em várias tecnologias.

Nos automóveis modernos, ele pode ajustar continuamente a mistura de ar e combustível para minimizar o consumo. Em turbinas eólicas, otimiza o ângulo das pás para extrair a máxima energia do vento. Em fábricas, controla temperatura e pressão para reduzir desperdícios e aumentar a eficiência. Em robôs, permite que eles executem tarefas com precisão mesmo sem conhecer detalhadamente o ambiente ao redor.

Há também aplicações em áreas menos óbvias. Na biotecnologia, ajuda a regular condições ideais para o crescimento de células. Em telecomunicações, ajusta parâmetros de antenas para maximizar o sinal. Em sistemas ambientais, controla reatores usados no tratamento de efluentes ou na produção de biogás.

Em todos esses casos, o princípio é o mesmo: o sistema busca o ponto ótimo com base na observação direta do desempenho.

Continua após a publicidade

Impacto silencioso, mas profundo

O controle extremal é uma dessas tecnologias discretas que tornam a vida mais eficiente sem chamar atenção. Seus efeitos aparecem de forma indireta: menor consumo de energia, redução de custos industriais, melhor qualidade de produtos e processos mais sustentáveis.

À medida que máquinas e sistemas se tornam mais complexos e interconectados, cresce a necessidade de controladores capazes de aprender e se adaptar sozinhos. O controle extremal é uma resposta elegante a esse desafio.

Imagine edifícios inteligentes que ajustam automaticamente ventilação e iluminação para economizar energia. Ou carros autônomos que aprendem, em tempo real, a dirigir de modo mais eficiente e seguro.

Essas possibilidades não estão distantes. São exemplos de como essa tecnologia pode contribuir diretamente para um futuro mais inteligente e sustentável.

Desafios e perspectivas

Apesar de suas vantagens, o controle extremal ainda enfrenta desafios. Garantir rapidez de convergência e robustez a diferentes tipos de distúrbios são temas de pesquisa ativa.

Outra fronteira promissora é a integração com a Inteligência Artificial (IA). Enquanto o controle extremal oferece garantias matemáticas e estabilidade, a IA amplia a capacidade de aprendizado e previsão.

O futuro tende a ser híbrido: máquinas que aprendem continuamente, mas mantêm segurança e confiabilidade mesmo diante de incertezas. Isso será fundamental em veículos autônomos, redes elétricas inteligentes e sistemas médicos automatizados.

Método inspirado pela curiosidade humana

O controle extremal é, em certo sentido, uma expressão tecnológica da curiosidade humana. Ele permite que máquinas experimentem, observem e melhorem — um comportamento essencialmente científico.

Assim como ajustamos o tempero da sopa até chegar ao sabor ideal, sistemas guiados por esse princípio se ajustam para alcançar o melhor desempenho possível. Trata-se de uma tecnologia silenciosa, mas com potencial de transformar a forma como produzimos, consumimos e interagimos com o mundo.

Retomando à nossa pergunta inicial, surge outra igualmente provocativa: se o controle extremal permite que máquinas aprendam sozinhas a melhorar, o que ainda nos resta ensinar a elas?

O impulso de buscar o melhor continua sendo humano. É ele que nos trouxe até aqui — e que agora ensina as máquinas a seguir adiante. Talvez seja justamente esse impulso compartilhado que nos conduzirá, juntos, a um futuro em que a inteligência das máquinas amplie a nossa, e não a substitua.

A publicação deste artigo foi financiada pela Coordenação de Pessoal de Nível Superior (Capes).

*Tiago Roux Oliveira, Professor do Departamento de Engenharia Eletrônica, Universidade do Estado do Rio de Janeiro (UERJ)

Publicidade

Matéria exclusiva para assinantes. Faça seu login

Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

OFERTA CONTEÚDO LIBERADO

Digital Completo

A notícia em tempo real na palma da sua mão!
Chega de esperar! Informação quente, direto da fonte, onde você estiver.
De: R$ 16,90/mês Apenas R$ 1,99/mês
ECONOMIZE ATÉ 47% OFF

Revista em Casa + Digital Completo

Receba 4 revistas de Veja no mês, além de todos os benefícios do plano Digital Completo (cada revista sai por menos de R$ 7,50)
De: R$ 55,90/mês
A partir de R$ 29,90/mês

*Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
*Pagamento único anual de R$23,88, equivalente a R$1,99/mês.