Kepler: o primeiro cientista de dados

O que um dos grandes gênios da física pode no ensinar sobre análise de dados e inteligência artificial?

Francisco Rodrigues
10 min readDec 2, 2024

Francisco Rodrigues, Universidade de São Paulo.

Quando chegou para trabalhar com o astrônomo dinamarquês Tycho Brahe (1546–1601) em 1600, no Castelo de Benátky, perto de Praga, na atual República Tcheca, Johannes Kepler (1571–1630) não imaginava a abundância de dados que o aguardava. O ambiente, no entanto, era um tanto desanimador: embora Brahe fosse considerado um dos maiores observadores do céu da história, reconhecido por sua atenção aos detalhes e busca por precisão em suas medições das posições e movimentos dos corpos celestes, ele era extremamente competitivo e ciumento em relação a outros astrônomos. Além disso, apresentava um temperamento difícil e era propenso a acessos de raiva. Mesmo assim, Kepler aceitou o desafio de colaborar com Brahe, acreditando que os ganhos poderiam superar os desafios.

No entanto, apenas 18 meses após Kepler começar a trabalhar no observatório, Tycho Brahe faleceu de maneira súbita, em 24 de outubro de 1601, em Praga, provavelmente devido a uma infecção urinária. Segundo historiadores, antes de morrer, Brahe teria pedido a Kepler: “Não deixe que meus esforços sejam em vão.” Brahe reconhecia o talento excepcional de Kepler e desejava garantir que suas décadas de observações meticulosas não fossem desperdiçadas. Essas observações, realizadas a olho nu, representavam um feito extraordinário, já que o telescópio ainda não havia sido apontado para o céu noturno por Galileu e, logo, não estava disponível na época.

Tycho Brahe foi o responsável por fornecer os dados que possibilitaram as descobertas de Kepler. Observem que Brahe usava um nariz artificial, pois perdeu a parte superior do nariz em um duelo com outro nobre, em 1566, devido a uma disputa relacionada à matemática.

Quando teve acesso completo aos dados, Kepler viu a chance de confirmar as ideias de Copérnico, que sustentavam que a Terra era um planeta e se movia ao redor do Sol. Ele foi introduzido às teorias copernicanas por seu professor e mentor, Michael Maestlin, um dos poucos astrônomos do século XVI a aderir completamente à hipótese heliocêntrica. Em 1589, quando Kepler ingressou na Universidade de Tübingen, as ideias de Copérnico eram consideradas tabu nos círculos intelectuais luteranos. Similar à Igreja Católica, Martinho Lutero rejeitava categoricamente a ideia de que a Terra girava em torno do Sol. Naquela época, prevalecia a crença de que a Terra estava imóvel no centro do universo, circundada pelos planetas e pelo Sol.

“Depois de longas investigações convenci-me, por fim, de que o Sol é uma estrela fixa rodeada de planetas que giram em volta dela e de que ela é o centro e a chama.” — Nicolau Copérnico

Kepler acreditava que os planetas orbitavam o Sol em trajetórias circulares, conforme proposto por Copérnico. Embora as previsões de Copérnico não correspondessem perfeitamente às observações disponíveis na época, Kepler estava convencido de que isso era apenas um problema com os dados, e não com o modelo heliocêntrico em si. Assim, ao se debruçar sobre as medições de Brahe, Kepler tinha certeza de que encontraria órbitas circulares e padrões geométricos perfeitos. Desde os tempos de Pitágoras, era amplamente aceito que o universo era regido por leis matemáticas harmoniosas, com os círculos simbolizando perfeição e simetria. Para Kepler, se Deus havia criado o universo, era natural esperar que ele refletisse essas formas perfeitas, de acordo com a ordem divina.

“Por toda a minha vida sempre quis ser teólogo. Sofri muito com essa mudança de direção tão inesperada. Mas agora finalmente compreendi que posso louvar a Deus de outra forma, através do meu trabalho em astronomia.” — Kepler, em carta para seu tutor Maestlin,

Kepler começou a analisar os dados coletados por Tycho Brahe e, por meio de tentativas usando a matemática disponível na época, ajustou um modelo matemático que pudesse prever a órbita de Marte. Para sua surpresa, as órbitas não eram circulares, como ele esperava, mas elípticas. Uma elipse é um círculo alongado e imperfeito, algo que contrariava profundamente suas expectativas. Kepler, influenciado por suas crenças pitagóricas e religiosas, desejava encontrar soluções mais harmoniosas e simétricas.

Insatisfeito com o resultado, Kepler decidiu analisar os dados de outros planetas, como Mercúrio, Vênus e Júpiter. Mais uma vez, verificou que as órbitas eram elípticas. Relutante, ele aceitou o que os dados mostravam e formulou sua primeira lei, a Lei das Órbitas Elípticas, que afirma: “Os planetas se movem em órbitas elípticas, com o Sol ocupando um dos focos.”. Mesmo que imperfeita, a descoberta de Kepler mostrava que o Universo pode ser descrito pela matemática.

“A imensa utilidade da matemática nas ciências naturais beira o misterioso e não há uma explicação racional para isso.” — Eugene Wigner.

Kepler continuou analisando os dados e, por meio de tentativa e erro, descobriu mais duas leis fundamentais. A segunda lei, chamada Lei das Áreas, estabelece que a linha que conecta um planeta ao Sol varre áreas iguais em intervalos de tempo iguais, indicando que os planetas se movem mais rapidamente quando estão mais próximos do Sol. Já terceira lei, a Lei dos Períodos, afirma que o quadrado do período orbital de um planeta é proporcional ao cubo da sua distância média ao Sol, revelando uma relação matemática precisa entre o tempo de revolução de um planeta e sua distância orbital. Ou seja, um indicativo de que o universo, em sua imensidão, segue uma melodia perfeita, escrita em equações matemáticas.

Ilustração da segunda lei de Kepler: a linha que conecta um planeta ao Sol varre áreas iguais durante intervalos de tempo iguais, o que implica que os planetas se deslocam com maior velocidade quando estão mais próximos do Sol. Fonte: Wikipedia.

Embora demonstrassem a regularidade do universo, que poderia ser descrita matematicamente, essas leis, no entanto, mais uma vez não refletiam a perfeição divina que Kepler buscava. Elas indicavam que os planetas não se moviam a uma velocidade constante ao redor do Sol, mas que suas velocidades variavam conforme suas posições nas órbitas elípticas. Apesar de suas crenças religiosas, Kepler aceitou os dados como reflexo da ordem natural do universo. Posteriormente, essas três leis foram fundamentais para que Isaac Newton formulasse a Lei da Gravitação Universal, conectando o movimento dos planetas à força gravitacional.

Kepler continuou sua busca por padrões geométricos perfeitos e analisou a distância dos planetas ao Sol. Ele ainda acreditava que haveria uma harmonia geométrica que refletisse a perfeição divina na criação do universo. Após explorar diversas possibilidades, finalmente encontrou um padrão. Em três dimensões espaciais, Kepler sabia que existiam apenas cinco sólidos perfeitos, ou seja, sólidos cujas faces são compostas por polígonos regulares e congruentes (idênticas em forma e tamanho, com todos os ângulos e lados iguais). Por exemplo, o cubo é um sólido perfeito (ou platônico), pois suas seis faces são quadrados. Kepler acreditava que esses cinco sólidos poderiam ser encaixados uns dentro dos outros, como matrioskas, com uma esfera imaginária entre cada dois sólidos, representando a órbita planetária. Como cinco sólidos permitem apenas seis esferas, ele pensou que essas esferas poderiam ter alguma relação com as órbitas dos planetas. Para sua alegria, com surpreendente precisão, Kepler verificou que, ao ajustar os arranjos, as esferas coincidiam com as distâncias entre os planetas. Assim, Kepler explicou a razão pela qual existiam apenas seis planetas conhecidos e o que determinava a distância deles ao Sol. Essa descoberta confirmou para Kepler que sua fé estava correta: havia, de fato, um padrão geométrico perfeito no universo.

Os sólidos platônicos na obra Mysterium Cosmographicum de Kepler. Fonte: Wikipedia.

No entanto, com a descoberta de novos planetas (Saturno, Urano e Netuno) muitos anos depois, o modelo de Kepler se mostrou limitado. Felizmente, ele não testemunhou essas novas descobertas e morreu acreditando em sua teoria. Pelo menos essa foi uma das poucas alegrias de um cientista cuja vida foi marcada por tragédias: seu pai, um mercenário que o maltratava; sua mãe, quase queimada na Inquisição; e vários filhos que morreram ainda na infância. Kepler viveu doente e em pobreza, mas foi na ciência que encontrou alento.

“Todos podemos apreciar a beleza de um arco-íris, mas compreender um pouco da ciência torna-o ainda mais inspirador.” — Jim Al-Khalili, professor na University of Surrey.

Kepler: o cientista de dados

Agora que sabemos um pouco sobre a vida de Kepler, qual é a sua relação com a Ciência de Dados? Para começar, Kepler foi um dos primeiros cientistas a usar dados para ajustar uma teoria. Diferentemente dos antigos gregos, como Aristóteles, Kepler baseou suas leis em dados empíricos. Para Aristóteles, o conhecimento deveria ser fundamentado na observação qualitativa, na lógica e no raciocínio dedutivo, em vez de depender de experimentação sistemática ou medições rigorosas, como entendemos hoje.

Além disso, embora bastante religioso e com crenças bem estabelecidas, Kepler baseou suas conclusões exclusivamente nos dados, mesmo que de forma relutante. Ele aceitou que as órbitas dos planetas não eram esferas e que o movimento dos planetas não ocorria a uma velocidade constante ao redor do Sol. Em outras palavras, os dados prevaleceram sobre suas crenças.

A seguir, Kepler tentou encontrar padrões nos dados. Ele não dispunha dos métodos e modelos que temos hoje, como o método dos mínimos quadrados, introduzido por Gauss mais de um século depois, ou modelos de regressão e estatística multivariada. Além disso, ele não tinha computadores ou mesmo calculadoras. Ou seja, ele utilizou apenas tentativa e erro, guiado por princípios matemáticos e físicos, principalmente a geometria.

No método científico, observamos fenômenos, formulamos hipóteses e testamos teorias para compreender e prever o comportamento da natureza. Kepler foi um dos pioneiros a aplicar essa abordagem de maneira sistemática, integrando dados empíricos e análise matemática para validar suas descobertas.

Portanto, ele agiu como um investigador, formulando hipóteses com base nas pistas (observações) coletadas. Caso uma hipótese se confirmasse, isso não significava que ela era universal. O modelo encontrado deveria ser aplicável a outros planetas. Assim, ele ajustou seu modelo aos dados de Marte e, em seguida, verificou que ele também se aplicava a Mercúrio, Vênus e Júpiter. Logo, Kepler verificou se seu modelo generalizava para novos dados. Dessa forma, ele formulou suas leis, utilizando uma abordagem pioneira para a época, pois combinou observações empíricas com cálculos matemáticos rigorosos para descrever o movimento dos planetas.

Em resumo, Kepler analisou os dados, identificou padrões (equações matemáticas) e, em seguida, verificou que o modelo era válido para novos dados. Ele deixou suas crenças pessoais de lado e publicou seus resultados de maneira crítica e imparcial, permitindo que outros pudessem verificar suas descobertas. Esse é um trabalho típico de um cientista de dados.

Regressão simbólica

Além da metodologia científica que desenvolveu, Kepler também tem inspirado a inteligência artificial. Em 1992, John R. Koza, em seu livro Genetic Programming: On the Programming of Computers by Means of Natural Selection, introduziu uma maneira de automatizar a descoberta de expressões matemáticas usando programação genética, uma extensão dos famosos algoritmos genéticos. O objetivo era encontrar uma expressão simbólica composta por operações matemáticas, variáveis e constantes, que minimizasse o erro em relação aos dados fornecidos. Ou seja, a partir dos dados, era possível encontrar automaticamente a expressão matemática que melhor os descrevia. Em resumo, isso pode ser visto como uma automação do trabalho de Kepler.

Posteriormente, Michael Schmidt e Hod Lipson desenvolveram métodos mais avançados e eficientes para encontrar essas equações, como o algoritmo Eureqa. Esse método ficou conhecido como regressão simbólica, que busca encontrar relações matemáticas entre variáveis a partir de dados brutos, em um processo similar ao realizado por Kepler, mas com a ajuda de ferramentas computacionais modernas.

Enquanto na regressão tradicional o objetivo é inferir os parâmetros de um modelo previamente definido para que ele se ajuste da melhor forma aos dados, na regressão simbólica busca-se descobrir tanto a estrutura funcional do modelo quanto seus parâmetros. Isso permite que o algoritmo encontre, de forma automatizada, a equação matemática que melhor descreve a relação entre as variáveis, sem a necessidade de pressupor previamente a forma do modelo. Dessa forma, temos um método para encontrar leis matemáticas inspirado diretamente no trabalho de Kepler, que também buscava descobrir as leis subjacentes ao movimento dos planetas a partir dos dados observacionais, sem impor uma forma funcional pré-determinada.

A árvore de expressões é uma estrutura de dados que pode ser utilizada na regressão simbólica para representar uma função matemática. Cada nó interno da árvore representa uma operação matemática (como soma, multiplicação, divisão, etc.), enquanto as folhas da árvore contêm as variáveis e constantes. A expressão final da função é obtida ao percorrer a árvore, aplicando as operações nos nós internos, com base nos valores das folhas. Pense em como obter a equação na figura seguindo os componentes da árvore. Fonte: Wikipedia.

A regressão simbólica tem sido aplicada em uma ampla gama de problemas nas áreas de ciência, engenharia e tecnologia, especialmente em contextos nos quais as relações entre variáveis não são bem compreendidas ou quando se busca a descoberta de modelos matemáticos interpretáveis. Por exemplo, em física, ela tem sido utilizada para identificar relações matemáticas subjacentes a fenômenos físicos diretamente a partir de dados experimentais. Em biologia, pode auxiliar na identificação de equações diferenciais que descrevem o comportamento de populações de células ou patógenos. Em economia, é usada para descobrir equações que preveem movimentos de mercado ou para identificar relações entre indicadores econômicos. Basicamente, fornecemos os dados e os operadores matemáticos ao modelo, que então encontra as equações mais prováveis. Assim, a regressão simbólica complementa e potencializa o trabalho científico.

O cientista artificial

Uma questão interessante que surge com a regressão simbólica é: como ela automatiza o processo de descoberta, poderia substituir o trabalho de um cientista? À primeira vista, a resposta pode parecer sim, mas a realidade é mais complexa. Em sistemas físicos, por exemplo, leis fundamentais, como as de conservação de energia e momento, devem ser respeitadas, e muitas o ajuste pelo método de regressão simbólica pode levar a soluções que não são adequadas ou fisicamente viáveis. A Navalha de Ockham nos lembra que é preciso equilibrar precisão e interpretabilidade ao escolher modelos, o que significa que soluções excessivamente simples podem falhar em capturar a complexidade dos fenômenos.

Portanto, a regressão simbólica não substitui o cientista, mas funciona como uma ferramenta poderosa que expande suas capacidades de investigação. Ela automatiza partes do processo científico, mas as etapas de formulação de hipóteses, validação teórica e experimental, e interpretação criativa permanecem, no estágio atual da tecnologia, um domínio exclusivamente humano.

Portanto, a regressão simbólica pode ser vista como uma ferramenta moderna que expande o tipo de trabalho realizado por Kepler, facilitando a identificação de leis e relações de forma mais eficiente e, muitas vezes, com menor intervenção humana. Ela permite que cientistas descubram equações matemáticas capazes de modelar fenômenos observados em diversas áreas, como física, biologia e outras disciplinas. Embora ainda em constante evolução, a regressão simbólica já demonstra um enorme potencial para oferecer a interpretabilidade necessária na abordagem de problemas complexos e para impulsionar avanços científicos.

Por exemplo, em um trabalho recente, pesquisadores verificaram que é possível predizer equações do livro de Richard Feynman de forma automática. O algoritmo, que usa redes neurais, chamado AI Feynman, foi capaz de identificar todas as 1000 equações testadas. No entanto, o algoritmo não consegue determinar se as leis são fisicamente corretas. Isto é, o algoritmo não concebe quaisquer leis da física. Mas talvez isso seja uma questão de tempo. O futuro dirá se vamos conseguir substituir Kepler.

Caso tenham curiosidade em conhecer minhas pesquisas, visitem esse link: https://sites.icmc.usp.br/francisco.

Até a próxima!

Sign up to discover human stories that deepen your understanding of the world.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

Francisco Rodrigues
Francisco Rodrigues

Written by Francisco Rodrigues

Professor of Data Science and Complex Systems at the University of São Paulo. https://linktr.ee/francisco.rodrigues

No responses yet

Write a response