Nossas células são computadores

Postado as 08:07 - 16/12/2009 - Por Carlos Alberto Teixeira. Categorias: Computadores.

http://blogs.forumpcs.com.br/cat/2009/12/16/nossas-celulas-sao-computadores/

Enquanto brincamos com hardware convencional e com as várias peças de software que nele rodam, estamos apenas arranhando a superfície de uma tecnologia muito mais poderosa e impactante que poderá emergir das pesquisas daqui a alguns anos.


Esquema de uma célula humana, a unidade básica da vida organizada.
Entendendo como ela funciona, poderemos um dia ousar criar algo
parecido usando nossa capacidade científica e tecnológica. Só que as
entranhas da célula e os muitos dos segredos de seu funcionamento
permanecem um mistério para nós.

A cada passo dado pela ciência dos homens, maIs eles se aproximam do Criador. Quando lidamos com um computador de ferro, silício e fios, controlado por programas escritos por humanos como nós, estamos manipulando uma máquina que, de certo modo, não deixa de ser um organismo. Pode ainda estar longe do que seria um ser vivo em plena atividade, mas funcionalmente desempenha o papel de uma criatura — só que com carcaça metálica e nervos eletrônicos.

No entanto, se um dia quisermos emular (ou mesmo criar) as funções de organismos vivos, teremos primeiramente que entender a célula viva, que é um sistema autônomo extremamente bem organizado, consistindo de uma série de componentes discretos interligados.

A chave para compreender e modelar matematicamente o funcionamento de uma célula é traçar um modelo fidedigno de sua organização como sistema. Nesse sentido, foram caracterizadas quatro ferramentas químicas, cada uma delas batendo com uma classe de macromoléculas — ácidos nucleicos (DNA, RNA etc.), proteinas, lipídios e carboidratos (vide explicação mais detalhada ao final da coluna). Cada uma dessas ferramentas consiste de um pequeno número de componentes que são “encaixados” entre si, formando estruturas complexas que interagem das mais diversas formas. Esse processo de “encaixe” se dá por um processo chamado polimerização, ou seja, pelo encadeamento de unidades básicas chamadas monômeros.


Dr. Luca Cardelli, um dos primeiros cientistas a propor um olhar
informático com relação à célula biológica.

Segundo o Dr. Luca Cardelli, cientista computacional italiano atuando como diretor assistente da Microsoft Research, na Inglaterra, e especialista em bioquímica artificial, essas quatro ferramentas básicas podem ser imaginadas e estudadas sem levar em conta detalhes químicos, apenas funcionais e lógicos. Sim, eu sei, você já está sentindo no ar um perfume de… computação. Acertou.

Essas ferramentas podem ser representadas por máquinas abstratas dotadas de um conjunto de instruções próprio, como se fossem computadores. Além disso, essas máquinas possuem modelos de interação especiais, que não se parecem muito com aqueles a que estamos acostumados em computação convencional — proteínas grudam-se umas às outras; genes têm um padrão fixo de informações de saída; membranas desempenham atividades em suas superfícies etc. Ou seja, nada a ver com os eventos em um computador comum.

Todavia, os biólogos, que não bobos, deram um jeito de inventar algumas notações especiais para descrever essas máquinas abstratas e os processos que elas implementam, de modo que seja possível pensar nesses conjuntos de componentes como sistemas computacionais especiais.

Partindo da biologia molecular, esses sistemas bioinformáticos buscam compreender como funcionam as interações entre esses modelos. Os cientistas já vêm quebrando a cabeça com esses componentes e suas redes de funcionamento há cerca de 50 anos, desde que foi descoberta a estrutura do DNA. Nesse processo, eles acumularam um acervo de conhecimentos absolutamente impressionante. Mas mesmo assim, não se pode afirmar com segurança que eles já compreendem inteiramente o funcionamento de uma única célula, pelo menos não a ponto de serem capazes de modificá-la ou consertá-la, caso haja dano em alguma.


O mosaico colorido que representa a sequência genética de um ser
vivo é uma matriz de informações discretas que oculta toda a base
de funcionamento desse organismo.Decifrando esse código e
relacionando-o às características físicas da criatura viva, bem como
às funções que ela desempenha, será possível compreender a fundo
sua natureza e, quem sabe?, tentar um dia produzir do zero algo
parecido.

Ou seja, ainda falta muito para que os cientistas entendam os componentes celulares, mas já ficou bem claro que não basta obter uma lista completa das “peças” que compõem uma célula — isso não é suficiente para entender como ela funciona, da mesma forma que não adianta espalhar todos os componentes desmontados de um computador em uma bancada e, daí, compreender como eles se interligam e funcionam para dar boot e começar a funcionar.

Mesmo para subestruturas celulares já bem manjadas, ainda há dificuldades significativas para entender como seus componentes interagem formando sistemas que produzem os comportamentos que observamos experimentalmente.

Para complicar ainda mais as coisas, existem muito mais componentes a estudar do que biólogos para estudá-los num tempo aceitável. A mesma dificuldade ocorre a cada nível de organização biológica acima do patamar meramente celular. Em outras palavras, quando as células se agrupam formando estruturas mais complexas, a interação entre esses conjuntos funcionais também é de alta complexidade. Em suma, é o cão chupando manga.

É nesse ponto que entra em cena a ciência denominada “biologia de sistemas”. Seu primeiro objetivo é obter grandes quantidades de informação sobre sistemas biológicos completos, por meio de experimentos que produzem dados ainda pouco profundos e, infelizmente, cheios de ruídos. O projeto Genoma Humano é um exemplo típico — o conhecimento acumulado é altamente valioso e foi obtido de um modo automatizado e relativamente eficiente. Mas é apenas o começo do entendimento do genoma do ser humano.

Existem esforços semelhantes sendo conduzidos na área da ciência denominada “genômica”, que objetiva encontrar as coleções de todos os genes, para vários genomas. Outros ramos da ciência estão avançando em paralelo tais como: “transcriptômica”, que coleta todos os genes ativamente transcritos; “proteômica”, que acumula conhecimentos sobre toda a coleção de proteinas conhecidas; e “metabolômica”, que agrupa conhecimentos sobre todos os metabolitos (termo que se aplica a todos os produtos e itens intermediários de um metabolismo, no âmbito das moléculas pequenas).

Nesse contexto, a bioinformática é uma disciplina que está constantemente crescendo, concentrando-se na coleta e análise de todos os elementos obtidos por essa coleção de “ômicas”. Outra meta da bioinformática é construir, com base nesses dados coletados, uma ciência que explique os princípios de operação dos sistemas biológicos, baseada nas interações entre componentes. Como todos nós já percebemos, sistemas biológicos são fruto de um óbvio esforço de alta engenharia — são altamente complexos, bem estruturados e robustos. E mais ainda, são construídos de modo que possam se reproduzir e se replicar eternamente (sexuada ou assexuadamente), caso disponham de “combustível” adequado (alimento) e de condições e ambiente adequados de funcionamento.

O único probleminha dos sistemas biológicos é que eles não foram projetados, no sentido comum do termo. Se foram criação divina ou decorrentes da evolução natural, tanto faz — isso é papo para botequim e tem tudo para descambar para uma discussão religiosa, o que não nos interessa aqui numa coluna do Fórum PCs. Mas certamente os sistemas biológicos não estão aí para serem facilmente compreendidos. E também não está claro se são inteiramente aplicáveis a eles os princípios operacionais a que estamos acostumados.

Somente com um esforço interdisciplinar conseguiremos compreender tais princípios, lançando mão de ideias da física, da matemática e da computação. A biologia de sistemas nos ensinará novos princípios de operação, talvez aplicáveis a outras ciências, trazendo esses ramos científicos a nos ensinar como as células orgânicas funcionam.


Superfície de uma membrana vista ao microscópio eletrônico.

Por sorte dos cientistas com base computacional, muitos aspectos da organização biológica de sistemas vivos têm mais a ver com hardwares discretos funcionando com sistemas de software do que com sistemas contínuos, tanto sob o aspecto de sua complexidade hierárquica, quanto pelo seu comportamento parecido com o de algoritmos alimentados por informações. Em tempo, para quem não se tocou, grandezas contínuas são as que variam suavemente e grandezas discretas são as que variam “aos pulinhos”, como acontece com os sistemas digitais, que pulam entre “zeros” e “uns”.

Essas características dos sistemas biológicos têm que refletir nas abordagens dos modelos criados pelos cientistas e nas notações usadas para descrever tais sistemas, de modo a fazer sentido na hora de armazenar, classificar e analisar os dados experimentais que rapidamente se acumulam.

— Acreditamos que é essencial encarar a organização de sistemas biológicos de um ponto de vista informático — declara o Dr. Cardelli. — Células são, em vários aspectos, dispositivos de processamento de informações. Sem processar adequadamente informações obtidas de seu ambiente, elas logo morreriam por falta de nutrientes e por ação de predadores. Podemos dizer que células são dispositivos químicos que também desempenham algumas funções computacionais.

O “desenho esquemático” ou a “planta baixa” de uma célula, necessária ao seu funcionamento e à sua reprodução, são armazenados como informação digital no genoma, em que um passo essencial de sua reprodução é a cópia fiel dessa informação digital. Aliás, existem indícios de que o nível de processamento de informações no genoma de organismos mais evoluídos é ainda mais sofisticado do que hoje se acredita em geral.

Mas pode haver uma postura ainda mais extrema, que considera a célula como um sistema químico a serviço do processamento de informações. Assim, o objeto de estudo passaria a ser o “maquinário” de processamento de dados dentro dos mecanismos celulares. E mais ainda — deveríamos tentar entender o funcionamento da célula em termos de processamento de informações, em vez de adotarmos uma abordagem puramente química.

Na verdade, podemos prontamente encontrar esse “maquinário” de processamento de informações nas ferramentas químicas acima mencionadas. Isso nos permite fazer uma transição suave entre a descrição clássica da célula que funciona como um agrupamento de classes de macromoléculas, para uma descrição baseada em máquinas abstratas de processamento de infomações.

Mas… e essa coisa de máquinas abstratas? Afinal, do que se trata?

Uma máquina abstrata é um dispositivo fictício de processamento de informações que, a princípio, poderia ser implementada por meio de diferentes manifestações físicas usando diferentes tecnologias, por exemplo, mecânica, eletrônica, biológica ou até mesmo por software.


Este modelo de uma onda química foi produzido por computador
combinando sete equações diferenciais usando os princípios do caos
matemático. Ondas químicas são o resultado de processos dinâmicos
em certos reagentes. Este modelo mostra uma similaridade notável
com estruturas já observadas de ondas químicas. Tais modelos podem
ser usados para compreender processos biológicos, tais como os
impulsos nervosos.

Em termos de seu funcionamento, tal máquina seria caracterizada por uma coleção de estados discretos (lembrando da supracitada diferença entre grandezas contínuas e grandezas discretas) e por uma coleção de operações ou eventos que causam transições discretas entre estados. Nesse esquema, a evolução de estados por meio de transições pode em geral acontecer concorrentemente, ou seja, são eventos que podem ocorrer em paralelo, o que já nos dá uma dica de processamento concomitante.

Cada uma das quatro ferramentas bioquímicas básicas pode ser vista separadamente como uma máquina abstrata com um conjunto apropriado de estados e de modos de operação. Mas vale advertir que essa interpretação abstrata da química é algo ficcional e é necessário estarmos conscientes de suas limitações. Trocando em miúdos — ainda é meio que “viajou na maionese”. Mas o que foram as grandes descobertas, em seu início, senão grandes viagens na maionese?

Porém, é preciso também estarmos conscientes das limitações de simplesmente não abstrair, pois assim estaremos em geral limitados a trabalhar nos níveis mais baixos da realidade, quase no patamar da mecânica quântica, sem qualquer esperança de compreender os princípios mais altos do conceito de organização.

As máquinas abstratas que esta abordagem considera são três e estão baseadas em três das quatro ferramentas e, por isso, têm lastro na realidade. Além disso, cada uma das ferramentas corresponde a um tipo de notação informal de algoritmo desenvolvido por biólogos, o que constitui prova de que princípios abstratos de organização estão funcionando.

► Máquina de membrana — Mais conhecida como “redes de transporte”, separa diferentes ambientes bioquímicos e também opera dinamicamente para transportar substâncias por meio de processos complexos, discretos e de múltiplas etapas.


Este é o esquema de interligação algorítmica entre as três máquinas
biológicas abstratas descritas pelo Dr. Cardelli.

Essas três máquinas operam de maneira coordenada mas são altamente independentes. Os genes instruem a produção de proteínas e membranas, e dirigem a inserção de proteínas nas próprias membranas. Algumas proteínas atuam como mensageiros entre genes e outras atuam como registros de fluxo e sinalizadores, quando estão dentro da membrana.

Por sua vez, membranas confinam material celular e têm proteínas em sua superfície. Em alguns tipos de célula, membranas confinam o genoma, de tal modo que as condições locais possam ser reguladas. Elas também confinam outras reações desencadeadas por proteínas em vesículas especializadas.

O pulo do gato de toda essa abordagem, no sentido de compreender o funcionamento da célula, é entender como essas três máquinas interagem. É uma tarefa medonha que envolve consideráveis dificuldades, especialmente na simulação de causas e efeitos.

A razão das dificuldades é a drástica diferença nas escalas de tempo e tamanho. Proteínas interagem em frações de segundo, enquanto interações genéticas levam minutos. Proteínas são moléculas grandes, mas cromossomas (que contêm os genes) são ainda maiores, e membranas ainda muito maiores.


Estas são as operações básicas da máquina de membranas, apresentadas
em duas dimensões. Muito embora seja um modelo computacional pouco
usual, a máquina de membrana suporta a execução de algoritmos reais.

Aos olhos do cientista computacional, essa visão da biologia celular é absolutamente notável. Ela nos leva a concluir que a vida é em grande parte baseada em codificação digital de informações, como prova o DNA. E melhor ainda, essa abordagem comprova que, pelo menos três das quatro ferramentas bioquímicas acima descritas são computacionalmente completas, pois cada uma delas suporta computação geral e estão de algum modo envolvidas em processamento de informações. A implicação disso é que muitos processos celulares podem ser considerados como algoritmos, operando dentro de algum modelo computacional.

— O grande desafio é que muitos desses algoritmos e modelos ainda estão para ser descobertos — diz o Dr. Cardelli.

AS QUATRO FERRAMENTAS (para quem gosta de biologia)

Deixando de fora algumas moléculas pequenas como a água e alguns metabolitos, existem quatro classes de macromoléculas em uma célula. Cada classe é formada por um pequeno número de unidades que podem ser sistematicamente combinadas para produzir estruturas bastante complexas — moléculas individuais de tamanho indefinidamente grande e complicadas estruturas compostas de várias moléculas. As quatro classes são:

Lipídios(a gordura é um lipídio) são biomoléculas insolúveis em água. Entre eles, os fosfolipídios (fosfato + lipídio) têm uma estrutura modular e podem se automontar em camadas duplas e fechadas, formando membranas. As membranas se diferenciam na proporção e na orientação dos diferentes fosfolipídios que as compõem e nos tipos de proteínas que estão ligadas a essas membranas. Como estruturas de dados, membranas são repositórios de dados, mas com uma superfície ativa, que age como uma interface para seu conteúdo.

Carboidratosou açúcares são substâncias sintetizadas pelo seres vivos. Entre eles, os oligossacarídeos são açúcares interligados em uma estrutura ramificada. Como estruturas de dados, oligossacarídeos são árvores , possuindo um vasto número de configurações e complexos processos de montagem. Polissacarídeos formam estruturas ainda maiores, muito embora de tipos semirregulares. Eles têm a ver com armazenamento de energia e com estruturas extracelulares e da superfície celular, e também têm um papel computacional, formando estruturas únicas que podem ser reconhecidas. De quebra, muitas proteínas se associam a carboidratos.

Cada uma dessas quatro ferramentas tem propriedades estruturais específicas, funções sistemáticas e modos de operação ricos e flexíveis, tudo isso além de seus significados químicos.


Este é o modelo de um processo que se dá com uma proteína, que ilustra
como ferramentas para codificar sistemas computacionais pode ser
usada para codificar sistemas biológicos. Cada gráfico conectado na
figura descreve o comportamento de uma proteína na cascata de
processos, em que cada nodo representa um estado da proteína e
cada arco representa uma interação potencial com outra proteína.
Essa organização matemática pode ajudar a compreender as
propriedades fundamentais de sistemas biológicos.

QUER VOAR MAIS ALTO?

Quem quiser se aprofundar mais neste tema, vale a pena ler o artigo do Dr. Cardelli, intitulado “Abstract Machines of Systems Biology”. Mas aviso logo — é altamente cabeluda a parte técnica e, pelo menos para mim, é muita areia para o meu caminhãozinho.

E, para quem tiver curiosidade, a Microsoft Research publicou um apanhado científico muito interessante chamado “Science 2020“, em que um grupo de cientistas ingleses traçou o rumo dos desenvolvimentos científicos nos próximos dez anos. Foi neste documento que conheci a fascinante abordagem do Dr. Cardelli. E, confesso, ainda tenho que ler os outros capítulos que, pelo que pude ver, são igualmente formidáveis.