Connection Information

To perform the requested action, WordPress needs to access your web server. Please enter your FTP credentials to proceed. If you do not your credentials, you should your web host.

Connection Type

Connection Information

To perform the requested action, WordPress needs to access your web server. Please enter your FTP credentials to proceed. If you do not your credentials, you should your web host.

Connection Type

▷ Microsoft avança no armazenamento rápido de dados de DNA

Microsoft avança no armazenamento rápido de dados de DNA

Nota: O seguinte artigo irá ajudá-lo com: Microsoft avança no armazenamento rápido de dados de DNA

Nem todos os nove zettabytes de armazenamento de dados que a IDC prevê que serão necessários até 2024 conterão informações que precisam ser armazenadas por longos períodos de tempo; As leituras do sensor de IoT e a telemetria de desempenho do aplicativo podem não ser úteis o suficiente para durar décadas. Mas nos negócios e na ciência, existem grandes conjuntos de dados que precisam ser arquivados, sejam fluxos de informações do Large Hadron Collider ou dados de pensão (que, de acordo com a lei do Reino Unido, devem ser mantidos por toda a vida de todos no regime de pensão ).

VEJO: Folha de dicas do Metaverse: tudo o que você precisa saber (PDF grátis) (TechRepublic)

Em 2020, o GitHub depositou 21 TB de dados no Arctic Code Vault ao lado de manuscritos digitalizados da Biblioteca Apostólica do Vaticano, usando o sistema de preservação digital PIQL que imprime códigos QR de dados compactados em tiras de filme que ainda serão legíveis em centenas de anos . Isso é muito maior do que a vida útil dos arquivos de fita, que precisam ser reescritos a cada 30 anos, mas se você realmente deseja armazenamento de longo prazo, que tal a molécula que já armazena informações há milhares de anos – DNA – e pode caber mais de um exabyte de dados em uma única polegada cúbica? Em vez de salas cheias de cartuchos de fita, esses nove zettabytes (mais o equipamento para lê-los e gravá-los) caberiam em um rack de data center.

Já temos equipamentos para sintetizar, copiar e ler DNA para sequenciamento genético e pesquisa científica (e não vamos deixar de precisar fazer isso, então a tecnologia de leitura de DNA não ficará obsoleta em algumas centenas de anos). “O uso do DNA nos permite tirar proveito de um ecossistema que já existe e existirá por muito tempo”, disse Karin Strauss, gerente sênior de pesquisa da Microsoft.

Usar o DNA para armazenar dados precisa de algumas etapas extras, começando com o software de codificação que transforma os usuais e os zeros de um arquivo digital nas quatro bases (A, C, T e G) encontradas no DNA e um sintetizador de DNA que cria Cadeias de DNA com a sequência correta de bases.

Quando você estiver pronto para ler as informações, um sequenciador de DNA transcreve a sequência de bases nessa cadeia de DNA e o software de decodificação a transforma de volta em bytes.

Para poder gravar dados no DNA com rapidez suficiente para ser útil, a tecnologia de armazenamento de DNA precisa lidar com pelo menos kilobytes de dados por segundo e, idealmente, megabytes, o que significa que você precisa ser capaz de gravar mais de uma cadeia de DNA por vez . Tal como acontece com as Us, a chave para a velocidade – e reduzir o custo – é o paralelismo que reúne mais funcionalidades no mesmo espaço.

“Podemos pensar nas quatro bases de DNA como esses pequenos blocos de construção que você pode adicionar quimicamente”, disse Bichlien Nguyen, pesquisador sênior da Microsoft. “Na síntese de DNA, há uma superfície que é uma série de pontos e esses pontos são onde você adiciona seus A, C, T e G em ordens específicas para fazê-los criar esse polímero de DNA”.

Trazendo a Lei de Moore para o armazenamento de DNA

Quantos pontos de síntese de DNA você pode empacotar sem que eles interfiram uns nos outros dita quantas cadeias de DNA você pode construir ao mesmo tempo (e você precisa fazer várias cópias de cada cadeia para redundância). Para colocar uma nova base na cadeia de DNA, você primeiro adiciona a base e depois usa o ácido para preparar a cadeia para a próxima base, e você não quer que a base ou o ácido entrem no lugar errado.

Abordagens anteriores usaram pequenos espelhos ou padrões de luz (chamados de fotomáscaras) em vez de ácido ou pulverizaram pequenas gotas de ácido como tinta de uma impressora a jato de tinta. Tirando outra lição das Us, a Microsoft Research (trabalhando com a Universidade de Washington) está usando uma série de eletrodos em minúsculos poços de vidro, cada um cercado por cátodos, para criar os pontos em que o DNA cresce e agrupá-los mil vezes mais juntos.

“O que é realmente importante é a distância – ou o tom – entre esses pontos e também o tamanho desses pontos”, disse Nguyen. “Realmente reduzimos o tamanho dos pontos, ando de cerca de 20 mícrons para 650 nanômetros. E também reduzimos o tom entre eles para dois mícrons. E isso nos permite incluir tantos pontos diferentes nos quais podemos cultivar fitas de DNA diferentes e únicas.”

A aplicação de uma voltagem gera ácido no ânodo para preparar a cadeia de DNA para anexar a próxima base e também libera a base certa para adicionar à cadeia no cátodo. Se algum ácido derramar de um poço de vidro, ele fluirá para a base gerada pelo cátodo e não poderá atingir um poço diferente.

VEJO: Política de Ética em Inteligência Artificial (TechRepublic )

Isso é essencialmente um controlador molecular e um gravador de DNA em um chip, completo com uma interface PCIe. A Microsoft está funcionando, embora atualmente seja uma prova de conceito e a tenha usado para construir quatro fitas de DNA sintético de uma só vez, armazenando uma versão da declaração de missão da empresa: “Capacitar cada pessoa a armazenar mais!”

Como prova de conceito, em vez de hardware acabado, o minúsculo mecanismo de escrita de DNA está agora produzindo filamentos com 100 bases de comprimento. Fios mais longos mostraram mais erros, mas isso pode ser melhorado à medida que o hardware se desenvolve, talvez tornando a maneira como os fluidos reagentes são entregues mais sofisticados.

O armazenamento de dados de DNA não precisa ser totalmente livre de erros, assim como os sistemas de armazenamento atuais. Existem vários níveis de redundância embutidos, começando com o crescimento de várias cópias do DNA, que Strauss chama de redundância física: “Estamos fazendo muitas moléculas que codificam a mesma informação”. Há também a correção de erros incorporada, usando redundância lógica, que, segundo ela, incorre aproximadamente na mesma sobrecarga que a memória de correção de erros: “Por exemplo, se todas as cópias do DNA que estão sendo feitas no mesmo local têm um erro, então você pode corrigi-lo.”

“Este trabalho consiste em diminuir a mancha, e quanto menor a mancha, menos cópias você tem. No entanto, ainda estamos no tamanho em que temos muitas, muitas cópias do DNA e, portanto, isso não é uma preocupação. No futuro, você pode acabar com apenas algumas cópias do DNA, mas achamos que ainda há bastante espaço para reduzir o tamanho dessa parte e ainda manter a redundância mínima.”

Com o hardware de prova de conceito, a velocidade de gravação é equivalente a 2 KB/segundo. “Poderíamos aumentar isso criando mais dessas matrizes ou diminuir ainda mais o tom e o tamanho”, disse Nguyen.

No futuro, a Microsoft planeja adicionar lógica para controlar milhões de pontos de eletrodos, usando o mesmo nó de processo de 130 nm usado para construir este sistema. Isso é o que os fabricantes de chips estavam usando há 20 anos e a mudança para processos menores e mais modernos significará que os arrays podem escalar até bilhões de eletrodos e megabytes por segundo de armazenamento de dados; mais próximo do armazenamento em fita em desempenho e custo.

“Quanto mais pedaços do mesmo tamanho pudermos fazer, maior será a taxa de transferência de gravação”, acrescentou Strauss. “Para fazer isso, ou você faz spots menores e coloca mais deles na mesma área, ou você aumenta a área, e a área é proporcional ao custo. Então, quanto mais você embalar, menor será o custo. Você está essencialmente amortizando todo o custo pelo maior número de peças de DNA.”

A taxa de transferência é mais importante do que a velocidade de gravação

Até agora, a Microsoft vem otimizando a largura de banda de gravação de dados de DNA, que ela disse ser a medida mais importante, mas também há planos para melhorar a latência para leitura.

“Pensamos no armazenamento de DNA como algo que será bom para armazenamento de arquivos e na nuvem, pelo menos inicialmente. Para gravações, a latência não é tão importante porque você pode armazenar em buffer as informações em um sistema eletrônico e depois gravar em lotes, como fazemos aqui, e não importa quanto tempo leve para gravar, desde que a taxa de transferência possa acompanhar com a quantidade de informações que você está armazenando.”

Quando você está lendo o DNA, a latência afetará quanto tempo você terá que esperar para obter as informações, e as técnicas atuais de sequenciamento de DNA também são baseadas na leitura do DNA em lotes. “Isso tem alta latência, mas estamos vendo o desenvolvimento de leitores nanoporos que são em tempo real”, disse Strauss, o que acelerará o processo.

A Microsoft também planeja trabalhar na química dos solventes e reagentes usados ​​com o DNA, que agora são baseados em fósseis. Mudar para enzimas (que é a forma como o DNA é construído e lido em animais e plantas) será mais ambientalmente sustentável e também acelerará as reações químicas que realmente constroem a cadeia de DNA. “As reações enzimáticas ocorrem em escalas de tempo muito mais rápidas do que o que poderia ser alcançado agora com processos químicos”, disse Nguyen.

Ser capaz de usar eletrônicos para controlar moléculas como essa é uma tecnologia empolgante que também pode ser útil em muitas outras áreas além do armazenamento – tudo, desde a triagem de novos tratamentos com medicamentos e a descoberta de biomarcadores de doenças até a detecção de poluentes ambientais – e ter múltiplos usos provavelmente traria o custo para baixo através de economias de escala.

Existem mais de 40 empresas na DNA Data Storage Alliance, incluindo fabricantes de drives conhecidos como Seagate e Western Digital e especialistas em fitas como Quantum e Spectra Logic ao lado de organizações de biociência. Os sistemas de produção para armazenamento de DNA ainda estão longe, advertiu Strauss. “Há um pouco de engenharia que ainda precisa entrar em um sistema comercial, para obter taxas de erro mais baixas, para tornar o sistema mais automático e integrado e assim por diante.”

Mas a pesquisa que a Microsoft está publicando aqui mostra que os arquivos comerciais de dados de DNA em larga escala parecem bastante viáveis.