Avanços da técnica de sequenciamento permitiram esclarecer a causa genética da condição descrita 30 anos atrás
O quê?
As ataxias espinocerebelares são um grupo de condições genéticas caracterizadas por incoordenação motora progressiva. Uma parte proeminente desse grupo tem herança autossômica dominante e recebem a denominação de “SCAs” (do inglês spinocerebelar ataxia). Atualmente há cerca de 50 SCAs conhecidas, sendo a mais frequente delas a SCA3 (ou Doença de Machado Joseph). Entretanto, apesar de ser conhecida desde 1994 uma forma de SCA ligada ao cromossomo 16, denominada SCA4, a causa dessa condição até recentemente permanecia um mistério.
Por que?
Uma parte considerável das SCAs é causada por um mecanismo comum: uma expansão de sequências repetitivas de nucleotídeos. Por exemplo, no gene ATXN3, a maior parte das pessoas apresenta até 44 repetições CAG. Pessoas com SCA3 apresentam de 52 a 86 repetições CAG no gene. Essas repetições entretanto são difíceis de serem identificadas com acurácia por métodos convencionais de sequenciamento paralelo (isto é, paineis genéticos, exoma ou genoma), o que dificulta tanto o diagnóstico dos pacientes afetados como a identificação de novas condições causadas por esse mecanismo. Apesar disso, quando a causa é conhecida, métodos desenhados especificamente para a detecção e quantificação de sequências repetitivas podem ser empregados.
Como?
Utilizando uma nova técnica de sequenciamento maciço, o sequenciamento de leituras longas (long-read sequencing – LRS), dois grupos independentes de pesquisadores procuraram em famílias com SCA4 uma variante comum que pudesse não ter sido identificada com as técnicas mais antigas. Para isso, os autores empregaram as tecnologias do Pacific Biosciences (PacBio) HiFi e Oxford Nanopore Technologies (ONT) e uma análise de bioinformática robusta. O LRS se destaca por sua capacidade de identificar variantes normalmente perdidas nas técnicas convencionais, incluindo não só as expansões, mas também, variantes estruturais e variantes de ponto localizadas em sequências repetitivas.
E aí?
Foi identificada uma expansão de trinucleotídeos GGC no exon 10 do gene ZFHX em todos os indivíduos com SCA4. O tamanho da expansão variou entre 42 e 74 repetições, contrastando com o tamanho normal da repetição (21). Por envolver um grande conteúdo de guanina-citosina, as variantes eram especialmente difíceis de serem identificadas pela técnica anterior. Com esse feito, a SCA4, décadas depois de sua descrição, tem sua causa elucidada e passa a integrar um grupo de doenças chamadas de poliglicinopatias, nome que corresponde ao grande número de aminoácidos glicina codificados pelas repetições GGC. O mecanismo provável da doença envolve a alteração do mecanismo de autofagia celular. Os autores também identificaram que todos os indivíduos atualmente conhecidos têm um provável ancestral comum proveniente do sul da Suécia.
E agora?
Apesar do grande número de SCAs conhecidas, há ainda famílias no Brasil e no mundo em que a causa da ataxia permanece não elucidada. A descoberta da causa da SCA4 deverá beneficiar uma parte dessas famílias. Além disso, esse feito também ilustra o impacto que o LRS tem tido na descoberta de novas doenças e na melhora do diagnóstico genético. O LRS já vem sendo empregado em laboratórios de pesquisa e tem sido incorporado aos poucos também em laboratórios comerciais no Brasil. Espera-se que a tecnologia permita que mais famílias tenham um diagnóstico estabelecido e se beneficiem de um melhor aconselhamento genético.