Análise de voz já é excelente ferramenta para o diagnóstico de doenças
Recursos de inteligência artificial identificam sinais na fala dos pacientes — entre eles, há estudos até para o diagnóstico da Covid-19
Um paciente tem de ser ouvido por seu médico. A máxima do grego Hipócrates, o pai da medicina, proferida lá atrás, no século V a.C., ganhou uma dimensão extraordinária no atual universo científico. Para muito além de relatos de queixas e angústias no silêncio do consultório, a voz, com suas inúmeras nuances de tons, timbres e potências, vem sendo usada como valiosa ferramenta para rastrear uma série de problemas de saúde, inclusive os de alta complexidade.
Investiga-se a existência ou não de transtornos, como depressão, Alzheimer e autismo, por meio de diagnóstico vocal — é uma das áreas de estudo mais interessantes hoje. Os pesquisadores pedem tanto a pessoas saudáveis quanto a infectadas para soltarem a voz (muitas vezes gravando-a), de modo a ser analisada. Os voluntários dizem palavras inteiras, em sílabas ou tossindo. Em seguida, os sons são armazenados e processados por um sistema de inteligência artificial que busca identificar uma espécie de “impressão digital” de voz para determinada doença. Já há até uma frente de acompanhamento da Covid-19. Diz o engenheiro da computação André Barretto, fundador e CEO da Unike Technologies, uma das empresas brasileiras que estudam o monitoramento da pandemia do novo coronavírus pela voz: “A tecnologia hoje disponível permite otimismo no uso da identificação de voz na saúde em breve”.
Os trabalhos têm como objetivo tornar possível, em um futuro próximo, que as pessoas infectadas pelo vírus possam receber um diagnóstico preliminar por meio dos alto-falantes inteligentes embutidos em produtos como smartphones e aparelhos de uso pessoal — Amazon Alexa, Google Nest e a Siri, da Apple, por exemplo. O sistema funciona detectando diferenças sutis na maneira como as pessoas com certas condições de saúde se expressam vocalmente. Falar requer a coordenação de uma grande quantidade de estruturas e mecanismos anatômicos. Os pulmões enviam ar pelas cordas vocais, que produzem sons formados pela língua, pelos lábios e pelas cavidades nasais. O cérebro, junto com outras partes do sistema nervoso, ajuda a regular essa sinfonia e a determinar as palavras pronunciadas. Por isso, qualquer moléstia que afete uma das engrenagens complexas deixa nítidas pistas diagnósticas.
No caso do autismo, um algoritmo conseguiu identificar com 80% de precisão as crianças afetadas a partir da análise do balbucio de bebês com apenas 10 meses. Os primeiros trabalhos na área foram deflagrados com o Parkinson, enfermidade já associada a mudanças naturais com a fala. Em 2012, pesquisadores da Universidade de Birmingham, no Reino Unido, desenvolveram um método de identificação da doença usando algoritmos de processamento da voz para analisar 132 gravações de 43 adultos dizendo apenas a sílaba “ahhh”. Destes, 33 tinham Parkinson. O sistema registrou algumas características, como as oscilações trêmulas, preditivas da doença. Utilizando apenas esses mecanismos, foi possível identificar o Parkinson com quase 99% de certeza.
Embora a ciência já conhecesse a teoria desses princípios pelo menos uma década atrás, havia grande dificuldade de identificar os padrões. O divisor de águas foi a evolução da capacidade dos computadores de “aprender” (o machine learning, em inglês) — ramo da inteligência artificial baseado na ideia de que os softwares podem evoluir com dados e tomar decisões com o mínimo de intervenção humana. Há, contudo, barreiras a ser vencidas até que realmente se possa usar o recurso domesticamente, assim como se põe um termômetro, porque muitos registros feitos em aparelhos domésticos tendem a ser frágeis e imprecisos. Mas não resta mais dúvida: o que Hipócrates intuiu é cada vez mais decisivo — que os pacientes sejam realmente ouvidos, com zelo e atenção.
Publicado em VEJA de 11 de novembro de 2020, edição nº 2712