Com mais de 1 bilhão de registros armazenados com total privacidade e segurança das informações, o “Repositório de dados seguros Prof. Sebastião Loureiro” tornou-se um importante instrumento para a elaboração de estudos desenvolvidos por pesquisadores do Instituto de Saúde Coletiva da UFBA.

Criado em 2019, o repositório é resultado do esforço conjunto das equipes do Programa Integrado de Pesquisa e Cooperação Técnica em Economia, Tecnologia e Inovação em Saúde (PECS) e do Programa Integrado em Epidemiologia e Avaliação de Impactos na Saúde das Populações, em parceria com a direção do ISC/UFBA. “Decidimos elaborar um projeto e montar uma estrutura de repositório seguro para dar garantia de segurança às instituições parceiras e gestores da guarda dos bancos de dados”, explica o professor Márcio Natividade, coordenador e curador do repositório.

O acervo também se antecipou às exigências trazidas pela Lei Geral de Proteção de Dados Pessoais, que sofreu alterações em julho de 2019. “Nos dias atuais, com a lei 13.709, não é possível conseguir nenhuma base de dados dos gestores e instituições parceiras sem a garantir a privacidade e armazenamento de banco de dados em um local seguro”, observa.

Para a professa Isabela Cardoso, diretora do ISC, o repositório representa uma importante conquista para o desenvolvimento das pesquisas no Instituto. “A qualidade e o rigor metodológico no tratamento dos dados e a possibilidade de trabalhar com bigdata concretizam-se e abrem um conjunto de possibilidades para o nosso Instituto de Saúde Coletiva”, comemora.

A diretora também destaca a segurança oferecida pelo repositório aos órgãos governamentais e os esforços para ampliação do sistema. “Todo o investimento será feito para possibilitar a todos os pesquisadores o desenvolvimento de projetos com grandes bancos de dados”, completa.

Tratamento das Informações

A sala destinada ao repositório tem acesso restrito ao curador e a três cientistas de dados que trabalham no tratamento das informações. Por enquanto, apenas os pesquisadores que contribuíram com a estrutura do repositório têm os dados armazenados no sistema. “Esses dados são desidentificados e depois fornecidos de forma remota em um servidor de análise para os pesquisadores”, explica Márcio Natividade.

O repositório armazena hoje diversos bancos de dados, que apresentam informações de períodos distintos. Entre os principais sistemas, estão: Aqui Tem Farmácia Popular, Sistema Nacional da Assistência Farmacêutica (Hórus), Sistema de Informações sobre Mortalidade (SIM), Cadastro Único, Sistema de Informações hospitalares (SIH), Sistema de Informações de Nascidos Vivos (SINASC), Sistema de Controle Logístico de Medicamentos (SICLOM), Sistema de Controle de Exames Laboratoriais de CD4+/CD8+ e Carga Viral do HIV (SISCEL), entre outros.

Para garantir a privacidade e segurança dos dados, os técnicos responsáveis pelo tratamento das informações adotam diversos protocolos. “No recebimento dos dados, por exemplo, é realizada a criptografia, que é o processo de codificação por meio de algoritmos, de modo que só possam ser lidos através do uso de uma senha”, explica o cientista de dados Juracy Bertoldo.

Na segunda etapa, os dados são tratados em um ambiente sem internet, com acesso controlado por biometria e sob monitoramento de câmeras. Nesse ambiente, os dados passam por um processo chamado ETL (extract, transform, load), que engloba a limpeza dos dados, transformação e vinculação com outras bases de dados. “Após a vinculação, os dados passam por um processo de anonimização, em que são removidos campos identificadores como, por exemplo, o nome e outras informações sensíveis, para então serem disponibilizados aos pesquisadores”, destaca Juracy Bertoldo.

Além desse tratamento, outras análises pontuais podem ser necessárias para atender às demandas de cada projeto. “Também podem ser realizadas reuniões com a equipe do projeto para discutir de que forma aquele banco vai ser utilizado para responder às questões de pesquisa e quais informações serão utilizadas”, completa.

Segundo o professor Márcio Natividade, uma das metas do repositório é dar subsídio de engenharia e segurança de dados aos projetos armazenados no servidor. A curadoria também pretende institucionalizar a estrutura a partir da captação de novos recursos financeiros para expandir a tecnologia e manter os bolsistas. “Uma outra meta a longo prazo é que esse repositório se torne uma estrutura de Sala Segura e que possa armazenar os dados da grande maioria dos projetos da instituição”.

Fontes de pesquisa

Entre os primeiros estudos a utilizarem os dados armazenados pelo repositório, estão os projetos “Avaliação do Impacto do Programa Aqui Tem Farmácia Popular” e “Avaliação do PPSUS”, liderados por pesquisadores do PECS/ISC-UFBA. “As principais bases selecionadas foram o SIM, SIH e Assistência Farmacêutica. Inclusive, foi uma demanda dos próprios gestores dessas bases a existência de um sistema de proteção dos dados”, destaca a professora Érika Aragão, coordenadora dos estudos.

Para ela, o repositório passou a ser essencial para a execução das pesquisas que exigem maior grau de segurança na guarda das informações. “O repositório permitirá ao conjunto de pesquisadores do ISC que usam dados sigilosos continuarem a ter acesso a tais dados para a realização de seus projetos de pesquisa”, avalia.

O repositório também foi fundamental para o desenvolvimento do projeto “Condições de vida de comunidades tradicionais afro-brasileiras: uma análise geoespacial e socioeconômica”, cujo objetivo é caracterizar os perfis sociodemográficos e a distribuição no território brasileiro das famílias pertencentes a comunidades quilombolas e de terreiro.

“Nós utilizamos as bases de dados de indivíduos e famílias registradas no Cadastro Único para Programas Sociais do período de 2018 a junho/2020, com aproximadamente 76 milhões de observações”, explica a professora Joilda Nery, coordenadora do estudo. Diversas variáveis foram coletadas, a exemplo da região de residência no país, zona (urbana ou rural), idade, sexo, raça/cor, escolaridade, situação empregatícia, renda mensal familiar per capita e recebimento do benefício do Programa Bolsa Família, entre outras.

Os dados foram cedidos pelo Ministério da Cidadania com a garantia do sigilo e confidencialidade de dados sensíveis como endereço residencial e CPF dos indivíduos. “Com o apoio da equipe do repositório, foi possível acessar os dados via servidor e desenvolver as análises em regime de home-office durante o ano de 2020”, destaca a professora.

Para ela, o repositório tornou-se crucial nas negociações com as agências de fomento e instituições governamentais sobre a viabilidade para o desenvolvimento dos projetos. “É importante que o repositório seja valorizado como uma conquista da comunidade ISC e da UFBA e que progressivamente seja aprimorado com os recursos humanos e computacionais necessários para garantir o pleno funcionamento dos seus processos”, completa.

Homenagem a Sebastião Loureiro

Nome do repositório é uma homenagem ao professor Sebastião Loureiro (ISC/UFBA)

Da máquina de datilografia ao primeiro computador usado pelo Instituto de Saúde Coletiva da UFBA, o professor Sebastião Loureiro vivenciou importantes transformações do mundo acadêmico ao longo de seis décadas dedicadas à saúde, à pesquisa e ao ensino. Formado em Medicina pela UFBA (1964), acompanhou desde o antigo sistema de cátedras, que se estendeu até a década de 70, à formação dos primeiros departamentos da universidade.

Foi também um dos responsáveis pela fundação do ISC no ano de 1994. O objetivo da unidade, criada a partir do Departamento de Medicina Preventiva da UFBA, era buscar novos paradigmas para além dos princípios e práticas da Saúde Pública, Medicina Preventiva e Saúde Comunitária. “Adotamos a Saúde Coletiva por representar um referencial mas amplo e plural com visões da Epidemiologia, Política, Economia e da Sociologia”, destaca Sebastião Loureiro.

O olhar mais ampliado sobre a saúde passou a exigir informações cada vez mais atualizadas, mas a acessibilidade dos dados ainda era um obstáculo a ser vencido pelos pesquisadores da época. “Muitos materiais disponíveis eram datilografados ou mimeografados e raramente acessados em outros programas acadêmicos”, lembra.

Segundo o professor, que é mestre em Saúde Pública Tropical pela Universidade de Londres (1968) e doutor em Epidemiologia pela Universidade do Texas (1978), a experiência fora do país foi fundamental para a compreensão do novo cenário que se abria para o campo da pesquisa. “O acesso a novas tecnologias de informação e tratamento dos dados já eram conhecidos em universidades estrangeiras onde muitos dos jovens professores fizeram cursos de pós-graduação”.

Apesar do avanço das tecnologias e uma crescente facilidade de acesso às fontes de pesquisa nos anos seguintes, os professores e estudantes esbarravam em outro problema: a segurança da informação. “Em função de estimular o uso da computação eletrônica para análise de dados epidemiológicos, fiquei mais familiarizado com essas ferramentas. No entanto, muitos destes dados e outros acervos ficavam com o pesquisador em seu escritório ou mesmo em sua casa”, destaca Loureiro.

Toda a experiência do professor está traduzida em dezenas de estudos que ajudaram a desenhar o campo da saúde coletiva no Brasil. O trabalho também serviu de inspiração para o nome do “Repositório de dados seguros Prof. Sebastião Loureiro”, uma homenagem do Instituto de Saúde Coletiva às contribuições do acadêmico.

“Considero o ISC uma instituição exemplar pela seriedade que imprime ao seu trabalho e pela capacidade criativa de evoluir e se adaptar às novas necessidades dos serviços de saúde e da pesquisa e do ensino. Ter o meu nome associado a esta prestigiada Instituição da qual tenho participado é uma honra e reconhecimento da contribuição aos princípios que construíram o ISC”.

Para o professor, o repositório de dados seguros é um importante passo para proteger, classificar e organizar acervos que se perdem ou com acesso restrito a outros pesquisadores. “Será um trabalho meritório que todos devem apoiar, aprimorar, usar e contribuir”, conclui.