É comum no discurso público alguém declarar: “Eu trouxe dados para esta discussão”, tornando assim as suas próprias conclusões sólidas e lógicas. Não é incomum perguntar: de onde vêm os dados? Como é coletado? Por que existem dados sobre algumas coisas, mas não sobre outras?
A professora do MIT, Catherine D'Ignazio SM '14, está se perguntando esse tipo de pergunta. Acadêmico com um portfólio de trabalho abrangente, ele é apaixonado pela aplicação de dados a questões sociais – muitas vezes ajudando pessoas desfavorecidas a obter acesso a números e ajudando a fornecer uma imagem mais completa dos problemas sociais que estamos tentando resolver.
“Se quisermos que cidadãos instruídos participem na nossa democracia através de dados e de debates baseados em dados, temos de pensar sobre como concebemos a nossa infraestrutura de dados para apoiar isso”, disse D’Ignazio.
Tomemos, por exemplo, o problema do feminicídio, o assassinato de mulheres devido à violência baseada no género. Ativistas em toda a América Latina começaram a abrir ações judiciais sobre o assunto e a criar bancos de dados que são muitas vezes mais completos do que os registros oficiais do Estado. D'Ignazio reconheceu esta questão e, com os seus colegas, integrou ferramentas de IA com defensores dos direitos humanos para apoiar o seu trabalho de monitorização.
Posteriormente, o livro de D'Ignazio de 2024, intitulado “Contando o Feminicídio”, narrou todo o processo e ajudou a levar a questão a um novo público. Onde antes havia escassez de dados, agora existe uma abundância de informações que ajudam as pessoas a ver a realidade do problema em muitos continentes, graças à inovação cidadã. O livro destaca que a ciência de dados de base e o ativismo de dados dos cidadãos são frequentemente formas emergentes de participação pública.
“Quando falamos em inovação, penso: inovação de quem? E quem? Para mim, essas são questões importantes”, disse D'Ignazio, membro do corpo docente do Departamento de Estudos e Planejamento Urbano do MIT e diretor do Laboratório de Dados e Feminismo do MIT. Por sua pesquisa e ensino, D'Ignazio conquistou o cargo no início deste ano.
Em níveis mais baixos
D'Ignazio há muito cultiva interesse em ciência de dados, arquitetura digital e assuntos globais. Ele recebeu seu bacharelado em relações internacionais pela Tufts University e depois tornou-se desenvolvedor de software no setor privado. Retornando aos estudos, obteve um MFA pelo Maine College of Art, depois um MS pelo MIT Media Lab, o que o ajudou a consolidar sua visão intelectual.
“Para mim, o Media Lab foi um lugar onde pude reunir todas essas coisas que estava pensando”, disse D'Ignazio. “Como podemos ter aplicativos de software e bancos de dados mais criativos? Como podemos ter mais aplicações de IA apenas nas redes sociais? E como organizamos a nossa tecnologia e recursos para que possamos ter um futuro mais inclusivo e igualitário para todos nós?”
Na verdade, D'Ignazio não passava todo o tempo no Media Lab verificando as novidades do site. Em 2014 e 2018, ela organizou um hackathon para mulheres chamado “Make a Breast Pump Suckerless”, onde centenas de participantes desenvolveram novas tecnologias e políticas para abordar a saúde pós-parto e a alimentação infantil. No entanto, a maior parte de seu trabalho concentra-se no design de dados, na visualização de dados e na análise da relação entre a produção de dados e a sociedade.
D'Ignazio começou sua carreira docente como instrutor no programa de pós-graduação Digital + Media da Rhode Island School of Design, depois tornou-se professor assistente de visualização de dados e mídia social no departamento de jornalismo do Emerson College. Ele ingressou no corpo docente do MIT como professor assistente em 2020.
O primeiro livro de D'Ignazio, “Feminismo de Dados”, em coautoria com Lauren Klein da Emory University e publicado em 2020, examinou mais de perto as muitas maneiras pelas quais os dados cotidianos refletem a sociedade civil da qual emergem. As taxas relatadas de violência sexual em campi universitários, por exemplo, podem ser enganosas porque as instituições com as taxas mais baixas são provavelmente aquelas com os climas de notificação mais problemáticos para os sobreviventes.
A perspectiva global de D'Ignazio — viveu em França, Argentina e Uruguai, entre outros lugares — ajudou-o a compreender a política regional e nacional por detrás destas questões, bem como os desafios que os observadores cidadãos podem enfrentar em termos de recolha de dados. Ninguém deveria pensar que tais projetos são fáceis.
“Muito trabalho de base é dedicado à geração de dados”, disse D’Ignazio. “Uma coisa que é muito interessante é a grande quantidade de trabalho que está sendo feito por grupos de base ou de ciência cidadã para tornar os dados úteis. E muitas vezes isso se deve a estruturas de dados institucionais que realmente faltam.”
Para permitir que os alunos tenham sucesso
No geral, a questão de quem participa da ciência de dados é, como escreveram D’Ignazio e Klein, “o elefante na sala de servidores”. Como professor associado, D'Ignazio trabalha para incentivar todos os alunos a pensar criticamente sobre a ciência de dados e seus fundamentos sociais. Por sua vez, ele também se inspira em alunos produtivos.
“Parte da alegria e do privilégio de ser professor é ter alunos levando você a lugares onde você mesmo não iria”, disse D'Ignazio.
Um dos atuais estudantes de pós-graduação de D'Ignazio, Wonyoung So, tem investigado questões de dados habitacionais. É fácil para os proprietários encontrar informações sobre os inquilinos, mas isso é raro; isto torna difícil determinar se os proprietários têm taxas de despejo invulgarmente elevadas, por exemplo.
“Existe toda esta tecnologia que permite aos proprietários obter quase qualquer informação sobre os inquilinos, mas há muito pouca tecnologia que permite aos inquilinos saber alguma coisa sobre os proprietários”, explicou D’Ignazio. A disponibilidade de dados “acaba muitas vezes por reproduzir as assimetrias que já existem no mundo”. Além disso, mesmo quando as informações sobre habitação são publicadas pelas autoridades, observa ele, são “incrivelmente fragmentadas e impressas de forma errada, de um lugar para outro”. Existe um enorme desequilíbrio mesmo nos dados abertos. “
Desta forma, as casas são vistas como mais um local onde novas ideias e melhores estruturas de dados podem ser desenvolvidas. Não é um tema que ele focaria sozinho, mas D'Ignazio se vê como um catalisador para a criação de novos trabalhos por outros. Há muito progresso a ser feito na aplicação da ciência de dados à sociedade, muitas vezes através do desenvolvimento de novas ferramentas para uso humano.
“Estou interessado em pensar sobre como o conhecimento e a tecnologia podem desafiar a desigualdade estrutural”, disse D’Ignazio. “A questão é: como projetamos tecnologia que ajude a capacitar as comunidades?”