Comunicació a Wikimania (Singapur) sobre reutilització de dades obertes i anàlisi d’epònims

Aquest matí, ben aviat (per la diferència horària amb Singapur) he fet una comunicació curta de 10 minuts al congrés Wikimania, en col·laboració amb la Sílvia Simon: “Reutilització de Dades Obertes de vàries fonts per analitzar la desigualtat de gènere: des dels epònims de carrers i centres docents, fins a investigadores i investigació.

Tot partint de la xerrada que l’Eva Cabré va fer a les jornades SigLliure que es van fer a la @univgirona, hem incidit una mica més en el tema de dades obertes, ja que la comunicació aquest cop pretenia fer èmfasi en les possibilitats de Open Data. En aquest cas, tot fent servir diverses fonts de la Generalitat de Catalunya, però també fent servir OpenStreetMap com a referència. De fet, la nostra idea és eixamplar-ho a les bases de dades obertes de compostos químics.

El resum de la comunicació és aquest:

Abstract

Using Wikidata and various sources of Open Data is not all straightforward. We have used that procedure to analyze human eponyms in street and school names. Furthermore, we have built up a reasonably sound way to have clean, quality data for researchers. All in all, we will try to pinpoint drawbacks and paths that lead to gender bias analysis and proposals to reduce it.

Description

We have assessed the gender bias in school and street eponyms: female eponyms account just for 15% of total human eponyms. Furthermore, those female eponyms have less items in Wikidata, and far less Wikipedia pages.

Building successful Editathons and Datathons requires reliable sources and sound practices that lead to very good data in Wikidata, so combining public open data, geographic open data (i.e, OpenStreetMap) and other sources requires some discipline and knowledge of the proper tools. For researchers, this is even more complex due to redundant imports e.g. from ORCID database and editors not expert enough in the intricacies of Wikidata.

This communication will focus on the difficulties we have found in building up quality data for our gender bias studies and the opportunities we have discovered in the realm of (un)linked open data. Hopefully other Wikimedians may profit from our experience, e.g., in designing a procedure to have a list of researchers starting from various open data sources or building a meaningful, valuable set of schools. We will address also the long-tail issue on local, noteworthy people in school and street eponyms.

This proposal is related to our #WikiSciW project, which tackles the increase of Women Scientists visibility: they are less visible than women outside scientific fields, besides being far less visible than male scientists.

I aquí hi ha el pdf de la presentació: https://w.wiki/7HKi que hem possat a Wikimedia Commons.

Fer la xerrada a primera hora del matí, sense veure els assistents, havent perdut una mica el costum de parlar davant de la webcam, en període de vacances… ha estat una mica complicat.

Gràcies a l’Eva Cabré i a la Martina Rodríguez per la seva col·laboració, i als companys i companys d’Amical Wikimedia.