De data revolutie omarmen op IASSIST

Van 31 mei tot 3 juni bezocht ik de jaarlijkse conferentie van IASSIST: een internationale organisatie van professionals in informatie technologie en data diensten, om onderzoek en onderwijs in sociale wetenschappen te ondersteunen.

De conferentie werd gehost door het NSD (Norwegian Centre for Research Data). Het leuke van de conferentie was dat deze ook inging op de dagelijkse praktijk en data analyse.

Ik mocht er ook een praatje geven, over het spel-theoretische model van data delen dat ik vorig jaar met Paulien, Anne, en UU onderzoeker Feike Schieving geschreven heb. De conferentie was in Bergen, Noorwegen; een mooie stad aan zee omringd door bergen.

Interessante ideeën waren onder anderen:

  • Data librarians geven instructies over data cleaning, Git, visualisaties in R, text mining, al dan niet met hulp van Jupyter (hierin kan je uitvoerbare code en tekst voor uitleg zetten, cursisten kunnen dit dan uitvoeren).
  • Programmerende data librarians: b.v. een script voor het automatisch omzetten van .csv tabel naar codeboek
  • Repositories die hun data tot op variabelen niveau doorzoekbaar maken zoals UK data archive (en zie CESSDA voor meer data repositories in Sociale Wetenschappen)
  • Universiteitsbibliotheken met een expliciet stimulerend beleid op collectioneren van onderzoeksdatabases
  • Google analytics zoektermen-gebruik inzetten om gaten in de data collectie op te sporen: op wat voor trefwoorden wordt gezocht, en wat voor datasets zitten er daarvan in de collectie?
  • Veel praatjes over data curatie: het controleren van datasets en hun waarde vergroten door verbeteringen en het toevoegen van extra informatie
  • Actief (en automatisch) benaderen van onderzoekers, bijvoorbeeld die die te maken krijgen met Data Management eisen van financiers
  • Er zijn diverse assessment tools (maturity models) om na te gaan hoe ver je als organisatie bent met data diensten/infrastructuur

Verder bleek dat de metadata standaard DDI zeer actief ontwikkeld wordt, en dat dit echt de standaard is voor Sociale Wetenschappen om onderzoek te beschrijven. Bij DDI zitten ook veel gecontroleerde vocabulaires. Er was ook een leuk praatje die uitzocht wat een dataset herbruikbaar maakt. Datasets rechtstreeks gedeponeerd door onderzoekers zonder controle of curatie, werden het àllerminst gedownload. Een ander praatje keek naar de invloed van persoonlijke opvattingen op gedrag in data delen. O.a. welke onderzoekers aangaven data te delen, en hoeveel dit daadwerkelijk ook deden. Daar zat een flink gat.

Dit bericht werd geplaatst in I&M2.0. Bookmark de permalink .

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s