So, do we have 2 or 74 percent Open Access availability?

by @jeroenbosman

N.B. This post contains updates between [ ]

Anyone following Open Access developments is confronted almost daily with new policies, mandates, goals, definitions, delimitations and the concomitant quantitative underpinnings. The passed two months saw a rush hour frenzy with the announcement of new OA policy from the main Dutch research funder NWO, procedures from HEFCE in the UK with details of their deposit mandate, the release of six reports from Canadian Science Metrix prepared for the European Commission earlier this year, major researcher surveys by Nature and by Taylor&Francis, a business report on the OA market, calculations on the cost of OA by Wouter Gerritsma at the Amsterdam (UvA/HvA) OA symposium and more.

This avalanche is of course no coincidence as the period around the Open Access week is deal to get OA stakeholders’ attention. Being a bit of a number cruncher, my attention was caught by some amazing facts & figures that surfaced from the depths of these these reports:

1) Open Access has a share of just 2.3% of the (STM) journals market, according to blogpost outlining a report by Simba (which can be had for $2500).

2) Worldwide over 50% of research papers published 2007-2012 are now Open Access available, according to the main ScienceMetrix report pepared for the EU (page 16).

3) An astounding 73.8% of Dutch papers from the year 2008-2013 is Open Access available, according to the Science Metrix report again (page 26).

4) OA papers are between 26% and 64% more cited than the average of all papers. OA citation advantage is strongest for papers available in green Open Access and even negative for Gold Open Access, again according to the Science Metrix repport (page 18).

5) Of all STEM researchers, 62% claims to have published at least 1 OA article over the last 3 years; for SSH that is 38%; both according to the recent global Author Insights Survey carried out by Nature (page 5).

6) 70% authors agree that there are fundamental benefits to OA, up from 60 in 2013. The  large scale 2014 survey sent out by Taylor&Francis also found that few authors see citation advantage as an important reason to publish OA.

7) Last year Dutch authors paid on average €1087 (excl. VAT) in APCs for their Gold OA papers, according to research by Wouter Gerritsma presented at an Amsterdam symposium during the Open Access Week.

8) Just to add one more: Web of Science shows that of all 1,25M 2014 papers & reviews indexed so far 8.5 percent is open access (on 20141211).

Pretty amazing and confusing figures huh?

Alas, as always, only the fine print reveals what is really going on. It makes the picture more blurry but also more faithful. So let’s dive in to see what this is all about.

1) The 2.3 percent market share pertains to the income derived from scholarly journals. As such it is not a very good indication of the success of OA because it is affected by the price of APC’s (higher APC’s will lead to a higher market share) and the price of regular subscriptions (lowering subscription prices will lead to a rising OA market share). Also the figure probably includes income derived form hybrid journals. So do not simply cheer if this market share figure rises. And  of course green OA is not in the equation at all. In theory we can have 100% OA though green deposits with a 0% OA income market share. Nevertheless the fairly low figure of 2.3% may be convincing investors in big publisher stock not to be afraid that OA will become a threat.

[Update 20141213: Walt Crawford has done comparable research arriving at roughly the same total OA market size as Simba (around $245M), without giving a percentage of the total journal market. Figures are in his blog, where he gives an amazing amount of other details, such as avarage APC levels in Gold OA journals at $388/981/170 for STE/M/SSH respectively. Unfortunately Crawford does not share his data like Wouter Gerritsma did recently.]

2-3) The high OA shares reported by Science Metrix are based on a very large Scopus sample, measuring OA access levels in April 2014 through Google Scholar (I suspect by checking for DOC/HTML/PDF full text links you see on the right of Scholar result pages) and a number of other sites and repositories. These figures are real, but omit the most recent period (half year/ year), which is arguably the most important for getting access and also the period with the least OA availability because of publisher embargoes on green sharing. Also it includes all versions of papers and may even include papers shared against copyright regulations through e.g. ResearchGate or private researcher sites. For these reasons you could argue that Science Metrix is stretching it a bit. On the other hand it excludes all papers published in full OA journals not indexed by Scopus, and that is over 70% of all OA journals in the Directory of Open Access Journals. That is reason to say Science Metrix may even be under-reporting. The extremely high figure for the Netherlands is across much of the board of disciplines, with only historical studies, chemistry, arts and ‘textual studies’ having a figures below 50% (table XIII).  The Netherlands shares this high overall level of OA availability with Croatia, Estonia and Portugal. One might hypothesize that the high standards of university repositories management contributes to the figure, but really more research is need here to be sure, because there are many more potential explanations.

4) The figures on citation advantage maybe counterintuitive. This is a difficult area of research. I guess there are many confounding 3rd variables at play. First of all: many of the full Gold OA journals in Scopus are new kids on the block, still building a reputation. Second, gold OA journals are still dominated by journals in SSH, which have fewer citations per paper than STEM and also have an overrepresentation of non-English papers, also having fewer citations. So it may not be their gold nature per se that gives them a citation disadvantage. But perhaps it is also just too early to call. The evidence is still not conclusive, despite interesting studies and data becoming available, such as data on the (then hybrid) journal Nature Communications and data on journals switching to OA by joining BioMedCentral.

5) The number of authors that already published a Gold (or hybrid) OA paper is surprisingly high, with two thirds in STEM and over a third in SSH. This means publishing OA is accepted and has become mainstream. Nice is also that the by far most mentioned reason to publish OA is that researcher think research results should be openly available and much less so because their funder requires OA or because they expect more citations. The only caveat here is that subdisciplines within SSH may show varying results and that perhaps the population is a bit skewed, because mainly based on authors known to Nature because they previously published with Nature/Macmillan (including Palgrave and Frontiers).

6) So, a large majority (70%) sees fundamental benefits to OA publishing according to the T&F survey. Add to this another 20 percent neutral and you wonder why not far more papers are published OA. What is it that holds the majority of researchers from reaping those benefits? The same study finds that OA publishing standards are on average considered a bit lower, so that may be part of the explanation. Also, especially for (some part of) SSH objections to CC-BY sharing may play a role, as that license is accepted by only 19% (compared to 71% for CC-BY-NC). A last factor may be that many fields are still lacking good, modern, high standard OA publishing venues, especially in SSH. So it is great news that the new Open Library for Humanities megajournal has opened for submissions a week ago, on 20141202.

7) The average APC paid by Dutch authors is much lower than the common view that APC’s are around 3000$. That latter figure probably got into people’s minds by researchers looking at OA APC’s in the traditional journals that they always used to publish in, so in a non-OA hybrid journal. When people really start looking for OA publishing venues (en route accepting that impact factors are bogus) they find that many have much more modest APC’s. Please note however that the average of €1087 excludes VAT and includes OA journals charging nothing. In Germany, more or less the same levels were found (€1210). BTW Green OA, or self deposit in an archive, is another very simple way of OA sharing that costs next to nothing.

8) The 8.5% Open Access availability of current year papers indexed in WoS seems to be casting a shadow over the Science Metrix figures. However, you have to note that this WoS figure excludes papers available in OA through hybrid journals, as WoS assigns the OA label to papers on the journal level, so only appears in full OA journal are counted as OA when applying their filter. It also disregards the many good young OA journals, as the inclusion process for WoS can take years. And finally WoS does not look at OA availability through self archiving. So this is a seriously underreporting figure.

In conclusion, at this point in time, we may say that on average we have reached and crossed tipping points for mass OA availability and acceptance. Improving the acceptance of licenses (either more open ones by authors or more stringent ones by OA publishers) and creating more and more diverse OA publishing venues can take OA further. All the reports and surveys mentioned are worth a closer look. And when someone asks me: well do we have 2 or 74 percent OA, I say, well…. about 38 ;-)

Evidence Based Veterinary Medicine Network

In aansluiting op het verslag van Paulien en Bianca over hun cursus rondom Evidence Based Medicine bij dezen ook iets over de ontwikkelingen rondom Evidence Based Veterinary Medicine.

Op 23 en 24 oktober j.l. troffen ca 250 wetenschappers uit 15 landen elkaar op het landgoed Beaumont Estate nabij Windsor, UK, voor de 1e International EBVM Network Conference.

Belangrijkste thema: het van de grond krijgen van samenwerking tussen professionals uit de veterinaire praktijk, industrie, non-profit organisaties én de academische wereld, met als doel evidence–based–tools méér en beter kénbaar, beschíkbaar en beréikbaar te maken voor de praktizerende dierenartsen.

Naast de ruim 50 mondelinge presentaties en een 40-tal posters – van informatie uit electronische patientendossiers tot evidence based richtlijnen en van EBVM-onderwijs tot systematic reviews over specifieke klinische onderwerpen – was er daarom ook volop gelegenheid voor tussentijds netwerken. Voor mij een uitgelezen kans om uitgebreid van gedachten te wisselen met collega’s veterinair-informatiespecialisten en -bibliothecarissen over onze eigen bijdragen voor EBVM onderwijs en onderzoek.

Kortom, ik heb niet alleen allerlei leuke ideen opgedaan om de EBVM verder uit te dragen in ónze veterinaire faculteit, maar we me ook aangemeld voor de Werkgroep die zich gaat bezig houden met hoe dit handen en voeten te geven in brede zin.

En uiteraard heb ik op de heen- en terug weg natúúurlijk de gelegenheid aangegrepen om iets te zien van de ‘Treasures’ van de British Library, om de hoek bij het internationale treinstation St.Pancras. Intrigerend hoor, om oog in oog te staan met het dagboek van Robert Falcon Scott (Zuidpool 1912), het labjournaal van Alexeander Fleming (ontdekking penicillinen), de originele aantekeningen van songteksten van de ‘FabFour’ (wie anders dan de Beatles!?), en nog veel/ouder moois, speciaal voor de échte carto- en bibliofielen… Hier ga ik zeker nog eens kijken!

Cursus Teaching Evidence Based Medicine van 10-14 november: Oxford.

Van 10 november tot en met 14 november volgden Bianca en Paulien de cursus ‛Teaching Evidence Based Medicine’ bij het prestigieuze Centre of Evidence Based Medicine in de prachtige stad Oxford.
Voor wie er nog nooit van gehoord heeft: EBM is inmiddels een begrip in de geneeskunde. Het is het verzamelen van bewijs uit de (almaar groeiende hoeveelheid) literatuur, gecombineerd met klinische expertise en de wensen en waarden van de patiënt om tot een weloverwogen besluit omtrent behandeling te komen, of een prognose te geven etc.

EBM hangt dicht aan tegen het vakgebied epidemiologie en het onderwijsblok voor de zesdejaars Geneeskunde waar wij een onderdeel in verzorgen over het maken van een ‘ goede zoekstrategie’ valt dan ook onder de verantwoordelijkheid van de epidemiologen in het UMC Utrecht.

Twee keer per dag waren er plenaire sessies waar een heel internationaal gezelschap van ca. 50 collega’s aan deelnam. Thema’s waren o.a.: ‘ Finding articles’ ; ‘Teaching critical appraisal of randomised controlled trials’ ; ‘Teaching tips for diagnostic studies’ ; ‘ Learning styles’ ; ‘Online teaching: applications in teaching’ en ‘ Teaching statistics’ .

Twee maal per dag zaten we in kleinere groepen en konden we ófwel aan anderen onze best practices laten zien, ófwel individueel een thema uit de ochtendsessie uitwerken en presenteren aan de groep.
We waren dus vooral zelf aan het woord in deze kleinere groepen en kregen erg veel feedback en tips van de andere deelnemers. Ook was het natuurlijk erg leuk om te zien wat anderen in hun onderwijs doen/ hoe anderen hun EBM onderwijs geven.

We gaan langzamerhand het geleerde invoegen in ons bestaande onderwijs en in onze LibGuides: Zoeken voor een klinische vraag en EBM Literatuurbronnen. Ook willen we met intercollegiale scholing onze collega’s van de aanpalende vakgebieden op de hoogte brengen van het geleerde. Evidence Based Veterinary Medicine bestaat ook al enige tijd; bij Sociale Wetenschappen is er ook belangstelling voor de filosofie achter Evidence Based Medicine.

In onze spaarzame vrije tijd wisten wij een toegangspas te bemachtigen tot de wereldberoemde Bodleian Library uit 1602! Nadat we eerst plechtig hardop beloofden ‘geen vuur en vlam in de bibliotheek te brengen noch te ontsteken’, waren we er een avond lang niet meer weg te slaan :-).


Verslag IMCW/ICKM kennis en informatie management in Antalya, Turkije

Van 24 tot 29 november was de IMCW/ICKM kennis en informatie management conferentie in Antalya, Turkije, met een focus op onderzoeksdata. De algemene indruk: een niet al te grote (140 mensen) gemoedelijke conferentie waar veel mensen elkaar kennen van vorige edities. Waarschijnlijk omdat datamanagement nog zo nieuw is, waren er veel praatjes met basiskennis. Dat was leuk maar minder verrassend. Hier nu de hoogtepunten naar onze mening. Boekjes met abstracts van alle praatjes liggen bij Tessa (6.39 UBU) en Ingrid (1.31 UBB). Informatie kan ook gevonden worden op

How do you educate the data scientist? (Gobinda Chowdhury, Michael Seadle, Wolfram Horstmann): Er werd gesproken over deze nieuwe taak, die ook een plek in de bibliotheek moet krijgen, volgens alle sprekers. Een persoon die verstand heeft van data analyse, statistiek, programmeren, visualisatie en dus een andere rol in de service verlening heeft dan data manager/ data librarian.

Entrepreneurship teaching (Michael R. Kristiansson): Volgens een nieuwe filosofie ‘ondernemend zijn’. Ga niet uit van risico’s en toeval, maar denk vanuit wat je hebt/bent, wat een aanvaardbaar verlies is en, belangrijk, hoe je de toekomst kan vormen in plaats van afwachten. Zo kan je binnen de bibliotheek ook ondernemend zijn als werknemer.

Inverting the pyramid (Kevin Ashley, Informatie in onderzoek kan weergegeven worden door een pyramidevorm met data op de bodem en de publicatie met gecondenseerde informatie aan de top. Traditioneel bouwen onderzoekers verder op basis van wat ze aan de top voor informatie vinden. Er vindt nu een omslag plaats, waar onderzoekers steeds vaker verder bouwen op basis van de onderkant van de data: de ruwe onderzoeksdata. Quote: ‘I love your data. I don’t love what you’ve written about it.’ Data curation is een belanrijk thema hierbij. Het gaat dan niet alleen over bewaren maar ook over het bewust weggooien van data, want er worden meer data geproduceerd dan er opgeslagen kunnen worden. Ashley benadrukte het belang van OPEN DATA. We moeten niet bang zijn voor verkeerde interpretatie van onze data.

Nog meer Open Acces bij Sirin Tekinay, die een lans brak voor FabLabs.

Externalize/Eject content from the library (Timo Borst): Op drie manieren te doen. 1) Betere indexering in zoekmachines zoals Google Scholar door html jump-off pages te optimaliseren in hun header tekst. Met als voorbeeld: 35% van de downloads binnen hun instituut gaat nu via deze trigger. 2) Integreer ‘authority’ data: van wie is deze output? Dit is dan een verbindend punt voor gedistribueerde content. Bijvoorbeeld het eigen ID systeem linken met ORCID, VIAF. 3) nieuwe applicaties verzinnen, zoals automatisch aanbevolen literatuur geven bij blogteksten (innovatief!). 4) een API (application user interface) of webservice maken voor toegang tot de bibliotheekmaterialen.

DataCite (Frauke Ziedorn): interessant feit: data uit data citation index van Thompson Reuters is vrij toegankelijk voor statistische citatie analyse door deelnemers die hun Datacite Persistent identifier (dit is een DOI) beschikbaar maken aan hen. Het lijkt me dat het dan gaat om instituten die hun registratie doorspelen aan TR via DataCite.

Big data (Peter Becker): Dit is gekarakteriseerd door volume, variëteit, snelheid. Data is ‘too big’ om door database tools afgehandeld te worden. Library and information service LIS Den Haag onderwijst hierin. Drie rollen worden door hem onderscheiden: eigenaren, technische mensen die de data verwerken, en de mensen die op een creatieve manier de mogelijkheden zien. En dat zijn de mensen in de bibliotheek!! Hetzelfde geldt voor tekst mining.

“Research Data in Humantities is a difficult match” zegt Michael Seadle. Data zijn er altijd geweest en de bibliotheek heeft altijd al aan dataopslag gedaan. Hij pleit voor digitalisering, zoals bij het “Internet Archive”. Digitalisering maakt datamining mogelijk. Maar, is alles data, wat er in de boeken van de bibliotheek staat? Volgens Raphael Ball is er geen standaard definitie voor research data. Iedere discipline moet zijn eigen definitie formuleren. Ruwweg hebben we het bij data over geselecteerde sets van gegevens die de basis vormen voor onderzoek. Die kunnen ongestructureerd zijn. Ball pleit voor het structureren van deze gegevens. En dat is wat we doen bij Research Data management.

Verslag door Ingrid Kiewik en Tessa Pronk

Derde conceptversie ACRL normen voor informatievaardigheid

Sinds enkele dagen is de derde conceptversie van de nieuwe ACRL normen voor informatievaardigheid beschikbaar. In het stuk, Framework for Information Literacy for Higher Education, is het commentaar op de tweede versie, die we hier eerder bespraken, verwerkt. Er wordt nog steeds gewerkt met de zes threshold concepts, die nu Frames heten en iets andere namen hebben gekregen:

  • Authority Is Constructed and Contextual
  • Information Creation as a Process
  • Information Has Value
  • Research as Inquiry
  • Scholarship Is a Conversation
  • Searching Is Strategic

Deze frameworks hebben bij mij al waarde gehad omdat ik een deel van mijn colleges er aan kon ophangen. Het is prettig studenten te confronteren met een iets wijdere en meer conceptuele blik op informatie als tegenwicht van de zeer praktische maar soms wat mechanistische benadering in mijn trainingen.

In de nieuwe derde draft is er ook een gewijzigde definitie van Informatievaardigheid:

Information literacy is a spectrum of abilities, practices, and habits of mind that extends and deepens learning through engagement with the information ecosystem. It includes
  1. understanding essential concepts about that ecosystem;
  2. engaging in creative inquiry and critical reflection to develop questions and to find, evaluate, and manage information through an iterative process;
  3. creating new knowledge through ethical participation in communities of learning, scholarship, and civic purpose;
  4. adopting a strategic view of the interests, biases, and assumptions present in the information ecosystem.

Wie goed leest ziet in 1, 2 en 4 natuurlijk de aloude vaardigheden typeren, zoeken en evalueren. Het onderdeel creëren is echt nieuw t.o.v. de standards uit 2000.

Deze laatste draft bevat ook voor elk van de Frameworks uitgebreide knowledge practices (de meer praktische vaardigheden) en dispositions (met welke opstelling men informatie benadert en gebruikt).

Al met al een document dat het waard is besproken te worden en ook om te gebruiken voor evaluatie van ons huidige onderwijs op dit gebied. De makers zien het nieuwe stuk niet als harde norm maar als hulpmiddel bij het inrichten van IV-onderwijs.

Tot 12 december kun je ook nog feedback geven aan de ACRL.


De Onderwijsdagen: 11 november in het kort: deel 2.

Net als Dafne was ik bij de Onderwijsdagen waarvan je hieronder mijn verslag kunt lezen. Van de parallelsessies overlapte er één met die van Dafne (de presentatie van Jan Kamphuis over Hippocampus). Ik zal de andere drie kort behandelen.

De eerste sessie werd verzorgd door Peter Borgman en Erik Schakelaar van de Hogeschool Windesheim en ging over Blended Learning. Zij experimenteren met een vorm van proefstuderen waarna aanstaande studenten zelf kunnen beslissen of het bevalt. Uit een pilot blijkt dat dit bijdraagt aan een bewustere studiekeuze en verminderde studieuitval.

Toekomstige studenten krijgen in de oriëntatiefase van hun studiekeuzeproces al de mogelijkheid om te ervaren wat de studie inhoudt via blended learning en e-learning. Deelnemers volgen online een onderwijsmodule terwijl een docent op afstand beschikbaar is voor begeleiding. In die digitale leeromgeving wordt gebruik gemaakt van ‘the flipped classroom’ wat inhoudt dat de digitale instructie wordt ondersteund met uitleg en proefvragen. Zo’n module duurt zeven weken en start iedere week met een digitale videohandleiding waarin de deelnemers zien wat ze moeten doen. De module sluit af met een opdracht. Een docent kijkt die vervolgens na en geeft feedback.

Mijn tweede sessie was de presentatie van Jan Kamphuis die Dafne al beschreef.

Vervolgens woonde ik de derde sessie bij die gegeven werd door Peter Sloep van de Open Universiteit. Zijn sessie “Een didactiek voor open en online onderwijs” handelde over de didactische aspecten van online onderwijs. Hij schetste een beeld van voorheen onderwijs in grote collegezalen naar steeds meer MOOC’s. Hij had als kritiek dat veel onderwijsinstellingen meedoen met de trend van MOOC’s om de boot maar niet te missen maar dat het vaak ontbreekt aan een echt duidelijk beleid. Ook vertelde hij wat randvoorwaarden waar een goede Mooc aan moet voldoen. Zo waren de eerste gewoon gefilmde colleges van 45 minuten maar dat blijkt niet te werken. Studenten haken dan af. Nu zie je steeds meer dat gewerkt wordt met korte instructies van rond de zes minuten en dat er behoefte is aan interactiviteit en dat daaraan voldaan wordt via forum’s waardoor je feedback kunt krijgen.

De vierde sessie die ik bezocht had als thema Digitaal Informatievaardigheden Meten en werd verzorgd door Caroline Timmers en Amber Walraven van de Radboud Universiteit.

Zij hebben een computergestuurde formatieve toets ontwikkeld om informatievaardigheden te meten, de DIM (Digitale Informatievaardigheden Meting). Studenten verrichten dan een aantal opdrachten en er wordt vooral geregistreerd HOE ze deze opdrachten verrichten. Vooraf wordt ze gevraagd of ze denken dat ze voldoende informatievaardigheden hebben en naderhand worden er vragen over het zoekproces gesteld. Zo wordt er gekeken welke databestanden ze hebben gebruikt voor het maken van de opdrachten, wat dat heeft opgeleverd, of ze meerdere zoektermen gebruikt hebben en of ze tevreden zijn met het zoekresultaat. Ook wordt soms gebruik gemaakt van eye-tracking waarbij de bewegingen van de ogen over het beeldscherm gevolgd worden. Het bleek dat studenten geneigd zijn hun eigen informatievaardigheden voor het maken van de opdracht te overschatten en dat ze na het doen van de oefening bewuster naar informatie op zoek gaan.

Kijk voor een indruk van de DIM-tool op:

