Van 15 tot en met 18 juni vond de 20e editie van de Open Repositories conferentie plaats bij de University of Chicago. Deze jaarlijkse conferentie richt zich op professionals die betrokken zijn bij het beheer, de ontwikkeling en beleidsadvisering rondom open-source systemen voor Institutional Repositories (IR).
Functioneel beheerders van LIS-RS Maarten Leenders en Frank Diepmaat waren namens Tilburg University aanwezig bij deze conferentie en mochten eveneens een presentatie verzorgen. Hun presentatie ‘Towards a Plan S compliant repository: Building a safe and sustainable haven for scholarly content’ gaat over de redenen waarom Tilburg University besloten heeft om een aparte open source Repository DSpace te gaan gebruiken naast het onderzoeks-informatiesysteem Pure en de gang van zaken rond de implementatie hiervan. Daarbij zijn met name onze ervaringen rond de koppeling van Pure met DSpace 7 toegelicht en aanbevelingen gedaan voor andere instellingen.
Uiteraard waren er naast de onze, ook andere indrukwekkende en leerzame presentaties. Zo was de opening keynote van Heather Joseph, directrice van SPARC, een ultieme oproep om juist in een tijd van politisering van het onderzoek in de VS, als gevolg van het beleid van de regering Trump, Open Science niet op te geven als leidende strategie. Juist Open Science bevordert transparantie in en toegankelijkheid tot onderzoek en daarmee de mogelijkheid om aan “fact-checking” te doen en manipulatie door overheden tegen te gaan.
De closing keynote werd verzorgd door Ben Zhao, professor in Computer Science aan de Universiteit van Chicago, en door Time Magazine uitgeroepen als één van de 100 meest toonaangevende onderzoekers op het gebied van Artificial Intelligence.
In zijn soms hilarische speech bespreekt hij de (on)betrouwbaarheid van Generative AI Learning Language Models (LLM), die volgens hem te wijten is aan het fundamenteel asymmetrische matchingpatroon van LLM tools. Aan Google AI overview heeft hij bijvoorbeeld gevraagd wat hij zou kunnen doen om kaas beter aan een pizza te laten plakken en kreeg vervolgens als antwoord: “U kunt ook ongeveer 1/8 kopje niet-giftige lijm aan de saus toevoegen om het beter te laten plakken”! De oplossing die Zhao ziet in het verbeteren van LLM’s is het gebruik maken van Retrieval-Augmented Generation (RAG), Dit is een techniek die de antwoorden van LLM’s verbetert door ze te koppelen aan geautoriseerde externe informatiebronnen.
Naast LLM’s gaat Zhao ook in op de gigantische groei van downloads van wetenschappelijke publicaties door crawlers/bots die de laatste jaren merkbaar is op het internet. Dit leidt tot hogere kosten voor netwerkverkeer voor instellingen. De informatie uit deze publicaties wordt gebruikt voor het trainen van Open AI-tools. De enige remedie om in ieder geval de ‘kwaadwillende’ bots te weren, is het blokkeren van IP-adressen op netwerk-niveau.
In de meest recente versie van DSpace (9.0) die onlangs is uitgekomen zijn een tweetal nieuwe functionaliteiten toegevoegd, zoals toegelicht in de presentatie van Lyrasis, de instelling die het centrale beheer van DSpace coördineert. De eerste is een integratie met OpenAlex, een open bibliografische catalogus van wetenschappelijke artikelen, waardoor via een knop metadata uit OpenAlex rechtstreeks in DSpace kunnen worden geladen. De tweede is een koppeling met Matomo analytics, een open-source alternatief voor Google Analytics, waarmee DSpace gebruik kan worden getraceerd. Een andere belangrijke ontwikkeling die is genoemd zijn de plannen voor een toekomstige samenvoeging van DSpace met DSpace-CRIS.
Cambridge University is bezig met een pilot om erachter te komen in hoeverre DSpace geschikt zou zijn om als open journal publishing platform te fungeren. Pluspunten van DSpace zijn dat het een zeer geschikt platform is qua vindbaarheid en toegankelijkheid en dat er indexering plaatsvindt door belangrijke zoekmachines als Google en Google Scholar. Nadelig is dat er weinig functionaliteit is om peer-review activiteiten te ondersteunen.
Alle presentaties van de Open Repositories Conference 2025 zijn terug te vinden op Zenodo
From 15 to 18 June, the 20th edition of the Open Repositories conference took place at the University of Chicago. This annual conference is aimed at professionals involved in the management, development and policy advising of open-source systems for Institutional Repositories (IR).
Functional managers of LIS-RS Maarten Leenders and Frank Diepmaat were present at this conference on behalf of Tilburg University and also gave a presentation. Their presentation 'Towards a Plan S compliant repository: Building a safe and sustainable haven for scholarly content' is about the reasons why Tilburg University decided to use a separate open-source Repository DSpace in addition to the research information system Pure and the state of affairs surrounding its implementation. In particular, our experiences with the connection of Pure with DSpace 7 were explained and recommendations made for other institutions.
Of course, in addition to ours, there were also other impressive and informative presentations. For example, the opening keynote by Heather Joseph, director of SPARC, was an ultimate call not to give up on Open Science as a leading strategy, especially in a time of politicization of research in the US, as a result of the policy of the Trump administration. Open Science in particular promotes transparency in and accessibility to research and thus the possibility of fact-checking and countering manipulation by governments.
The closing keynote was given by Ben Zhao, professor of Computer Science at the University of Chicago and named by Time Magazine as one of the 100 leading researchers in the field of Artificial Intelligence.
In his sometimes hilarious speech, he discusses the (un)reliability of Generative AI Learning Language Models (LLM), which he believes is due to the fundamentally asymmetric matching pattern of LLM tools. For example, he asked Google AI overview what he could do to make cheese stick better to a pizza and then got the answer: "You can also add about 1/8 cup of non-toxic glue to the sauce to give it more tackiness"! The solution that Zhao sees in improving LLMs is to use Retrieval-Augmented Generation (RAG), This is a technique that improves the responses of LLMs by linking them to authorized external sources of information.
In addition to LLMs, Zhao also discusses the gigantic growth in downloads of scientific publications by crawlers/bots that has been seen on the internet in recent years. This leads to higher network traffic costs for institutions. The information from these publications is used to train Open AI tools. The only remedy to at least keep out the 'malicious' bots so far is to block IP addresses at the network level.
In the most recent version of DSpace (9.0) that has recently been released, two new functionalities have been added, as explained in the presentation of Lyrasis, the institution that coordinates the central management of DSpace. The first is an integration with OpenAlex, an open bibliographic catalogue of scientific articles, which allows metadata from OpenAlex to be loaded directly into DSpace via a button. The second is a link with Matomo analytics, an open- source alternative to Google Analytics, with which DSpace use can be traced. Another important development that has been mentioned is the plans for a future merger of DSpace with DSpace-CRIS.
Cambridge University is working on a pilot to find out to what extent DSpace would be suitable to act as an open journal publishing platform. Advantages of DSpace are that it is a very suitable platform in terms of findability and accessibility and that indexing is possible by important search engines such as Google and Google Scholar. On the downside, there is little functionality to support peer-review activities.
All presentations of the Open Repositories Conference 2025 can be found on Zenodo
0 Comments.