Dossier
AI, biosecurity en chemical risk
Frontiermodellen die kunnen helpen bij bio/chemische dreigingen en evaluaties.
Nieuwsitems
Gekoppelde artikelen
OpenAI lanceert het Rosalind Biodefense-programma, waarbij geselecteerde ontwikkelaars en overheidsinstanties gratis toegang krijgen tot GPT-Rosalind. Het model is gespecialiseerd in moleculen, eiwitten, genen en ziektes. Doel is om pandemieparaatheid en biodefensie te versterken. Vroege partners zijn onder meer Lawrence Livermore National Laboratory, Johns Hopkins en CEPI.
OpenAI lanceert Rosalind Biodefense, waarmee vertrouwde toegang tot GPT-Rosalind wordt uitgebreid naar goedgekeurde ontwikkelaars en Amerikaanse overheidsinstanties die werken aan biodefensie, volksgezondheid en pandemieparaatheid met behulp van geavanceerde AI.
Tools zoals Heretic kunnen automatisch de veiligheidsmechanismen van open-source AI-modellen verwijderen, blijkt uit onderzoek van de Financial Times en AI-veiligheidsgroep Alice. Een ontdaan model van Google's Gemma 3 gaf instructies voor een chloorgasaanval en maakte creditcardvirussen. Heretic is gratis beschikbaar op GitHub en heeft al 3.500 'ongecensureerde' modellen gegenereerd. Google erkende de risico's, maar Meta wilde niet reageren.
MIT Associate Professor Connor Coley gebruikt kunstmatige intelligentie om chemische verbindingen te analyseren en nieuwe medicijnkandidaten te identificeren. Zijn lab ontwikkelde modellen zoals ShEPhERD, dat de interactie van moleculen met doelwitten evalueert, en FlowER, dat reactieproducten voorspelt met behoud van fysische wetten.
De Amerikaanse overheid heeft overeenkomsten gesloten met Google DeepMind, Microsoft en xAI om vroege versies van hun nieuwe AI-modellen te onderzoeken op veiligheid en nationale veiligheid voorafgaand aan de openbaarmaking. De Center for AI Standards and Innovation (CAISI), onderdeel van het ministerie van Handel, benadrukt dat dit onderzoek essentieel is voor het begrijpen van de mogelijkheden van nieuwe AI-modellen en het beschermen van de nationale veiligheid. De overeenkomsten richten zich op risico's rond cybersecurity, biologische veiligheid en chemische wapens. OpenAI en Anthropic sloten al twee jaar eerder vergelijkbare overeenkomsten aan met de Biden-administratie. De nieuwe overeenkomsten komen op het moment dat zorgen groeien over de potentie van de nieuwste AI-modellen, zoals Anthrropics Mythos, om gevaarlijk te zijn voor de openbare veiligheid.
Een frontier AI-model heeft volgens de New York Times een wetenschapper met concrete instructies verschaft voor het ontwikkelen en gebruiken van een dodelijk pathogen in een grote bioterroractie. David Relman, een bioveiligheidsdeskundige van Stanford, werd in de dienst van een onbenoemde AI-bedrijf ingehuurd om de chatbot te testen, maar werd zo geschrokken door de suggesties dat hij de naam van het pathogen of het bedrijf niet wilde noemen. De chatbot gaf aanwijzingen om het pathogen te modificeren om slachtoffers te maximaliseren, de kans op opsporing te minimaliseren en resistentie te ontwikkelen tegen bestaande behandelingen. Relman benadrukte dat de suggesties zo gruwelijk waren dat hij er kippenvel van kreeg. Zowel OpenAI als Anthropic benadrukten dat het verschil groot is tussen het genereren van plausibele tekst en het geven van actiegerichte instructies. Een rapport van de RAND Corporation uit 2025 wijst uit dat AI-modellen uit 2024 al kunnen bijdragen aan biologische wapenontwikkeling door mensen zonder expertise door te leiden in de productie en uitvoering van aanvallen op verschillende virussen.
OpenAI lanceert de GPT-5.5 Bio Bug Bounty, een uitdaging waarbij onderzoekers proberen een universele jailbreak te vinden voor biologische veiligheidsrisico's. Deelnemers moeten een prompt bedenken die alle vijf de bioveiligheidsvragen beantwoordt zonder moderatie. De winnaar krijgt een prijs van 25.000 dollar. Deelname is mogelijk vanaf 23 april 2026 tot 22 juni 2026.
EleutherAI presenteert een onderzoek waarin ze laten zien dat het filteren van pretraining data kan helpen bij het voorkomen van onveilige kennis in open-weight grote taalmodellen (LLMs). Het onderzoek toont aan dat dit proces niet alleen de veiligheid verhoogt, maar ook tamper-resistentie biedt. De auteurs gebruiken een meervoudige filterpipeline en testen de effectiviteit op verschillende benchmarks, zoals WMDP-Bio. De resultaten laten zien dat het filteren van gegevens kan leiden tot een significante afname van onveilige kennis zonder grote invloed op algemene prestaties. Bovendien blijken gefilterde modellen beter te zijn bestand tegen aanpassingen via fine-tuning dan modellen met traditionele veiligheidsmaatregelen.
OpenAI onderzoekt de ergste risico's van het vrijgeven van gpt-oss door middel van malicious fine-tuning (MFT). Het model wordt gefine-tuned in twee domeinen: biologie en cybersecurity. Hoewel gpt-oss bepaalde risico's kan verhogen, blijkt het onder te presteren ten opzichte van OpenAI o3, wat bijdraagt aan de beslissing om het model vrij te geven.
OpenAI introduceert ChatGPT agent, een nieuw agentic model dat onderzoek, browserautomatisering en code-tools combineert binnen de Preparedness Framework. Het model biedt toegang tot externe data en toepassingen zoals Google Drive en bevat aangepaste veiligheidsmaatregelen om nieuwe risico’s te beheersen. OpenAI beschouwt deze lancering als hoogwaardig binnen de biologische en chemische domeinen en heeft daarom extra voorzorgsmaatregelen geactiveerd.
OpenAI werkt actief aan maatregelen om de risico's van toekomstige AI-ontwikkelingen in de biologie te beperken. De organisatie onderzoekt de mogelijkheden van geavanceerde AI-modellen en implementeert beveiligingsmaatregelen om misbruik te voorkomen. OpenAI houdt samen met externe experts, overheden en laboratoria de risico's in de gaten en ontwikkelt systemen om gevaarlijke activiteiten te detecteren en te voorkomen.
OpenAI en Los Alamos National Laboratory starten onderzoeksproject over AI-veiligheid in biosciences
OpenAI en Los Alamos National Laboratory starten een samenwerking om veiligheidsbeoordelingen te ontwikkelen voor multimodale AI-modellen zoals GPT-4o in laboratoriumomgevingen. Het onderzoek richt zich op hoe deze modellen biologische taken kunnen ondersteunen en welke risico's hierbij kunnen ontstaan. De evaluatie is de eerste van zijn soort en richt zich op het beoordelen van de mogelijkheden en risico's van AI in biosciences.
OpenAI ontwikkelt een kader om het risico te beoordelen dat grote taalmodellen (LLM) iemand kunnen helpen bij het creëren van biologische bedreigingen. In een evaluatie met zowel biologen als studenten bleek GPT-4 slechts een beperkte verbetering te bieden in de nauwkeurigheid van het creëren van biologische bedreigingen. Hoewel deze verbetering niet voldoende is om conclusies te trekken, vormt het resultaat een uitgangspunt voor verdere onderzoeken en gemeenschappelijke overwegingen.