Het gebruik van AI als hacktool is overhyped
Nieuw onderzoek toont aan dat de meeste LLM s niet in staat zijn om one day kwetsbaarheden te misbruiken, zelfs niet als ze de CVE beschrijving krijgen.
De offensieve potentie van populaire grote taalmodellen, LLM s, is op de proef gesteld in een nieuw onderzoek waaruit bleek dat GPT 4 het enige model was dat levensvatbare exploits kon schrijven voor een reeks CVE s. Het artikel van onderzoekers van de University of Illinois Urbana Champaign testte een reeks populaire LLM s, waaronder OpenAI s GPT 3.5 en GPT 4, plus toonaangevende opensource agents van Mistral AI, Hugging Face en Meta.
De AI agents kregen een lijst met 15 kwetsbaarheden, varierend qua ernst van medium tot kritiek, om te testen hoe succesvol de LLM s autonoom exploitcode konden schrijven voor CVE s. De onderzoekers maakten een specifieke prompt om de beste resultaten van de modellen te krijgen, die de agent aanmoedigde om niet op te geven en zo creatief mogelijk te zijn met zijn oplossing.
Alleen GPT 4
Tijdens de test kregen de agents toegang tot web browsing elementen, een terminal, zoekresultaten, het maken en bewerken van bestanden en een code interpreter. Uit de resultaten van het onderzoek bleek dat GPT 4 het enige model was dat in staat was om met succes een exploit te schrijven voor een van de one day kwetsbaarheden, met een succespercentage van 86,7 procent.
De auteurs merkten op dat ze geen toegang hadden tot GPT 4 s commerciele rivalen zoals Claude 3 van Anthropic of Google s Gemini 1.5 Pro en waren dus niet in staat om hun prestaties te vergelijken met die van OpenAI s vlaggenschip GPT 4.
Verder lezen bij de bron- Volkswagen krijgt berisping voor schendingen privacy in dieselschandaal - 27 juni 2025
- Cybercrimegroepen zelf gehackt: reden tot juichen? - 27 juni 2025
- AI in HR: 5 compliance-risicos en de tips voor verantwoord gebruik - 26 juni 2025
Lees ons boek
Gemeenten. Bewustzijn. Privacy.
Nieuwsbrief
Deze versturen we 3-4x per jaar.
Recente blogs
Meer recente berichten
Volkswagen krijgt berisping voor schendingen privacy in dieselschandaal | Verder lezen | |
Cybercrimegroepen zelf gehackt: reden tot juichen? | Verder lezen | |
AI in HR: 5 compliance-risicos en de tips voor verantwoord gebruik | Verder lezen | |
Gemeenten en Rijk gaan hetzelfde cloudbeleid volgen | Verder lezen | |
Facebook en Instagram gebruikten spionagetrucje op Android-smartphones | Verder lezen | |
Cyberburgemeesters: weerbaarheid tegen cyberaanval komt onder druk | Verder lezen | |
Bescherm persoonsgegevens agrariers in Woo | Verder lezen | |
Overheden roepen demissionaire minister op tot snelle lancering Nederlandse Digitaliseringsstrategie | Verder lezen | |
Hoe digitale vrijheid er in 2025 uitziet: van betalingen tot platforms | Verder lezen | |
EU-wetgevingsmonitor staat live | Verder lezen |