Italia Corpus Legale: un corpus aperto per l’IA degli studi legali
Norme in markdown, aggiornamenti quotidiani e cronologia Git danno agli sviluppatori e agli studi una base gratuita per creare sistemi di ricerca giuridica avanzata. Non senza rischi.
Italia Corpus Legale è un dataset pubblico che raccoglie l'intera legislazione italiana pubblicata su Normattiva e la distribuisce in formato Markdown — pronto per essere consumato da modelli di linguaggio, pipeline RAG, ricercatori e chiunque abbia bisogno di testo legale strutturato e machine-readable realizzato da realizzato da ahmeabd
Ogni norma è un file. Ogni aggiornamento normativo è un commit.
Per leggere l'articolo clicca qui
Per vedere i casi d'uso puoi guardare l'immagine sottostante


Commenti
Posta un commento