Italia Corpus Legale: un corpus aperto per l’IA degli studi legali


 

Norme in markdown, aggiornamenti quotidiani e cronologia Git danno agli sviluppatori e agli studi una base gratuita per creare sistemi di ricerca giuridica avanzata. Non senza rischi. 

Italia Corpus Legale è un dataset pubblico che raccoglie l'intera legislazione italiana pubblicata su Normattiva e la distribuisce in formato Markdown — pronto per essere consumato da modelli di linguaggio, pipeline RAG, ricercatori e chiunque abbia bisogno di testo legale strutturato e machine-readable realizzato da realizzato da ahmeabd 


Ogni norma è un file. Ogni aggiornamento normativo è un commit.

Per leggere l'articolo clicca qui

     
Per vedere i casi d'uso puoi guardare l'immagine sottostante




Commenti

Post popolari in questo blog

Arriva SPEdiGIUS a sostituire SIAMM

Pensiero artificiale, funzione giudiziaria e l’errore di metodo della metonimia

Sapere aude e la governance dell'AI: un approccio kantiano contro il mito dell'algoritmo