Lorenzo Arcioni

👨‍💻 Profilo

🎓 Computer Scientist con una forte passione per algoritmi, intelligenza artificiale e sistemi complessi. Opero nei campi del Machine Learning, della Data Science e dello sviluppo software avanzato, con un approccio fondato su pensiero algoritmico, rigore metodologico e orientamento al problem solving.

📚 Formatore esperto in Python, Machine Learning e Data Science, mi rivolgo a studenti universitari, ricercatori e professionisti che vogliono davvero comprendere ciò che studiano, non solo "seguire delle istruzioni". Ciò che mi distingue dalla maggior parte degli insegnanti — spesso focalizzati su nozioni frammentarie, spiegazioni approssimative o semplici esempi copiati da internet — è un metodo didattico chiaro, rigoroso e completo, frutto di una profonda conoscenza teorica maturata in anni di studio e pratica avanzata.

💡 Non mi limito a insegnare "come si fa": ti porto a capire davvero "perché funziona". La mia forza sta nella chiarezza espositiva, nella completezza dei contenuti e nella capacità di trasmettere una comprensione autentica, che nasce da anni di studio teorico rigoroso, applicato a problemi reali.

⚙️ Ho lavorato in ambienti HPC (High Performance Computing), utilizzando supercomputer come Leonardo (quarto supercomputer più potente al mondo) e Galileo100 del CINECA, dove ho affinato competenze su efficienza computazionale, parallelizzazione e scalabilità di sistemi complessi, affrontando sfide di alta intensità computazionale.

🧬 Ho maturato esperienza anche in ambito bioinformatico, contribuendo all'analisi e modellazione di dati biologici su larga scala, con una prospettiva interdisciplinare che integra informatica, statistica e biologia.

🎓 Formazione

🏛️

Università La Sapienza

Laurea Magistrale in Computer Science (Ongoing)

🏫

Neural Academy

Master Professionale in Data Science (2023)

🏛️

Università La Sapienza

Laurea Triennale in Informatica 110/110L (2023)

📚

ITT LS B. Pascal - Roma

Diploma in Informatica e Telecomunicazioni 100/100 (2019)

💼 Esperienze

Università La Sapienza - Stage

Software Engineer

2022-2023

Sviluppo di un algoritmo parallelo in grado di eseguire software di annotazione di terze parti (Diamond o BLAST) in modalità parallela, su sistemi ad alte prestazioni (HPC). Sfruttando il parallelismo dei dati, è possibile eseguire tale software in modalità distribuita, migliorando notevolmente l'efficienza dei processi di annotazione del trascrittoma. Durante lo stage sono stati sviluppati vari script di automazione per rendere il processo di annotazione parallelo il più user-friendly possibile. Il software è anche in grado di consolidare i risultati delle annotazioni parziali in un unico file finale, identico al file finale che avremmo ottenuto utilizzando software di annotazione tradizionali.

🚀 Progetti

Identifying Age-Related Conditions (ICR)

Top 2% Kaggle - Medaglia d'Argento

"ICR" è una competizione su Kaggle. Sono orgoglioso di condividere che ho ottenuto una Medaglia d'Argento, classificandomi nella top 2% della classifica della competizione.

L'obiettivo della competizione è utilizzare il machine learning per prevedere se una persona ha una delle tre specifiche condizioni mediche. I partecipanti sono chiamati a creare un modello addestrato su misurazioni delle caratteristiche di salute per fare queste previsioni.

Water Potability

In questo studio, abbiamo condotto un'analisi di un dataset contenente varie caratteristiche relative alla qualità dell'acqua per determinarne la potabilità. Dopo aver analizzato il dataset, abbiamo utilizzato tecniche di machine learning per sviluppare un modello per predire la potabilità dell'acqua basato sulle caratteristiche fornite.

HPC-T-Annotator

HPC-T-Annotator è uno strumento avanzato progettato per parallelizzare l'annotazione del trascrittoma, riducendo drasticamente i tempi di attesa e facilitando l'elaborazione di grandi trascrittomi, in particolare quelli eucariotici con ampi dataset.

Utilizza un'architettura HPC per l'annotazione parallela delle trascrizioni, gestendo simultaneamente più attività tramite un sistema a code (workload manager jobs).

BioSwiftAnalytics

BioSwiftAnalytics offre una suite di notebook Jupyter per semplificare l'analisi dei dati biologici, con strumenti per la ricerca trascrittomica e genomica. Supporta la generazione di report completi, la visualizzazione degli hit rate, la creazione di diagrammi di Venn e l'analisi dei risultati BUSCO. Grazie all'uso di Docker e Jupyter Notebook, BioSwiftAnalytics garantisce un ambiente modulare e facilmente replicabile, riducendo la complessità dell'installazione e della gestione delle dipendenze. Gli utenti possono eseguire analisi bioinformatiche avanzate senza preoccuparsi della configurazione dell'ambiente, beneficiando di un'infrastruttura scalabile e portatile. BioSwiftAnalytics è progettato per ricercatori, bioinformatici e biologi computazionali, offrendo un'interfaccia interattiva che accelera il workflow analitico.

Waste Image Classification

In questo progetto, presentiamo un approccio avanzato basato sull'apprendimento profondo (deep learning) per la classificazione dei rifiuti utilizzando il Real Waste Dataset, un dataset disponibile pubblicamente su Kaggle che comprende 4.752 immagini suddivise in nove categorie. Grazie a tecniche avanzate di deep learning, tra cui il transfer learning con modelli pre-addestrati, l'uso di tecniche di data augmentation e la progettazione di una rete neurale convoluzionale (CNN) personalizzata, il nostro lavoro mira a proporre soluzioni innovative per questa importante sfida.

Su questo link è disponibile un articolo che descrive il progetto.

📝 Pubblicazioni

HPC-T-Annotator: an HPC tool for de novo transcriptome assembly annotation

BMC Bioinformatics, 2024

Un tool innovativo per l'annotazione parallela di trascrittomi che sfrutta architetture HPC per ridurre i tempi di elaborazione da giorni a ore, mantenendo alta accuratezza nei risultati.

Bioinformatica HPC Transcriptomics

Leggi l'articolo

📜 Certificazioni

Introduzione al Machine Learning

Kaggle • Emesso Feb 2023

Mostra credenziale

Pandas

Kaggle • Emesso Feb 2023

Mostra credenziale

Data Science for Bioinformatics

Deep Learning Italia • Emesso gen 2023

Mostra credenziale

Fondamenti di Python

HackerRank • Emesso Set 2020

Mostra credenziale

CISCO CCNA

Cisco Networking Academy • Emesso Set 2019

Mostra credenziale

🎓 I miei corsi

Machine Learning: Introduzione

Questo corso offre un'introduzione ai concetti fondamentali e alle applicazioni del Machine Learning.

Prossimamente

Machine Learning: Algoritmo K-Nearest Neighbors (KNN)

Guida completa all'algoritmo K-Nearest Neighbors (KNN), concetti teorici e implementazioni pratiche in Python.

Iscriviti Ora

📬 Contatti

lorenzo.arcioni2000@gmail.com

Apri la chat su WhatsApp

📅 Puoi anche prenotare una consulenza gratuita di 30 minuti direttamente dal calendario qui sotto. Scegli il giorno e l'orario che preferisci tra quelli disponibili!