Lorenzo Arcioni

Lorenzo Arcioni

Machine Learning | Data Science | Bioinformatics

K

👨‍💻 Profilo

🎓 Computer Scientist con una forte passione per algoritmi, intelligenza artificiale e sistemi complessi. Opero nei campi del Machine Learning, della Data Science e dello sviluppo software avanzato, con un approccio fondato su pensiero algoritmico, rigore metodologico e orientamento al problem solving.


📚 Formatore esperto in Python, Machine Learning e Data Science, mi rivolgo a studenti universitari, ricercatori e professionisti che vogliono davvero comprendere ciò che studiano, non solo "seguire delle istruzioni". Ciò che mi distingue dalla maggior parte degli insegnanti — spesso focalizzati su nozioni frammentarie, spiegazioni approssimative o semplici esempi copiati da internet — è un metodo didattico chiaro, rigoroso e completo, frutto di una profonda conoscenza teorica maturata in anni di studio e pratica avanzata.


💡 Non mi limito a insegnare "come si fa": ti porto a capire davvero "perché funziona". La mia forza sta nella chiarezza espositiva, nella completezza dei contenuti e nella capacità di trasmettere una comprensione autentica, che nasce da anni di studio teorico rigoroso, applicato a problemi reali.


⚙️ Ho lavorato in ambienti HPC (High Performance Computing), utilizzando supercomputer come Leonardo (quarto supercomputer più potente al mondo) e Galileo100 del CINECA, dove ho affinato competenze su efficienza computazionale, parallelizzazione e scalabilità di sistemi complessi, affrontando sfide di alta intensità computazionale.


🧬 Ho maturato esperienza anche in ambito bioinformatico, contribuendo all'analisi e modellazione di dati biologici su larga scala, con una prospettiva interdisciplinare che integra informatica, statistica e biologia.

🎓 Formazione

🏛️

UniversitĂ  La Sapienza

Laurea Magistrale in Computer Science (Ongoing)

🏫

Neural Academy

Master Professionale in Data Science (2023)

🏛️

UniversitĂ  La Sapienza

Laurea Triennale in Informatica 110/110L (2023)

📚

ITT LS B. Pascal - Roma

Diploma in Informatica e Telecomunicazioni 100/100 (2019)

đź’Ľ Esperienze

UniversitĂ  La Sapienza - Stage

Software Engineer

2022-2023

Sviluppo di un algoritmo parallelo in grado di eseguire software di annotazione di terze parti (Diamond o BLAST) in modalità parallela, su sistemi ad alte prestazioni (HPC). Sfruttando il parallelismo dei dati, è possibile eseguire tale software in modalità distribuita, migliorando notevolmente l'efficienza dei processi di annotazione del trascrittoma. Durante lo stage sono stati sviluppati vari script di automazione per rendere il processo di annotazione parallelo il più user-friendly possibile. Il software è anche in grado di consolidare i risultati delle annotazioni parziali in un unico file finale, identico al file finale che avremmo ottenuto utilizzando software di annotazione tradizionali.

🚀 Progetti

Identifying Age-Related Conditions (ICR)

Top 2% Kaggle - Medaglia d'Argento

"ICR" è una competizione su Kaggle. Sono orgoglioso di condividere che ho ottenuto una Medaglia d'Argento, classificandomi nella top 2% della classifica della competizione.

L'obiettivo della competizione è utilizzare il machine learning per prevedere se una persona ha una delle tre specifiche condizioni mediche. I partecipanti sono chiamati a creare un modello addestrato su misurazioni delle caratteristiche di salute per fare queste previsioni.

ICR Project Preview
Vedi su GitHub →

Water Potability

In questo studio, abbiamo condotto un'analisi di un dataset contenente varie caratteristiche relative alla qualitĂ  dell'acqua per determinarne la potabilitĂ . Dopo aver analizzato il dataset, abbiamo utilizzato tecniche di machine learning per sviluppare un modello per predire la potabilitĂ  dell'acqua basato sulle caratteristiche fornite.

Water Potability Project Preview
Vedi su GitHub →

HPC-T-Annotator

HPC-T-Annotator è uno strumento avanzato progettato per parallelizzare l'annotazione del trascrittoma, riducendo drasticamente i tempi di attesa e facilitando l'elaborazione di grandi trascrittomi, in particolare quelli eucariotici con ampi dataset.

Utilizza un'architettura HPC per l'annotazione parallela delle trascrizioni, gestendo simultaneamente piĂą attivitĂ  tramite un sistema a code (workload manager jobs).

HPC-T-Annotator Preview
Vedi su GitHub →

BioSwiftAnalytics

BioSwiftAnalytics offre una suite di notebook Jupyter per semplificare l'analisi dei dati biologici, con strumenti per la ricerca trascrittomica e genomica. Supporta la generazione di report completi, la visualizzazione degli hit rate, la creazione di diagrammi di Venn e l'analisi dei risultati BUSCO. Grazie all'uso di Docker e Jupyter Notebook, BioSwiftAnalytics garantisce un ambiente modulare e facilmente replicabile, riducendo la complessità dell'installazione e della gestione delle dipendenze. Gli utenti possono eseguire analisi bioinformatiche avanzate senza preoccuparsi della configurazione dell'ambiente, beneficiando di un'infrastruttura scalabile e portatile. BioSwiftAnalytics è progettato per ricercatori, bioinformatici e biologi computazionali, offrendo un'interfaccia interattiva che accelera il workflow analitico.

BioSwiftAnalytics Preview
Vedi su GitHub →

Waste Image Classification

In questo progetto, presentiamo un approccio avanzato basato sull'apprendimento profondo (deep learning) per la classificazione dei rifiuti utilizzando il Real Waste Dataset, un dataset disponibile pubblicamente su Kaggle che comprende 4.752 immagini suddivise in nove categorie. Grazie a tecniche avanzate di deep learning, tra cui il transfer learning con modelli pre-addestrati, l'uso di tecniche di data augmentation e la progettazione di una rete neurale convoluzionale (CNN) personalizzata, il nostro lavoro mira a proporre soluzioni innovative per questa importante sfida.


Su questo link è disponibile un articolo che descrive il progetto.

Waste Image Classification Preview
Vedi su GitHub →

📝 Pubblicazioni

HPC-T-Annotator: an HPC tool for de novo transcriptome assembly annotation

BMC Bioinformatics, 2024

Un tool innovativo per l'annotazione parallela di trascrittomi che sfrutta architetture HPC per ridurre i tempi di elaborazione da giorni a ore, mantenendo alta accuratezza nei risultati.

Bioinformatica HPC Transcriptomics

📜 Certificazioni

Introduzione al Machine Learning

Kaggle • Emesso Feb 2023
Mostra credenziale

Pandas

Kaggle • Emesso Feb 2023
Mostra credenziale

Data Science for Bioinformatics

Deep Learning Italia • Emesso gen 2023
Mostra credenziale

Fondamenti di Python

HackerRank • Emesso Set 2020
Mostra credenziale

CISCO CCNA

Cisco Networking Academy • Emesso Set 2019

🎓 I miei corsi

Corso Machine Learning Introduzione

Machine Learning: Introduzione

Questo corso offre un'introduzione ai concetti fondamentali e alle applicazioni del Machine Learning.

Corso Algoritmo K-Nearest Neighbors

Machine Learning: Algoritmo K-Nearest Neighbors (KNN)

Guida completa all'algoritmo K-Nearest Neighbors (KNN), concetti teorici e implementazioni pratiche in Python.

📬 Contatti

Email lorenzo.arcioni2000@gmail.com
Apri la chat su WhatsApp

đź“… Puoi anche prenotare una consulenza gratuita di 30 minuti direttamente dal calendario qui sotto. Scegli il giorno e l'orario che preferisci tra quelli disponibili!