DeepEval testing LLM: pytest con test case per Answer Relevancy, Faithfulness e Hallucination, soglie numeriche e barre di stato
Langfuse observability LLM: dashboard con la timeline di una trace, span annidati per retrieval e generation, indicatori di token, costo e latenza per ogni step, e una sezione laterale con gli score di evaluation
Vanna text-to-SQL: pattern RAG che traduce una domanda in linguaggio naturale in query SQL eseguibile sul database
Illustrazione editoriale del paradigma Reinforcement Learning: un agente stilizzato attraversa un labirinto isometrico seguendo un percorso luminoso verso una reward, mentre le etichette state, action e reward formano il loop di feedback con l'ambiente. Immagine di copertina del post di AiBerto su come funziona il Reinforcement Learning, MDP, Q-learning e casi d'uso reali da AlphaGo a RLHF.
schema diagnostico con le quattro metriche RAGAS disposte su due assi (retrieval e generation), ognuna con un indicatore rosso/verde, e frecce che puntano al componente della pipeline responsabile quando la metrica è bassa
confronto prima/dopo: a sinistra una chat con quattro correzioni successive (No, uso Streamlit / No, preferisco Altair / No, layout wide), a destra una chat che produce il risultato giusto al primo colpo grazie al rules file
Confronto success rate modelli piccoli Phi-3 vs Qwen2.5-Coder: generazione vs editing di codice, grafico a barre con modalità generazione da zero (41% e 29%) e modifica di codice esistente (73% e 61%), delta percentuale evidenziato
Diagramma della pipeline RAG a due stadi: bi-encoder che seleziona 20 candidati e cross-encoder che li riordina a top-5, con un chunk che risale dal quarto al primo posto
schema della pipeline RAG completa: documento PDF entra in docling, esce come chunk strutturati, vengono indicizzati in ChromaDB via embedding, la query dell'utente recupera i chunk più simili, il prompt assemblato con contesto va a Qwen 7B in 4-bit, e l'output è la risposta finale
diagramma concettuale del passaggio da prompt engineering manuale (frecce circolari scrivi-testa-riscrivi) a DSPy (Signature → Module → Optimizer → prompt ottimizzato)