Plutôt cool. Le modèle complet tourne (lentement, c'en est comique) sur une carte ESP32-S2 de 6 ans avec PSRAM SPI externe — j'ai dû désactiver le watchdog de la tâche idle.
==================== ATOME on SILICON ==================== chip : ESP32-S2 rev v0.0 cores=1 flash : 4 MB PSRAM : 2048 KB (detected) model : 276655 bytes embedded in flash config : d=256 layers=8 head=64 seq=128 state=811 KB --------------------------------------------------------- prompt: Once >>> upon a time, there was a little girl named Lily average: 0.1 tok/s | heap low-water: 243 KB internal