BlogBlog
Practical, honest writing on tiny LLMs, ternary models, and on-device AI — every claim backed by the open repository.Des articles concrets et honnêtes sur les petits LLM, les modèles ternaires et l'IA embarquée — chaque affirmation est étayée par le dépôt open source.
Edge AIIA embarquée
Most “tiny” LLMs need megabytes of RAM. Here is the real memory math for running a language model on an STM32, RP2040 or ESP32 — and what actually fits in 256 KB.La plupart des « petits » LLM réclament des mégaoctets de RAM. Voici le vrai calcul mémoire pour faire tourner un modèle de langue sur un STM32, un RP2040 ou un ESP32 — et ce qui tient réellement dans 256 Ko.
ComparisonComparatif
A side-by-side comparison of TinyLlama, llama2.c, TinyMaix and Atome against real microcontroller RAM and flash budgets — with an honest verdict on what fits a $2 MCU.Un comparatif de TinyLlama, llama2.c, TinyMaix et Atome face aux vrais budgets RAM et flash des microcontrôleurs — avec un verdict honnête sur ce qui tient sur un MCU à 2 $.
ExplainerDécryptage
Ternary weights let a trained language model fit in flash. Here is what 1.58-bit BitNet quantization means, why it is fast on a microcontroller, and what it costs in accuracy.Les poids ternaires permettent à un modèle de langue entraîné de tenir dans le flash. Voici ce que signifie la quantification BitNet 1,58 bit, pourquoi c'est rapide sur un microcontrôleur, et ce que cela coûte en précision.
Honest resultsRésultats honnêtes
A two-directional benchmark of a ternary tiny LLM against a vanilla FP32 transformer: a clear 60K-parameter win, a clear 944K-parameter loss, and why the reversal matters.Un benchmark bidirectionnel d'un petit LLM ternaire face à un transformeur FP32 classique : une victoire nette à 60K paramètres, une défaite nette à 944K, et pourquoi ce renversement compte.
EngineeringIngénierie
How a ternary language model runs on ESP32 and STM32 through a heap-free C99 engine — and why bit-exact Python-to-C parity matters for shipping edge AI you can trust.Comment un modèle de langue ternaire tourne sur ESP32 et STM32 via un moteur C99 sans tas — et pourquoi la parité bit-exacte entre Python et C compte pour livrer une IA embarquée fiable.
Use casesCas d'usage
A grounded look at what a kilobyte-class on-device language model is genuinely good for — command parsing, anomaly flags, intent routing — and three things it cannot do.Un regard concret sur ce à quoi un modèle de langue embarqué de classe kilooctet sert vraiment — analyse de commandes, détection d'anomalies, routage d'intention — et trois choses qu'il ne peut pas faire.
ArchitectureArchitecture
Why the Atome C engine allocates nothing at runtime, talks to nothing, and what a zero-heap, air-gapped language model buys you for privacy, security and reliability.Pourquoi le moteur C d'Atome n'alloue rien à l'exécution, ne communique avec rien, et ce qu'un modèle de langue sans tas et isolé apporte en confidentialité, sécurité et fiabilité.
Hardware guideGuide matériel
A per-chip fit guide for running a language model on a microcontroller, using Atome's measured RAM and flash budgets across STM32, RP2040 and ESP32-S3.Un guide de compatibilité par puce pour faire tourner un modèle de langue sur un microcontrôleur, à partir des budgets RAM et flash mesurés d'Atome sur STM32, RP2040 et ESP32-S3.
GuideGuide
Privacy, latency, cost and reliability trade-offs between running a language model on the device and calling a cloud API — a practical guide for embedded product teams.Confidentialité, latence, coût et fiabilité : les compromis entre exécuter un modèle de langue sur l'appareil et appeler une API cloud — un guide pratique pour les équipes de produits embarqués.
OpinionOpinion
A five-point test for any “runs on the edge” LLM claim — RAM fit, flash fit, heap-free, reproducible, measured not estimated — applied honestly, including to Atome.Un test en cinq points pour toute affirmation de LLM « qui tourne sur l'edge » — tient en RAM, tient en flash, sans tas, reproductible, mesuré et non estimé — appliqué honnêtement, y compris à Atome.