Compressed Whisper large-v3-turbo to 368 MB with Q3_K-matched QAT — multilingual WER results
▲ 17 r/GreeceDevs+3 crossposts

Compressed Whisper large-v3-turbo to 368 MB with Q3_K-matched QAT — multilingual WER results

I’ve released Orbination Whisper AI, an experiment in compressing Whisper large-v3-turbo into a compact multilingual speech-to-text engine.

The default model is 368 MB using Q3_K quantization and runs through a Go runtime built on whisper.cpp, with no Python required at runtime. It supports CPU/GPU backends and includes CLI + HTTP server modes.

I focused on reducing the train/inference mismatch by training with the actual ggml Q3_K quantize/dequantize path in the forward pass, using a straight-through estimator and teacher distillation. The goal was to make the exported Q3_K checkpoint behave like the model seen during training, rather than fine-tuning first and losing accuracy after quantization.

WER on held-out FLEURS, using beam search in the deployed Go runtime:

- Q3_K, 368 MB: EN 0.065, ES 0.050, FR 0.065, EL 0.148
- Q4_K, 474 MB: EN 0.062, ES 0.048, FR 0.063, EL 0.124
- Q5_K, 574 MB: EN 0.061, ES 0.047, FR 0.061, EL 0.110
- FP16 upper bound, 1.6 GB: EN 0.061, ES 0.046, FR 0.060, EL 0.108

The interesting part for me is that the high-resource languages stay close across precisions, while Greek shows the biggest sensitivity to quantization.

Repo:
https://github.com/amichail-1/Orbination-Whisper-AI

I’d be interested in feedback from people working with Whisper, whisper.cpp, QAT, or multilingual ASR deployment.

u/antonismix36 — 3 days ago

We did it Orbination AI Local v0.0.1

Today I want to share the first numbers.We did it.
Orbination AI v0.0.1 is real, our first early-stage coding model, trained with only ~8B tokens, already showing measurable results on the same n=2000 benchmark suite against Falcon-E and Microsoft BitNet.
It fits on a laptop.
It is still early.
But the direction is now proven.
In our country, not everyone understands yet what we are building. I hope the global AI community will.
This is only the beginning.

u/antonismix36 — 15 days ago
▲ 1 r/GreeceDevs+1 crossposts

Έφτιαξα ένα AI tool για την ελληνική αγορά ,θα ήθελα feedback για product

Καλησπέρα σας ,

Έχουμε φτιάξει ένα λογισμικό το οποίο είπαμε να ξεκινήσουμε να επικοινωνούμε για να μπορέσουμε να μαζέψουμε πληροφορίες και feedback για να το βγάλουμε στην αγορά

https://youtu.be/J5wxvY-8nXA

Το Orbinarion AI Agentic Suite
Είναι ένα tool το οποίο χρησιμοποιεί το subscription σας στο Claude ή Codex και με δικό του routing κάνει πιο αποδοτική την δουλειά.

Ενα βασικό στοιχείο είναι ότι έχει General Knowledge
Πχ μαθαίνει τι είναι η mongodb και πως δουλεύει και αποθηκεύει στην μνήμη του την πληροφορία, επόμενος σε επόμενες εργασίες ανατρέχει στην γενική μνήμη .

Και επίσης έχει την Project Knowledge μια κατηγοριοποιημένη μνήμη για bugs, infra, service που είχατε κατά την διάρκεια της εργασίας , έτσι δεν επαναλαμβάνει τα ίδια λάθη .

Μαζί με ένα browser και ένα debugging system το AI κάνει μόνο του debugging πριν σας απαντήσει.

Και άλλα πολλά tools που κάνουν την εργασία πιο εύκολη και γρήγορη και πιο αποτελεσματική.

Επίσης real-time xlsx,doc, excel editing

Πείτε μας την γνώμη σας , καλή ή κακή μας ενδιαφέρει πολύ

u/antonismix36 — 1 month ago