llama.cpp Adds Gemma 4 Audio, Speculative Decoding & Ollama Agent Boost Local AI

Llama.cpp Adds Gemma 4 Audio, Speculative Decoding & Ollama Agent Boost Local AI Today's Highlights Recent advancements in local AI include llama.cpp gaining multimodal audio processing capabilities for Gemma 4 models, significantly enhancing their versatility on consumer hardware. Additionally, speculative decoding has shown remarkable performance boosts for Gemma 4 31B, while a new open-source CLI agent, LiteCode, empowers developers to leverage local Ollama models for coding with pre-execution diffs. Audio Processing Lands in llama-server with Gemma 4 (r/LocalLLaMA)