Prompt processing/prefill can even get some speedup from local NPU use most likely: when you&#x...

zozbot234 • today at 10:19 AM • 0 replies • view on HN

Prompt processing/prefill can even get some speedup from local NPU use most likely: when you're ultimately limited by thermal/power limit throttling, having more efficient compute available means more headroom.

alt Hacker News