Curious which models are you able to run and how many 3090s do they require at scale?

vladgur • yesterday at 10:00 PM • 1 reply • view on HN

mips_avatar • yesterday at 10:20 PM

4 3090s with nvlinks on each pair. Super fast inference on Moe models around 20-36b

alt Hacker News