Inferenz-Workloads müssen dominieren, sonst werden sich all die Investitionen in diese großen Modelle nicht wirklich auszahlen.