推論最適化

画像生成

LCM蒸留による推論5倍高速化の実装と検証(後編)

📌 はじめに前回の記事では、Stable Diffusion v1.5 と LoRA ファインチューニングを組み合わせたアニメキャラクター生成システム(v1.5)を完成させました。しかし実運用上、約13.25秒/画像(float32 推定)...
実装詳細

LLM【事前学習:実装詳細B-6】

Transformer進化系とスケーリング最適化:ALBERT, GQA, Flash Attentionの革新オリジナルのTransformer(2017年)から7年、多くの革新的な改良が積み重ねられてきました。本記事では、現代の大規模L...