推論最適化

LCM蒸留による推論5倍高速化の実装と検証（後編）

📌 はじめに前回の記事では、Stable Diffusion v1.5 と LoRA ファインチューニングを組み合わせたアニメキャラクター生成システム（v1.5）を完成させました。しかし実運用上、約13.25秒/画像（float32 推定）...

2026.03.01

画像生成

LLM【事前学習：実装詳細B-６】

Transformer進化系とスケーリング最適化：ALBERT, GQA, Flash Attentionの革新オリジナルのTransformer（2017年）から7年、多くの革新的な改良が積み重ねられてきました。本記事では、現代の大規模L...

2026.02.04

実装詳細