「プルーニング」は、精度の低下をできるだけ低く抑えながら、過剰な重みを排除するプロセスである。最も単純なプルーニングは、「細粒度プルーニング」と呼ばれ、結果としてスパース型の重み行列になる。
ほとんどのニューラル ネットワークは、特定の精度を達成するために、冗長性が高く、過剰にパラメーター化されている。「プルーニング」は、精度の低下をできるだけ低く抑えながら、過剰な重みを排除するプロセスである。

最も単純なプルーニングは、「細粒度プルーニング」と呼ばれ、結果としてスパース型の重み行列になる。AI プルーナーは「粗粒度プルーニング」を採用している。これは、ネットワークの精度に大きく寄与しないニューロンを排除する手法である。

