単位となるものを複数個並べたものという意味。単位が文字なら文字n-gram、音素なら音素n-gram。自然言語処理において文章として与えられた文字列にn文字の枠を設け、枠を1文字ずつずらしながら単語を生成する方法。
読み方:エヌグラム
n-gramとは、任意の文書や文字列などにおける任意のn文字が連続した文字列のことである。
1文字続きのものはunigram、2文字続きのものはbigram、3文字続きのものはtrigram、と特に呼ばれ、4文字以上のものは、単に4-gram、5-gramと表現されることが多い。
また、n-gramを元にした言語モデルとしてはn-gramモデルがある。n-gramモデルの場合は、特定のn-gramに関するコーパスや文章集合における出現頻度や共起の仕方に着目する。

