日本語に特化した大規模言語モデル（生成AI）を試作

日本語に特化した大規模言語モデル（生成AI）を試作
ARANK

国立研究開発法人情報通信研究機構（NICT(エヌアイシーティー)、理事長: 徳田英幸）は、ユニバーサルコミュニケーション研究所データ駆動知能システム研究センターにおいて、独自に収集した350 GBの日本語Webテキストのみを用いて400億パラメータの生成系の大規模言語モデルを開発しました。今回の開発を通し、事前学習*4用テキストの整形、フィルタリング、大規模計算基盤を用いた事前学習等、生成系の大規模言語モデル開発における多くの知見を得ました。

nict.go.jp 3 years ago

Open page

https://www.nict.go.jp/press/2023/07/04-1.html