TechFeed
  • playlist_add_check Channels

ELYZA-tasks-100 でLLM14個の日本語性能を横断評価してみた
ARANK

TL;DR14個の「日本語が話せるLLM」(日本製・外国製問わず)の性能を、日本語データセット ELYZA-tasks-100 で横断評価しました海外勢70Bモデルの性能が高いことがわかりました…

qiita.com a year ago
Related Topics: AI
arrow_back
open_in_new Open page
https://qiita.com/wayama_ryousuke/items/105a164e5c80c150caf1
  • Blog
  • Frequently Asked Questions
  • Feedback
  • Terms of service
  • Privacy Policy
  • Posting guidelines
  • Special thanks
  • About Company
© 2025 TechFeed Inc.