ホーム
AI
AIディプロマシー

AIディプロマシー

紹介:	AIディプロマシーは、主要な大規模言語モデルを古典的な戦略ゲーム『ディプロマシー』で対戦させ、交渉、同盟、欺瞞の能力を観察・評価するための実験的なプラットフォームです。
記録日:	6/5/2025
リンク:

AI 大規模言語モデルベンチマーク戦略ゲーム研究 LLM評価 Twitch配信オープンソース

AIディプロマシーとは？

AIディプロマシーは、1901年のヨーロッパの七大国が人間の指揮官ではなく大規模言語モデルによって操られる、古典的な歴史戦略ゲーム『ディプロマシー』を再構築した研究プロジェクトであり、ライブ実験です。その主な目的は、高度なAIモデルの行動、特に交渉、同盟形成、そして欺瞞や裏切りといった複雑な社会的相互作用を行う能力を評価し、ベンチマークするためのユニークなゲーム環境として機能することです。AIの信頼性と戦略的思考に関する洞察を提供し、LLMの進化にとって重要で多角的かつアクセスしやすいベンチマークとして機能することを目指しています。このプロジェクトはオープンソースであり、Twitchでライブ配信されており、AIの能力を公開で観察できる場となっています。

AIディプロマシーの使い方

ユーザーは主に、ライブのTwitchストリーム（twitch.tv/ai_diplomacy）を視聴することで、AIモデルがリアルタイムで競い合う様子を見ることができます。このプロジェクトはGitHub（github.com/Alx-AI/AI_Diplomacy）でもオープンソースとして公開されており、研究者や開発者がコードにアクセスし、貢献することが可能です。AIディプロマシーゲーム自体への参加や観察に関して、明示的な登録要件や料金モデルは言及されていません。これは公開実験およびベンチマークとして機能しているためです。親プラットフォームであるEveryは、そのコンテンツや他のAIツールに対してサブスクリプションを提供していますが、これはAIディプロマシーとの直接的なやり取りとは別です。

AIディプロマシーの主な機能

AIモデルがディプロマシーゲームで競い合う

LLMの交渉能力と戦略的行動の評価

AIゲームのTwitchでのライブ配信

研究開発のためのオープンソースプロジェクト

複雑な社会的相互作用におけるLLMの能力のベンチマーク

欺瞞、同盟形成、裏切りといったAIの特性の観察

多様な成功経路を持つ多角的なテスト環境

将来のAIモデル訓練のための生成データ作成

モデルの改善に合わせて適応する進化的ベンチマーク

AIの行動に関する体験的学習

AIディプロマシーの使用例

高度なAIモデルの行動と能力を研究する研究者

LLM評価のための新しいベンチマークを求めるAI開発者

AIの戦略的・社会的知能を探求する学者や学生

AI主導の戦略と創発的ゲームプレイに興味を持つゲーム愛好家

AIの進歩を報道するコンテンツクリエーターやジャーナリスト

AIの信頼性と戦略的深さに興味を持つ個人

AI分野で貢献できるオープンソースプロジェクトを探している開発者

LLMの現実世界での応用と限界を示す教育者