紹介:Hume AIは、感情知能を備えたマルチモーダルAIを構築し、あらゆる音声を理解し生成する共感AI研究ラボです。
記録日:6/4/2025
リンク:
Hume AI screenshot

Hume AIとは?

Hume AIは、感情知能を備えたマルチモーダル人工知能の構築に特化した共感AI研究ラボです。EVI 3(共感音声インターフェース)やOctaveテキスト読み上げなどの高度なAIモデルを提供しています。EVI 3は、ユーザーの音声を処理し、自然で表現豊か、かつ感情知能を備えた応答を生成する音声言語モデルであり、あらゆるカスタムデザインの音声とパーソナリティで話すことができます。Octave TTSは、単語の意味的文脈を理解し、感情的な表現と話し方を予測・制御できるテキスト読み上げシステムです。Hume AIは、洗練された感情認識型の音声および表現機能をアプリケーションやプロジェクトに統合したい開発者、コンテンツクリエーター、研究者向けに設計されています。

Hume AIの使い方

ユーザーは、Hume AIのEVI 3プレビューをiOSアプリを通じて操作でき、プロンプトによってカスタマイズされたAI音声とチャットできます。開発者やコンテンツクリエーター向けには、Hume AIはEVI 3(近日公開予定)およびOctaveテキスト読み上げのAPI、さらに表現測定モデルを提供しています。利用を開始するには、開発者はプラットフォーム上でHumeアカウントを作成し、APIキーへのアクセス、使用状況の監視、製品の探索を行うことができます。サポートと統合ガイダンスのために、包括的なドキュメントと開発者コミュニティが利用可能です。このページには具体的な料金詳細は記載されていません。

Hume AIの主な機能

共感音声インターフェース (EVI 3): 自然で表現豊か、かつ感情知能を備えた音声および言語応答を生成します。

カスタム音声とパーソナリティデザイン: プロンプトを使用して、特定のパーソナリティを持つユニークなAI音声を作成します。

Octaveテキスト読み上げ (TTS): 意味的文脈を理解し、感情的な表現と話し方を予測・制御します。

マルチモーダル表現測定: 4つのモダリティにわたる数百の次元で感情表現を測定するためのAPI。

開発者プラットフォーム: アカウント管理、APIキーアクセス、使用状況の監視を提供します。

包括的なAPIドキュメント: ガイド、チュートリアル、詳細なAPIリファレンスを提供します。

開発者コミュニティ: コラボレーション、サポート、知識共有のためのハブです。

Hume AIの使用例

感情知能を備え、自然な会話能力を持つAIアシスタントやチャットボットの開発。

ポッドキャストのホスト、教師、バーチャルキャラクターなど、様々な役割のためのカスタムAI音声の作成。

メディアやエンターテイメント向けに、表現豊かで感情の機微に富んだオーディオコンテンツを生成。

ユーザーエクスペリエンス向上のため、感情理解をアプリケーションに統合。

研究やアプリケーション開発のために、異なるモダリティにおける感情表現を分析・測定。

より人間らしい音声インタラクションでアクセシビリティツールを強化。