メインコンテンツにスキップ
すべてのコレクション文字起こし・話者分離・用語登録よくある質問
Q:話者分離の精度を上げるにはどうしたらいいですか?
Q:話者分離の精度を上げるにはどうしたらいいですか?

話者分離の精度をあげるためのコツについて説明します

5か月以上前に更新

A:話者の分離精度を上げるために以下の点に気をつけてください。

話者分離はAIが声の特徴を捉えて自動で話者1, 話者2...と振り分けていきます。そのため、音質がクリアでなかったり、声質の似た方がいると精度が下がりやすくなります。

以下の点を改善することで、話者分離精度を上げることができます。

1.話者分離実行時に正確な話者人数を設定してください

話者分離実行時に話者の人数を正確に設定してください。

ここで設定するのは会議参加人数ではなく、実際に発言した方の人数になります。

設定値に合うようにAIが話者分離を行いますので、誤った人数を指定するとその分精度が下がりやすくなります。

2.なるべく発言が被らないようにお話しください

発言が被ってしまうと、文字起こし結果の1ブロック内に複数名の会話が混在した状態で表示されてしまいます。この状態で話者分離を実行すると、ブロック単位で話者分離が行われるため、複数名の会話を1話者として判別してしまいます。

話者毎に文字起こし結果のブロックが表示されやすくするよう、できるだけ発言が被らないようお話しすることで精度の改善が期待できます。

3.会話と会話の間は、少し間をおいてお話しください

2と同様に、立て続けに会話されると文字起こし結果の1ブロック内に複数名の会話が混在した状態で表示されてしまいます。文字起こし結果は会話と会話の間合いを判断して、ブロックが分かれる仕組みになっていますので、前の人が話した後に少し間隔をおいて発言することで精度の改善が期待できます。

4.発言の音量を均一にしてください

録音音声の音量にバラツキがあると精度が下がりやすくなります。

できるだけマイクと話者の距離を均一に保ち、発言者の音量が同じくらいになるようにすることで精度の改善が期待できます。

こちらの回答で解決しましたか?