ElevenLabsは、交通騒音、風、群衆などの複雑な背景ノイズを除去することを約束する、人工知能ベースのオーディオ処理ツールをリリースしました。その目的は、高価な機材や管理された環境を必要とせずに、プロのスタジオの品質に近いクリアな音声を抽出することです。
AIによる音声分離の仕組み 🎧
この技術は、人間の声と環境音を区別するために、数千のオーディオサンプルで訓練されたディープラーニングモデルを使用します。周波数をカットする従来のフィルターとは異なり、このシステムは音響スペクトルをリアルタイムで分析し、干渉を除去して音声信号を再構築します。結果として、残響や残留歪みのない、会話のみが残るファイルが生成されます。
風がスタジオのささやきのように聞こえる時 🎙️
このツールは非常に効果的で、工事現場の真ん中や高速道路のそばでポッドキャストを録音しても、防音ブースにいるかのように聞こえるでしょう。ただし、使用には注意が必要です。猫の鳴き声を録音すると、システムはそれを背景ノイズとして扱い、容赦なく除去します。あなたのペットはインターネットでの名声を得る機会を失うことになります。