Google Meet はすでにクラウドで AI ノイズ キャンセリングを備えています: これがこの興味深い機能の仕組みです

Google Meet は、クラウドベースの AI ノイズ キャンセリングの展開を開始しています。この機能を使用すると、会議中の煩わしい騒音 (ペンのカチカチ音、椅子の移動音、ドアの音、家の周りの人の音など) をすべて取り除くことができます。この機能は最初に G Suite アカウント ユーザー向けにデプロイされましたが、機械学習によるサウンドのキャンセルについて話しているため、 Google がどのようにしてこれを実現したのかを知るのは非常に興味深いです。

G Suite の製品管理ディレクターである Serge Lachapelle 氏は、VentureBeat でAI を使用したこのアクティブ ノイズ キャンセリング システムがどのように機能するかを説明しました。これがどのように実現され、このテクノロジーをリアルタイムで機能させるための背後にあるすべての作業とメカニズムが非常に興味深いからです。

見てみると…
成功した可能性のある 10 の Google アプリ

機械学習を使用してリアルタイムにノイズを分析する

Google Meetのノイズキャンセリング

Lachapelle 氏によると、Google は 2017 年からこのメカニズムに取り組んでいます。すべては、Google がハングアウトの通話品質を向上させるために Limes Audio を買収したときに始まりました。当初からのアイデアは、特に通話参加者が異なるタイムスロットに属している場合に、ビデオ通話を行う際の迷惑なノイズを排除することでした

「それは私たちの会議室からのプロジェクトとして始まりました。私はストックホルムに住んでいます。米国と会うときは通常、向こうでは朝で、ヨーロッパでは夜です。奇妙な騒音がたくさん聞こえます。人々が朝食や夕食を食べたり、家で遅い会議をしたり、子供たちが叫び声を上げたり…本当にすべてが1年半前にこのプロジェクトを引き起こしたのです」とセルジュ・ラシャペル。

Lachapelle 氏によると、これはこれまで一度も行われたことがなく、Google は機械学習専用の追加ハードウェアが必要かどうか明確ではありませんでしたが、後にすべてがソフトウェアで実行できることがわかりました。彼らが最初に行ったのは、アルゴリズムの開発でした。この開発では、Google 自身のチーム (従業員) と、かなりの数の人が話しているように見える YouTube ビデオの両方を使用した、混合ノイズと音声のデータ セットを使用しました。

ネットワーク

アルゴリズム構築の 2 番目のステップは、何がノイズで何がノイズではないかを判断することでした。犬の吠え声、子供たちの声、ドアの音、掃除機の音…削除すべき音とそうでない音を正確に判断するのは複雑であるため、Googleは音の問題はユーザーのニーズを検出しながら常に更新されるとコメントしている。 。

常に課題となるのは、アルゴリズムを変更して、会議中に迷惑になる可能性がある、またはそうでない音を追加または削除することです。 Googleはこれは永久に更新されると言っている

しかし、Google はどのようにして音声とノイズを認識するのでしょうか?私たちが話すとき、私たちの音声はデバイス (Android、iOS、またはコンピューター) から Google のクラウド内のデータ センターに送信され、Google の学習モデルを通過し、再び暗号化されて会議に返されます。つまり、アルゴリズムは音声をリアルタイムで分析します。これはプライバシーの懸念を引き起こす可能性がありますが、シャペル氏は、受信した音声はAIのトレーニングには使用されず、すべてのデータは機密かつ安全に管理されると述べています。

「これらのモデルを実装するには多くの方法があります。一部の方法では、優れたコンピューター、拡張機能、またはより強力なグラフィック カードが必要になります。私たちはそこには行きたくありませんでした。これに電話でアクセスできるようにしたかったのです。いいえ。どのような携帯電話を持っているかに関係なく、ラップトップと同様に、携帯電話も薄型化が進んでおり、CPU に過度の負荷をかけるのは得策ではないため、これをクラウドで実行できないか検討することにしました。

この機能は、G-Suite メンバーに対してデフォルトで有効になります。いつものように、展開は段階的に行われるため、すべてのユーザーに届くまでに数日かかる場合があります。ただし、 Google Meet とそのプレミアム機能は他のユーザーが 9 月まで利用できるため、理論上はこの機能を問題なくテストできるはずです。 Lachapelle 氏によると、「ユーザーが無効化したいものではない」ため、デフォルトで有効になりますが、納得できない場合はいつでも設定から削除できます。

経由 | ベンチャービート

Google Meet はすでにクラウドで AI ノイズ キャンセリングを備えています: これがこの興味深い機能の仕組みです・関連動画