月10時間までの文字起こしが無料で可能な #Gladia.io はWhisperよりもスゴイ?

https://www.gladia.io/

2024年9月現在、一ヶ月10時間までは無料で使える。

Googleのアカウントのままですぐに利用できる。

Gradia.ioは、AIを活用した文字起こしおよび翻訳サービスを提供するプラットフォーム

音声ファイルやビデオファイルから自動的にテキストを生成することが可能であり、特に多言語対応が強みである。高精度な文字起こしに加えて、AI翻訳や編集機能も備えており、ユーザーが異なる言語でのコンテンツ作成を容易に行うことができる。また、直感的なインターフェースが特徴で、メディア業界やマーケティング、教育分野などで幅広く利用されている。

Gradia.ioは、特にコンテンツ制作者やビジネスユーザーに向けて設計されており、会議、インタビュー、ウェビナーなどの記録作業に適している。

音声のURLリンク 例えばYoutubeなども…

https://www.youtube.com/watch?v=oupdlvNhdAM&t=86s

約1時間のラジオ番組収録の文字起こし  6分15秒の映像

そして、こちらを『KNNジェネレーター』を経由して要約

■会話型のトークから論点を抽出

「AIによる創造性」と「権利ビジネス」の融合がもたらす新たな世界について、4つの論点を提唱したい。

まず、AIが一冊の本や楽曲、歴史的な音楽家から学習し、オリジナルのコンテンツを生成できるようになったらどうなるか。例えば、古今和歌集を学習したAIが、ユーザーのリクエストに応え、和歌を詠むようなものである。これまでのサブスクリプションサービスは、既存のコンテンツを利用する権利を提供するものだったが、AIがコンテンツを生成する権利を提供するサービスが出現する可能性がある。

次に、教育分野への影響だ。既にAIによる学習支援ツールが登場しているが、将来的には、数学の教科書を学習したAIが、個人の理解度に合わせた解説やアドバイスを提供し、学習者が自ら勉強する必要のないレベルに達する可能性がある。

さらに、エンターテインメント分野も無縁ではない。ビートルズのような著名なアーティストの楽曲や、ポール・マッカートニーのライブ体験などをAIを通じてサブスクリプションサービスで提供し、アーティストに直接収益が還元されるような権利ビジネスが生まれるかもしれない。

最後に、歴史的な事例として、モーツァルトやプッチーニの時代を振り返りたい。モーツァルトは宮廷音楽家から独立し、コンサートや楽譜の販売で収入を得ようとしたが、早世した。一方、プッチーニはオペラという新たなエンターテインメントを創造し、フランチャイズ化することで大きな富を得た。AIによる創造性と権利ビジネスの融合は、こうした歴史的なエンターテインメントビジネスの変革を促す可能性がある。

このように、AIがコンテンツを生成する権利ビジネスは、教育、エンターテインメントなど、様々な分野にインパクトを与え、我々の生活を大きく変革する可能性がある。権利ビジネスの展開次第では、クリエイターやアーティストが経済的に安定し、より創造性豊かな活動に専念できる環境にもなるだろう。この新たな世界を実現するためには、社会全体がAIの可能性を理解し、権利の在り方について共感と議論を深めていく必要がある。

 

□音声ファイルもあれば、自動文字起こし

■リアルタイムの文字起こしが画期的!

なんといっても、リアルタイムの文字起こしは、新たなアイデアプロセッシングとなる。

音声のURLから文字起こし、記事を読み上げて、感想を述べて、生成AIでまとめるなどもできる。

 

OpenAIのオープンソースの『Whisper』を使っているけれども、そのWhisperをファインチューニングしているという。

その名も 『whisper zero

https://www.gladia.io/whisper-zero