【レアジョブ英会話】Geminiにレッスン音声を読み込ませてみよう!

レアジョブ英会話ではレッスン音声の自動録音機能が、2022年10月1日から提供されています。

今までレッスン音声活用方法としては、レッスン時に聞き取れなかった箇所を再生して確認する程度でした。

今回ご紹介する内容は、レッスン音声をGeminiに読み込ませて、会話形式で文字起こししてみようというものです。

Geminiにレッスン音声を読み込ませるには、レッスン音声を音声ファイルにダウンロードしないといけないので、その辺りのことも共有できたらなと思います。


レアジョブ英会話は、2007年に創業を開始、累計会員数100万人以上、5,000万回以上のレッスンを提供し、講師数6,000人以上を誇る国内最大級のオンライン英会話サービスです

今なら会員登録(無料)をいただくと、2回(1回25分間)の無料体験レッスンと日本人カウンセラーに学習相談ができます。

広告

レアジョブ英会話

レッスン音声のダウンロード方法

  • レアジョブ英会話にログインします。


  • レッスンの終わったレポートから「詳細を見る」をクリックします。

  • レッスン詳細に遷移したら、右クリックで「検証」をクリックします。

  • Elements(要素)タブで、Ctrl+f(検索)を押し、「audioData」で検索します。

  • 上記で検索したaudioタグのsrcをコピーします。

  • 上記でコピーしたURLをブラウザのURL入力欄に入力し、アクセスします。

  • 三点メニューからダウンロードをクリックします。(ファイル名は自分で決められるので、「日付_○○先生.mp3」など適当に付けてください)

Gemini

Geminiでレッスン音声を読み込ませるには

  • 下記のURLにアクセスし、ログインします。
https://aistudio.google.com/app

  • +ボタンから「Upload File」を選びます。

  • ダウンロードしたmp3ファイルを選択します。


  • ファイルが読み込まれました。

プロンプト(対話形式で文字起こし)

  • 「Type something」に
    「2人の話者の対話形式で、インプット音声をすべて英語で文字起こしをしてください。(2人の話者は、話者Aと話者Bとしてください。また、話者ごとに改行してください。)」
    と入力します。


  • 「Run」をクリックすると、プロンプトが実行されます。


出力例

こんな形で出力されます。

Geminiのすごさ

Gemini1.5 Flash では、1時間あたり最大100万トークンのストレージが無料で扱うことができます。
さらに、Gemini1.5 Pro では、1時間あたり200万トークンのストレ-ジが有料で扱うことができます。

専門用語が登場してすごさがよく分からない方がおられると思いますが、何がすごいのかを説明したいと思います。

まずはトークンって何?

「トークン(Token)」とは、自然言語処理の分野で使われる用語で、テキストを意味のある最小単位に分けることを指します。例えるなら、トークン(Token)は文章の中の「こまかいパズルのピース」のようなものです。たとえば、文章「私は学校に行きます」をトークン(Token)化すると、「私」「は」「学校」「に」「行き」「ます」というように細かく分けられます。

AI の大規模言語モデル(LLM)が、文章をトークンと言う最小単位に分けることで、意味や構文を理解しやすくしているようです。

参考URL

トークン(Token)とは?-AI関連の用語集【クラベルAI】-

100万トークンってどれくらいすごいの?

GPT-4やGPT-4oでおよそ12万トークン扱うことができるので、100万トークンと言うことはおよそ8倍のトークンを扱うことができます。

あのGPT-4やGPT-4oのおよそ8倍の情報量を読み込ませることができるってすごいですよね。(2025年2月現在)

実際には、100 万個のトークンは次のようになります。
・50,000 行のコード(1 行あたり 80 文字として)
・過去 5 年間に送信したすべてのテキスト メッセージ
・平均的な長さの英語の小説 8 冊分
・平均的な長さのポッドキャスト エピソードの文字起こしが 200 件以上

1時間あたり英語の小説を8冊分読み込ませることができる、しかも無料でですよ。。

Googleさんはとんでもないものを開発してくれました。

参考URL

長いコンテキスト  |  Generative AI on Vertex AI  |  Google Cloud

以下のサイトでは、労働安全衛生法のテキストをxml形式で読み込ませて、文書の修正や改善を行うことをGeminiで行っています。

100万トークン入力できるAI、Gemini 1.5 Proを使って超長文の文書について質問してみる | 製造業の生成AI活用・自動化推進に役立つメディア

まとめ

Geminiにレッスン音声を読み込ませる方法を解説してきましたが、いかがだったでしょうか?

レッスン音声の活用方法がいまいち分からず、あまり活用できていなかった方も、この方法を使えばうまく活用できそうな気がしませんか?

英語を多読練習しようと思っても内容が難しすぎて(調べる箇所がたくさんありすぎて。。)、全然進まないってことが僕はありました。

だけど、自分が話した英語とそれをフォローしてくれるチューター(先生)さんの会話なら、何度も読んでみたいと思いませんか??

英語が伸び悩んでいる僕みたいな方の参考になれば幸いです。

最後までお読みいただきありがとうございました。

広告

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


ABOUT US
ぽむ
はじめまして! ぽむ と申します。 Java、Kotlin (Android)、VBAなどの開発経験があるITエンジニアです。 備忘録として始めたブログですがみなさまのお役に立てたら光栄です。 英語など IT 以外の話題にも触れていこうと思っています。 詳しい自己紹介についてはこちら! よろしくお願いします。