会議や備忘録的にスマホ等で音声レコーダーを使ったことがある方は、「これ文字起こししてくれたら楽だな」と思った事はないでしょうか?
iFLYTEK VOITER SR502Jは、そんな「あったらいいな」を叶えてくれる高精度な音声認識技術を搭載したAIライティングボイスレコーダーです。
iFLYTEKは、AIボイスレコーダーでは非常に有名な企業で、雑音環境での音声認識国際コンテストで4年連続1位を獲得しています。それはトップレベルの雑音除去技術があるためで、その技術を使い、AI翻訳機やAI補聴器、ボイスレコーダーといったデバイスを販売しています。
そしてこのiFLYTEK VOITER SR502Jボイスレコーダーは、会議や講義の内容、インタビュー、言った言わないを避けたいシーンなどで活躍する多機能なデバイスで、AIにより自然な文章で文字起こしをしてくれるデバイス。この面白いAIレコーダーを2週間ほど使ってみました。
iFLYTEK VOITER SR502Jは、6つのマイクと2つの指向性マイクのトータル8つのマイクで最大10m/360度から集音。雑音除去技術が高い為、電車の中、駅の雑踏でも話者を見分けるそうです。
カメラで撮影しながら字幕自動生成したり、文字起こしした内容を話者毎に自動で振り分けたり、議事録としての体裁を整えてくれたりと、ICレコーダーでこれができたらいいなをワンストップで提供するデバイスです。
製品名 |
iFLYTEK VOITER SR502J
|
種類 |
AI ボイスレコーダー
|
音声認識 |
高精度音声認識(日本語・英語対応)
|
リアルタイム文字起こし |
Wi-Fi/SIMカード接続時対応
|
録音モード |
会議、講演、取材、メモなど
|
マイク |
2つの指向性マイク、6つの無指向性マイク(最大集音距離10m)
|
ディスプレイ | 3.5インチ |
ストレージ |
内蔵16GB、クラウド10GB
|
カメラ | 800万画素 |
バッテリー | 2500mAh |
充電 |
Type-C充電(5V/2A)
|
接続 |
Wi-Fi(2.4GHz帯)、Bluetooth4.2、4G SIM (4Gバンド B1/3/8/41)
対応キャリア : au / docomo / 楽天 / ahamo / softbank(iPhone用のみ) の音声用プランです。その他のキャリアは未検証です(2023年2月時点)。またAPN設定にも対応しておりません。 |
*iFLYTEK様よりお借りしてのレビューです
開梱と外観
同梱物は、iFLYTEK VOITER SR502J本体と、SIMカードトレイピン、USB Type-Cケーブルです。
マニュアルは電子版のみでQRコードにアクセスして確認するタイプ。
マニュアルには、充電規格など細かく書かれています。
本体前面、ディスプレイと6つのマイク、そして上部にある2つの指向性マイクのトータル8つのマイクが搭載れ、シーンに合わせて360度から、最大10mの範囲で音声を拾います。
上部の指向性マイク部分。
底面にはUSB Type-C端子。
左側には録音ボタンとボリューム。尚録音ボタンはダブルクリックで即録音可能。
右側は電源ボタンとSIMカードトレイがあります。但し4G通信はAPN設定非対応と書かれていますので、事実上利用不可という事になりそう。ネットワークが基本必要な為、WiFiか、スマホでテザリングが必要です。
背面は800万画素のカメラです。
使ってみた
初期セットアップ後に起動するとこのような基本画面となります。
会議、講演、取材、標準、カメラとありますが、どのモードを選ぶかでマイクがその状況に最適化されます。
カメラは動画録画しつつ字幕を付けるモードで利用できます。
テスト的にYouTubeから自動文字起こししてみました。
iFLYTEK VOITER SR502Jは、一旦リアルタイムで自動文字起こししてくれます。
そして録音が終了したデータをクラウドに自動アップロードし、そこでAIにて更に精度の高い自然な文章にしていくという流れになります。クラウドにアップロードする段階でネット回線が必要ですが、録音して仮の自動文字起こしまではネット回線無しでOKなので、ひとまず録音だけしたいという事は可能です。
ちなみに英語も可能。
完成した文字起こしはメールで送信も可能。ちゃんとセキュリティに配慮され、メールには7日間だけ利用可能なダウンロードリンクが提供されます。
但しテキストファイルとなるので、このままでは多少読みづらい。しかし自分用メモとしてなら全然OKですけどね。
複数/多数の人が話す場合は、後述する話者毎の会話に振り分けてくれるRECORDER STATIONで編集も含めてやるのが良いでしょう。
RECORDER STATIONで議事録作成が簡単
iFLYTEK VOITER SR502Jは、専用Webサイト「RECORDER STATION」にて、発話者の振り分けや、編集、議事録化ができるようになっています。VOITER SR502J利用者であれば、10GBまでのクラウドスペースが提供されます。
アップロードした音声ファイルはこちらからチェックができ、音声ファイルを確認しつつ、修正が可能という文字起こしや細かい議事録を書く方にはもってこいの機能となっています。
続いて話者の数を選択します。そこにいた人数を入れる事で、自動文字起こしした文章を、話者ごとに分離してくれます。
すると以下のように、話者毎に発言を分離してくれます。例えば講演会で2人が話す内容を文字起こししたいというようなケースでは、この話者毎に分離してくれる機能はとても助かります。
以下、Abemaの討論の部分を文字起こしさせてみたものですが、かなり早口にも関わらず、ぼぼしっかりと文字化してくれています。”ダイヤ”と書かれているのが、実際は”代案”と発していた内容であったりと、完璧ではありませんが、それでも9割方は文章化してくれているので、全部1から文章化する手間を考えれば、これで十分。
もちろん音声も同時に聞けるので、違うとこだけちょちょっと手直しすれば良いので楽です。
編集が終わったら保存でき、ダウンロードとしてテキスト形式か、議事録形式、音声ファイルダウンロードも選べます。
議事録形式は、以下のように配信し易いよう、議事情報編集が可能。
これを設定すると、議事録として以下のような形式となり、会議参加者への配信も簡単です。
話者を5人に増やしても振り分けてくれる
雑音に強い! との事なので、ガヤガヤしているファミレスに5人で行く事があったので、試してみました。
周りもちょうど横に小さいお子さんがいてうるさい昼頃のガストだったのですが、しっかりと話者毎に分離させて記録してくれています。(内容はしょーもない会話ですが、ワラワラワラって話したのが、ちゃんと笑笑笑と入るのが凄い)
こんな感じで簡単に自動文字起こししてくれるので、例えば何かの契約とか、言った言わないを回避したい場合から、長いミーティング等で後から見返したいけど録音だと1から聞かないといけないからだるいというゆうなケースまで、”とりあえず録っとく”事で、あとはほぼお任せで文字起こししてくれるので便利です。
総括
iFLYTEK VOITER SR502Jを2週間程度使ってみましたが、AIってこういう使い方が良いよねと感じられるデバイスだと言えます。
AIが得意な分野を活用して、機能として統合している為、自然な文章、話者分離機能などで、ICレコーダーを利用する人が「こういうのが欲しかった」を実現しています。
難点をしいて挙げるなら、AI処理された文章や話者分離は数分時間が掛かることぐらい。
録音時に即時文字起こしはしますが、クラウドアップロードしてAI処理された文章のほうが自然になります。
文字起こしを即座にして欲しい場面は無くはないですが、数分でこれだけ処理してくれれば充分です。
私は以前居た会社のプロジェクトリーダーのサブだったのですが、2時間の他社打ち合わせ会議の文字起こしを議事録として配信するというアホみたいな事をやっていました。それは他社内部の関係者が多数いて会議不参加者にも会議の内容が分かるようにというリーダーの一存だったのですが、多少の要約はあれど、一字一句間違いなく文字起こしするには4時間ぐらい掛かっていました。あの時、このiFLYTEK VOITER SR502Jがあればと、心底思います。
ゼロから文字起こしするより、9割方は数分で文字起こし化されている状態ですから、議事録等で話者毎に分離したいなどのケースでは絶対あれば便利にアイテムです。
価格
今は5%オフクーポンが利用可能です。