最終更新日:2024-10-01
文字起こしアプリなら、音声データを自動でテキストデータに変換してくれるため、メモ書きや手入力の手間がかかりません。どんなサービスがあって、どんな機能やメリットがあるのか、わかりやすく紹介します。
文字起こしアプリとは、会議や商談、取材といった様々なシーンにおける会話内容を音声認識機能やAIの力で自動でテキスト化することのできるアプリです。
たとえば、リアルな会議であれば、文字起こしアプリをインストールしたスマホやPCに音声を読み取らせるだけ。オンライン会議なら、アプリをWeb会議ツール(ZoomやGoogleMeetなど)に連携させるだけ。それだけで、「誰が何を話したか」話者と会話を読み取って、リアルタイムで表示してくれます。
また、録音データはクラウドタイプであれば、Webを通じていつでも聞き返すことができ、文字起こししたものも別途Wordやtxtなどに出力・編集可能。製品によっては、ワンクリックで会議の参加者・欠席者に共有したり、どんな発言が多かったかなどを分析したりできるものもあります。
現在では、個人利用にとどまらず、企業の議事録作成・編集など幅広いシーンで利用されています。
[1]個人向け文字起こしアプリ
[2]企業向け文字起こしアプリ
[3]無料の文字起こしアプリ
[4]安価・手軽な文字起こしWebサービス
記事後半にはタイプごとにサービスの詳細も取り上げています。「今すぐツール選定に移りたい」という方は上記リンクから該当箇所をご覧ください。「もう少し詳しく知りたい」という方はこのまま読み進めてください。文字起こしアプリの選び方・比較ポイントについて、わかりやすくご紹介しています。
文字起こしアプリをお探しの方は、こちらからサービス紹介資料をダウンロードいただけます。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
話したことが自動でデータ化されると言っても、中には以下のような心配・不安を感じる方もいらっしゃるでしょう。
確かに、かつてはそのような誤りも見受けられましたが、近年のAI技術の高まりを受け、現在ではどのアプリも高精度の音声認識が期待できます。音声がクリアに拾える環境で、かつ専門用語を含まない一般的な内容であれば、9割程度は正確に再現可能。専門用語やよく使う言葉を登録することで、更に精度を高められるアプリもあります。
速度に関しても、たとえば、1時間のインタビューを録音データを聞き返して手動で文字起こしした場合、1.5〜2時間(8,000〜12,000文字程度)はかかりますが、文字起こしアプリなら、わずか数秒〜数分で完了。別途ツールを使う必要もなく、文字起こしたデータをそのままアプリ上で共有・編集することで業務の大幅な短縮化が見込めます。
まず、文字起こしアプリにはどのような機能が搭載されているか、利用することで、どのようなメリットが期待できるか、について紹介します。
文字起こしアプリには様々な機能が搭載されています。
音声認識 | 会話内容を聞き取って、テキストデータに変換する |
---|---|
ケバ取り | 「えー」「ああ」など会話内容と関係ないな発声を自動で除外 |
話者識別 | 複数人でも「誰が何を話したのか」自動で識別する |
そのほかの便利機能(ツールによって一部差があり)
議事録作成 | 変換されたテキストデータを識別した話者ごとにまとめる |
---|---|
議事録共有 | 作成した議事録をURL送信などでリアルタイムに共有できる |
議事録編集 | マーカー・見出し・要約文作成、共同編集など |
発言管理 | 特定のキーワードへのアラートや、頻度などを可視化 |
単語登録 | 専門用語や会社名・人名を辞書登録することで精度を向上 |
多言語対応 | 日本語以外の言語にも対応して自動で読み取って文字起こし |
自動翻訳 | 読み取った言語を、ボタンひとつで別の言語に翻訳可能 |
上記のような機能を用いることで、これまでの文字起こしがどのように変わるのか。メリットとしては、以下のような点が期待できます。
メリットの多い文字起こしアプリですが、上手く利用していくためには、いくつか注意点もあります。
対面のclosedな空間での、少人数の打ち合わせ・インタビューなら、ほとんどの文字起こしアプリが問題なく対応できます。一方で「声のボリュームが小さい」「部屋が広い」「参加者が多い」などの場合は、読み取り精度が低下する恐れがあります。オンライン会議の場合は、イヤホンマイクやヘッドセットを、リアル会議では外付けのマイクを利用する、複数設置するなど環境を整備する必要があります。
一般的な会話は問題ありませんが、固有の商品名・サービス名、業界・企業特有の言い回し、略称などの「専門用語」に関しては、音声はクリアでも聞き取れない恐れがあります。その場合は、読み取りできなかった部分を事後的に辞書登録してAIに学ばせるなど、運用面での工夫が必要となります。
文字起こしアプリは、用途や提供形態により、以下4つのタイプに分けられます。
[1]個人向け文字起こしアプリ
[2]企業向け文字起こしアプリ
[3]無料の文字起こしアプリ
[4]安価・手軽な文字起こしWebサービス
以下、それぞれのタイプについて、どのような場合に向いているのか。どのような特徴があるのか説明していきます。自分で利用するとしたらどのタイプになるのか考えてみましょう。
スマホに専用アプリをインストールするだけで、その日から気軽に利用できる、「個人向け」に適したタイプです。安価な料金で取材や会議の内容が自動でテキスト化できる一方、ファイル共有や議事録作成・編集の機能は備えていない場合が多く、プロジェクトなど複数人での利用には適していません。
サービス名 | 特徴 | 料金 |
---|---|---|
Speechy Lite | 88以上の言語をサポート。文字起こしだけでなく外国語の発音練習にも有用。 | 1,500円(PRO版) |
Notta | タグ付け機能・キーワード検索機能など多彩な編集機能を搭載。 | 月額2,000円 (月30時間) |
Texter | 音声以外に画像や動画からも音声・会話を抽出して文字起こし可能。 | 月額3,000円 (月10時間) |
デバイスには主にPC(デスクトップアプリ・Webブラウザ)を利用して、音声認識や編集作業を行うタイプです。ファイル共有のほか、マーカー・共同編集など編集機能に長けたものが多く、セキュリティ環境も整っていることから、企業の議事録作成などで多く利用されています。一般的には「議事録アプリ」と呼ばれることが多いタイプです。
サービス名 | 特徴 | 料金 |
---|---|---|
スマート書記 | 専用エディタで議事録作成工数を最大90%削減可能。 | 月額10,000円〜 |
YouWire | 議事録の他、顧客への重要事項説明、営業時の応対品質の確認などで活用。 | 要問い合わせ |
YOMEL | Web会議・対面会議問わず、ワンクリックで議事録作成(自動話者識別)。 | 月額28,000円 (月30時間)〜 |
AI議事録取れる君 | 小見出しや箇条書きで内容を自動要約。会議を開催するだけで議事録作成可能。 | 要問い合わせ |
AI GIJIROKU | 金融・法律・医療・保険など、業種別音声認識機能で高精度の読み取り可能。 | 年額32万7,800円 (月1,000分) |
ZMEETING | オンライン・オフラインどちらにも利用可能。「えっと」など不要語句も自動で除去。 | 要問い合わせ |
無料ながらも、音声認識・話者識別に加えて、議事録編集機能などを備えたアプリ。[1]の個人向けでは頼りないが、[2]のような本格的なアプリを利用するほどではない、という場合におすすめです。多くはβ版として提供された無料版のため、コストをかけずに、それなりに機能が充実したものを利用したいという場合にはおすすめです。
サービス名 | 特徴 | 料金 |
---|---|---|
Speechnotes | Googleの高性能な音声認識エンジンを利用した音声入力ツール。 | 無料 |
CLOVA Note β | LINEが提供する無料文字起こしアプリ。話者が複数いる場合も聞き分け可能。 | 無料 |
ユーザーローカル 音声議事録システム |
文字起こしの他、頻発単語や感情分析などで、会議の見える化に貢献。 | 無料 |
Group Transcribe | Microsoftが提供する多言語対応に長けたiOSアプリ(オンライン利用は不可)。 | 無料 |
アプリではありませんが、ネット環境さえつながっていれば、どこでも利用できる便利なWebブラウザ型の文字起こしサービスです。多くは、音声データなどを事後的に読み込ませて文字起こしするタイプのため、これまでICレコーダーやスマホで録音したデータがたくさんあるという場合にもおすすめです。
サービス名 | 特徴 | 料金 |
---|---|---|
RIMO Voice | テキストを選択することでピンポイントに該当部分の音声を聞き返すことが可能。 | 音声22円/30秒 |
文字起こしさん | 医療、IT、介護などの専門用語の多い文字起こしにも対応可能。 | 月額2,000円 (月10時間) |
textfromtospeech | 音声からテキスト、その逆のテキストから合成音声にも対応可能。 | 無料 |
最後にアプリの具体的な検討ポイントをご紹介していきます。基準となるのは「用途」「利用状況」「利用頻度」「利用デバイス」の4つです。以下、具体例を交えて説明します。
「文字起こしさえできればいい」のであれば、音声認識さえできれば十分なので個人向けのスマホアプリ([1])がおすすめです。「議事録作成・編集まで利用したい」のであれば、議事録機能やセキュリティに長けた企業向けの[2][3]のアプリがおすすめです。議事録作成が煩雑になる場合は豊富なエディター機能を備えた「スマート書記」のようなアプリが最適です。
会議中のリアルタイム翻訳を希望するなら、多言語の読み取りだけでなく、同時翻訳まで可能なサービスがおすすめ。たとえば、「AI議事録取れる君」は16カ国語に対応可能。「Group Transcribe」はリアルな会議に限りますが、80ヵ国の言語を同時に読み取り・翻訳可能です。母語で会話を行うことで会議の活性化が図れます。
会議だけでなく、商談での利用を考えている場合は、文字起こしや議事録作成だけでなく、会議の内容を可視化・分析できると便利です。
たとえば、進行中のすべての会議・商談を画面上でテキスト閲覧でき、必要に応じてフォローに入れる「YOMEL」や、キーワード出現頻度の変化を分析して効果的なトークを学べる「YouWire」などを用いれば、組織全体の営業教育の効率化が期待できます。中には「ZMEETING」のように、個々の声から感情を認識できる機能を備えたものも。
少人数ならスマホ1台でも足りますが、大人数で行う場合には「誰が何を言ったのか」AIが話者を識別してくれる機能があると便利です。また、広いスペースで行う場合には外部接続マイクの利用が必要です。最近では、中央に設置して1台で対応してくれるマイクスピーカーが登場しています。利用人数に合ったものを選ぶようにしましょう。
Web会議を利用する場合は、Microsoft TeamsやZoom等の「Web会議ツールと連携できるか」、もしくはそこで録音(録画)したMP3・WMA・WAVなどの「音源データを読み込ませられるか」をチェックしておきましょう。たとえば、「AI GIJIROKU」はZoom連携すると、会話をリアルタイムで字幕表示できます。
会話中に特定の人名や専門用語が多数登場する場合、通常仕様だと読み取りが難しくなります。その場合は、一つずつ単語登録できる「辞書機能」やAIに覚え込ませる「機械学習機能」などがあると便利です。そのほか、「AI GIJIROKU」のように金融・法律・医療・保険など業種別音声認識をあらかじめ搭載しているものを利用すれば、設定いらずで高精度の読み取りが期待できます。
アプリは利用時間に応じた定額月額料金体系をとっているもの、もしくは、読み込む音声の長さによって料金が変わる従量課金制をとっているもの、2つに分かれます。企業によって「月にどれくらい利用するのか」は異なるので、1時間・1分あたりの料金を計算してコスパの良いものを選ぶようにしましょう。
できるだけ「コストをかけたくない」という場合は、無料のアプリを第一選択肢に、その上で手軽に利用できる従量課金の文字起こしWebサービスをスポット的に利用するといいでしょう。たとえば、「RIMO Voice」は30秒22円、つまり1時間なら2,640円で対応可能です。音声データをWeb上にアップロードするだけなので簡単です。
文字起こしアプリによって、「iPhoneアプリ(iOS)しかない」「androidアプリしかない」という場合もありえます。特に個人向けの文字起こしアプリにはその傾向が強いため、もしスマホをメインで利用する場合、対応したアプリがリリースされているかどうかチェックしておきましょう。
なお、PCで利用する場合、Webブラウザからログインして利用するのであれば問題ありませんが、もしPCアプリで利用を考えているのであれば「WindowsかMacか」OSによってアプリが存在しない場合があるので注意が必要です。
(出所:Speechy Lite公式Webサイト)
対応デバイス:スマホアプリ(iOS)
有料版のProバージョン(買い切り1,500円)なら、時間制限なしで利用可能。会議の記録、インタビューや会話内容のデータ化、そのほか、アイデアのメモなど幅広い用途で利用可能。音声で認識された会話を任意の言語に翻訳することもできる(88以上の言語をサポート)。外国語学習の発音練習にも利用可能。
(出所:Notta公式Webサイト)
対応デバイス:スマホアプリ(iOS・Android)・Webサービス
リアルタイムの会話だけでなく、録音済みの音声ファイルをインポートするだけでデータ化(1時間を5分程度)。データ化されたものはタグ付け機能やキーワード検索機能を使ってスピーディーに編集可能(句読点も自動で挿入)。編集データはtxt、docx、srt、pdfファイルとして保存できる。文字起こし結果は42言語への翻訳に対応しており、国際会議や研修のサポートにも活用されている。
(出所:Texter公式Webサイト)
対応デバイス:スマホアプリ(iOS)
音声だけでなく、画像や動画からも音声・会話を抽出して文字起こし可能。リアルタイム翻訳のほか、データをSNSやほかのアプリを通じて共有することもできる。プランは利用時間によって異なり、Free(無料・1分)、Premium M(月1,500円・月3時間)、Premium M+(月3,000円・月10時間)、Premium Y(年契約7,400円・月10時間)の4種類。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
(出所:スマート書記公式Webサイト)
累計5,000社以上の利用実績を持つ議事録支援サービス。録音・メモ・聞き直し・清書など、一連の流れすべてを1つの画面で完結できる。議事録作成に特化した専用エディタで議事録作成工数を大幅に削減可能(最大90%)。そのほか、決定事項・ToDoサマリー自動抽出、日・英の自動AI文字起こしなど機能充実。機密性の高さにも定評があり、機密情報を多数取り扱う金融機関やメーカーなどの上場企業にも採用実績あり。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
(出所:YouWire公式Webサイト)
オフィス電話の通話録音、携帯・スマホの通話録音、対面会議の音声議事録、Web会議の音声議事録の4つをクラウド上で一元管理できる録音システム。会議の議事録作成以外にも、顧客への重要事項説明の証拠、営業時の応対品質の確認などで活用可能。営業やオペレーターについて、会話でよく使われるキーワード、キーワードの出現頻度の変化、部署ごとの出現頻度などの分析を通じて、より効果的なトークやスキル、ユーザーニーズのチェックなども行える。SFAやCRM、コールセンターのCTIシステムとの連携も可能。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
(出所:YOMEL公式Webサイト)
独自開発した高精度のパーソナライズド音声解析AIによる議事録作成ツール。Zoom、Meet、Teamsなど、利用中のWeb会議ツールを変更することなくそのまま利用でき、対面会議にも対応可能。ワンクリックで全参加者の発言をテキスト化し、参加人数を問わず、すべての発言者を自動で識別。発言内容をワンクリックで転記し、要点をまとめることもできる。
すべての会議・商談の内容をリアルタイムで把握できる機能や、特定のキーワードが発せられた際にアラート通知を送れる機能、商談相手が発したキーワードをトリガーに、あらかじめ設定しておいたカンペを表示できる機能など、新人のフォロー・教育に役立つ機能を豊富に備える。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
(出所:AI議事録取れる君公式Webサイト)
オンライン会議や対面打ち合わせの文字起こしや録音を高精度AIがサポートする議事録作成ツール。発話者ごとに音声を自動でテキスト化し、小見出しや箇条書きで内容を自動要約できる。Zoom、Microsoft Teams、Google Meetと連携すれば、会議を開催するだけで発話の記録や議事録作成を自動化。
「単語登録機能」で専門用語や固有名詞を登録することで、音声認識の精度を高められる。「自動翻訳機能」では、90カ国以上の国と地域の発話を、日本語を含めた主要な16カ国語に翻訳。発言ごとに原文と翻訳結果が一緒に表示されるので、多言語ミーティングもスムーズだ。
その他、会議の参加者全員で編集できる共同編集機能や、重要な会話をピックアップして記録するブックマーク機能、作成した議事録の共有リンク発行機能など、編集・共有機能も充実している。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
(出所:AI GIJIROKU公式Webサイト)
AIが会議の参加者を判別し、自動で録音・記録・修正、更に翻訳まで行ってくれる(30カ国語)。ZOOM連携の場合は、発言を字幕表示できるため、会話を可視化して理解を深めるのに役立つ。特筆すべきは、金融・法律・医療・保険など、業種別音声認識を備えており、業種に合わせて高精度の読み取りができるところ。
企業向け有料プラン「チーム」を利用すれば、年額32万7,800円で、月間1,000分、全機能を利用可能。議事録を修正するごとに企業・利用者に合わせてパーソナライズドされるため、使えば使うほど使いやすくなるのもポイント。
(出所:ZMEETING公式Webサイト)
産業技術総合研究所発のベンチャー企業が開発した国産ツール。音声認識AIが発話者を分別した上で、90%以上の精度でリアルタイム文字起こし。会話時の「えっと」なども自動で除去可能。Zoom、Microsoft Teamsなどを利用したオンライン会議のほか、録音した音源を読み込ませることで対面での会議・商談についても対応可能。感情認識機能やAI要約機能など多様な機能を搭載しているため、議事録作成以外にも、商談・顧客対応など様々なシーンでの活用が期待できる。
待機室機能や認証要求、退出機能、クラウド外保存など様々なセキュリティ対策機能を搭載しているため、セキュリティに厳しい企業でも安心して導入できるのもポイント。
「できるだけコストをかけたくないけど、それなりに機能が充実したものが使いたい」という場合に、無料で手軽に利用できるおすすめのアプリをご紹介します。
(出所:Speechnotes公式Webサイト)
Googleの音声認識機能を使った文字起こしアプリ。文章と文章の間に長い休止時間があってもマイクオフ(中断)せずに使い続けられるのが特徴。ロングインタビューや長文の口述などにに最適。会話だけでなく、「ピリオド」や「まる」など発声すれば句読点や記号も音声入力可能。文字起こしされたテキストは編集可能。基本はAndroid向けのスマホアプリだが(iOSは対応していない)、Google Chromeの拡張機能としてインストールすれば、PCでも利用できる。
(出所:CLOVA Note β公式Webサイト)
LINEが提供する無料文字起こしアプリ。毎月300分の利用時間が無料提供され、スマホアプリでは時間無制限で使える。アプリをインストールしたスマホ・タブレットの録音ボタンを押すだけで簡単に利用可能。話者が複数名いる場合でも聞き分けられるため、ビジネスシーンでの議事録作成にも有効。ブックマーク機能やキーワード検索を利用すれば、音声ファイルを聞き直す作業も不要に。録音した音声とtextデータは別途ダウンロード可能。ほかのアプリやソフトでの編集や共有にも活用できる。
(出所:ユーザーローカル音声議事録システム公式Webサイト)
マイク入力した声を、話者を識別して音声認識でデータ化。文字情報はそのままCSVでダウンロード可能。編集機能は備えていないが、「とりあえず、イチから文字起こしする手間を省きたい」という場合にはおすすめ。そのほか、「どんな単語がよく発言されているか」を調べたり、ユーザーの発言ごとに感情を分析し「どのような感情が含まれるのか」を可視化したりすることもできる。「会議を見える化したい」という場合には最適。
(出所:Group Transcribe公式Webサイト)
Microsoftが無料で提供する、対面会議用の文字起こしiOSアプリ。日本語以外にも会話の多言語化に長けており、80カ国の言語に対応可能。会議の参加者は、Aさんは英語、Bさんが日本語というように、それぞれの言語でセッション設定して会話をスタートするだけ。リアルタイムで「誰が何を言ったか」瞬時に拾って翻訳して文字起こしして、手元のスマホに表示してくれる。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
(出所:RIMO Voice公式Webサイト)
日本語に特化したAIで自動文字起こしができるツール。録音済み音声を読ませるだけでなく、リアルタイムでの音声入力も可能。音声ファイルだけでなく、動画ファイルにも対応。1時間の音声データなら5分前後。音声データと文字データがシンクしているため、修正が必要な部分も簡単に聞き返せるのが魅力。ChatGPTの活用により、テキストの要約もスピーディー。PC・スマホに対応したシンプルな画面も特徴で直感的な操作が可能。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
(出所:文字起こしさん公式Webサイト)
Web上のフォームにデータをアップロードするだけで利用できるWebサービス。文字起こしするデータは音声だけでなく、動画・画像ファイルも利用可能。音声認識エンジンを領域ごとに選択できるようになっており、専門用語がよく使われる医療、IT、介護などの文字起こしにも対応可能。英語、中国語、日本語、韓国語、ドイツ語、フランス語、イタリア語など約30言語に対応。
(出所:textfromtospeech公式Webサイト)
無料で利用できるオンライン文字起こしサービス。その場で話したことをリアルタイムで文字起こし可能。ユニークなのは、入力したテキストデータを音声に変換できるところ。読み上げ音声はクリアで、自然な発話に近い。口述筆記や聴覚障害者とのやりとり、そのほか、30カ国語以上に対応しているため多言語間のコミュニケーションにも有用。登録すれば音声以外にも、動画の読み込みにも対応可能。
近年のAIの進化に伴い、実用性が高まっている文字起こしアプリ。限られた空間での少人数の会議・打ち合わせなら、どのアプリもほぼ問題なく、高精度の自動文字起こしが可能です。
その一方、「声を拾いにくい」「参加者が多い」「Web会議で利用する」「専門用語が飛び交う」という場合は環境を整えるなど精度を向上させる工夫が必要です。アプリを選ぶ際には「用途」「利用状況」「利用頻度」にあわせて、最適なアプリを選ぶようにしましょう。
ある程度、タイプを絞り込んだ上で、「発言の割り振り」「セキュリティ」「Web会議システムとの連携」「専門用語の読み取り」など優先順位をつけながら比較検討していくとスムーズです。
文字起こしアプリをお探しの方は、こちらからサービス紹介資料をダウンロードいただけます。
利用規約とプライバシーポリシーに同意の上、
資料をダウンロードしてください。
【累計5,000社以上の利用実績】議事録などのあらゆるドキュメント作成に関する作業を自動化・効率化するAI議事録サービス。90%以上の高精度文字起こし、AIによ...
利用規約とプライバシーポリシーに同意の上、資料をダウンロードしてください。
オフィス電話の通話録音、携帯・スマホの通話録音、対面会議の音声議事録、Web会議の音声議事録の4つの音声をクラウド上で一元管理できる録音システムです。音声認識に...
利用規約とプライバシーポリシーに同意の上、資料をダウンロードしてください。
Web会議や対面会議など、あらゆる会議をワンクリックで議事録作成。連携設定等も一切不要で、自動で話者の識別まで実行。...
利用規約とプライバシーポリシーに同意の上、資料をダウンロードしてください。
文字起こしや録音、翻訳をAIがサポートする議事録自動作成ツール。AI自動要約や共同編集、メール展開など編集・共有機能も充実。社内会議や商談などの記録作成を効率化...
利用規約とプライバシーポリシーに同意の上、資料をダウンロードしてください。
日本語に特化したAIエンジンを搭載し、高速かつ高精度な文字起こしを実現する議事録ツール。動画のアップロードや各種オンライン会議アプリとの連携による文字起こしにも...
利用規約とプライバシーポリシーに同意の上、資料をダウンロードしてください。
アスピックご利用のメールアドレスを入力ください。
パスワード再発行手続きのメールをお送りします。
サービスの導入検討状況を教えてください。
ご登録いただいているメールアドレスにダウンロードURLをお送りしています。ご確認ください。