オンラインでリアルタイムに情報をやり取りするのであればビットレートについて基本的な知識を押さえておきましょう。配信された動画の質が悪い時に問題を切り分けて解決しやすくなるので基礎だけでも知っておくことに損はありません。
1.ビットレートとは?計算方法は?
ビットレート(bitrate)とは1秒間に送受信できるbitの量を表します。bitとは2進法で動いている計算機において0か1か判別するデータの最小単位です。
ビットレートの単位はbpsでBit Per Secondの略称です。これは1秒間に送受信できるビット数を表しており、8bpsなら1秒間に8ビットのデータが送受信できることを意味します。
ビットレートの値が大きければ大きいほど、1秒あたりのデータ量が多くなるのです。
なおスマホやPCの容量はビットではなく、おもにバイト(byte)で表示されており、1バイトは8ビットに相当します。
以上がビットとビットレート、バイトとの関係になりますが、ビットレートを計算する方法はやや複雑です。何の目的で何を送受信するのかによって途中式が変わるからです。
映像と音声をリアルタイムで同時に配信する監視カメラを例にした場合、カメラの解像度と色、フレームレート、音声のデータ量が関係します。
動画は複数の静止画が連続したものです。そのため静止画面1枚のデータ量×単位時間当たりの枚数によって必要なデータ量が変わります。
そこで最初に静止画面1枚に必要なデータ量を計算します。
監視カメラの解像度が2000ピクセル×1500ピクセルだった場合、画素数は300万画素となります。さらに色の情報量として24ビットカラーだった場合、300万×24ビットとなり、1画面のデータ量は7200万ビットということになります。巨大な数字ですが72Mbit(メガビット)として簡単に表示できます。
ちなみに、もしこのカメラが1ビットモノクロームカラー(白黒画面)だった場合は300万×1ビット=3Mbpsになります。
次にフレームレートをチェックします。フレームレートの単位fpsはframes per secondの略称で1秒間に処理する画面数を意味します。フレームレートが高ければ高いほどなめらかで高画質な映像になります。今回の監視カメラは計算のため30fpsとします。
この場合1秒間の動画に30枚の静止画像が使われるということですから、72Mbit×30=2,160Mbpsとなります。
ちなみに多くのアニメは1秒24枚で描かれており、30fpsというスペックはかなりハイクオリティだと言えます。高度なビデオゲームの場合は60fpsを要求されることもありますが、通常の監視カメラであれば3~5fpsが主流です。
更に音声録音ができる監視カメラだった場合は音声ビットレートを追加します。これは機器のスペックによって異なりますが、映像に比べると非常に軽いです。今回は1Mbitだとして1秒あたりの動画のデータ量に加算します。
すると合計で2,161Mbps、1秒間に2161メガビットのデータ量が送信される事になります。
2000ピクセル×1500ピクセル×24ビットカラー×30fps+1Mbit(音声)=2,161,000,000bps=2,161Mbps
これは仮の計算とはいえ、異常に重いデータです。1秒で2161メガビットもデータがあるということは1時間の動画にすると約950ギガバイトの容量になります。
2161メガビット/秒×60秒×60分÷8=946.66GB(ギガバイト)
実際に下記のサイトをつかって、この記事を閲覧するためにインターネット接続しているデバイスの回線速度を測定すると数字に実感がわくでしょう。
サービスにもよりますが光回線の速さ(ビットレート)でも800Mbps程度しかないので、2161Mbpsがどれだけ大きなデータか分かるかと思います。
計算上、ありえない容量になってしまった動画ですが、実際どうなっているのかという点は後述するコーデックの解説のチャプターまでお待ちください。
2.ビットレートが高い場合のメリットとデメリット
ビットレートが高いというのは1秒間に送受信できるデータ量が多いことを意味します。高画質な映像を送ることができますし、大量のデータを送る場合はビットレートが高いに越したことはありません。
しかし短時間で大量のデータをやり取りするということは通信容量の消耗が激しく、いわゆる「ギガ」が減りやすくなります。
またいくら高品質な映像をやり取りできるスペックがあったとしても元画像よりもきれいになることはありませんし、何より受け取り側の機器にも高スペックが要求されます。
CPUに負荷がかかるので、高ビットレートを処理できるだけのスペックが無ければ負荷が唸りや発熱という形で現れますし、場合によっては熱暴走する、フリーズするなど不具合が生じます。
ビットレートは高いほうが良いですが、それに見合った回線とパソコンなどの機器が必要です。
3.ビットレートの種類とは
ビットレートの計算の際に順番に触れましたが、ビットレートは画像と音声の2種類に分けられます。
リアルタイムでカメラ映像を受信する場合は映像と音声の両方のビットレートを合算したものが実際に必要な総ビットレート(オーバルビットレート)となります。
機器によっては解像度を調整するなど映像と音声に割り当てるビットレートの比率を調整できるものもあるので実際の映像を見ながら調整するのも良いでしょう。
4.ビットレートと画質や音質との関係
ビットレートが高ければ高いほど高画質・高音質なデータが送信できますが、例え送信側のスペックが高くても相手側の回線が8MbpsのADSLだったら全く意味がありません。
高いビットレートを維持するにはボトルネックとなる問題をすべて排除して、送受信の双方でハイスペックな回線と機器が必要となります。
画質・音質との関係でオンライン動画配信サービスを例にします。
まず大前提として、本当に最高品質の映画を見るにはBD/DVDのメディアが一番です。BDに収録された映画の容量は2時間で約40GB(ギガバイト)あります。
1バイトは8bitなので、これまで計算してきたbitに直すと全データ量は320Gbit(ギガビット)ということになります。
これを動画配信サイトで見ると、映画の画質や音質がかなり圧縮されてクオリティが低くなっていることが分かります。
一例としてAmazonプライムビデオをあげると最高品質で映画をみても1時間当たり5ギガバイト(40ギガビット)程度の容量しか使いません。これは2時間で10ギガバイトですから厳密な計算は抜きにしてBDの半分程度の品質と言っても良いでしょう。
リアルタイムでAmazonプライムビデオの最高品質で映画を見る場合、1時間に40ギガビットのデータをリアルタイムで処理できなければ読み込み時間が発生して、まともに視聴することができません。
つまり、遅延なく動画配信サイトで最高品質の映像をみるのに必要な回線速度は40ギガビット÷60分÷60秒=11Mbpsということです。11Mbps以下の速度しかない回線ではあらかじめ読み込んでおいてから再生する必要があるので、サービス側の品質過剰ということになります。
もちろん品質を落とせば必要な容量が半分以下(中品質:0.6GB/時間程度)になるので、求められるビットレートが少なくて済みます。
0.6ギガバイト=4.8ギガビット=4,800,000,000÷60分÷60秒=1.3Mbps
このようにビットレートが上がれば最高品質の動画や音声をリアルタイムでダウンロードできる反面、要求される環境も高度になるのです。
5.ビットレートとコーデックの関係とは
最初のチャプターで試算したデータ容量は膨大なものになりました。
これが映画やゲームのダウンロードであればリアルタイム性は求められないので、低ビットレートでも時間をかけながら少しずつデータを送受信すれば、大きな問題にはなりません。
しかし監視カメラやオンライン会議のようにリアルタイム性が求められるデータ通信の場合は時間をかけて少しずつデータを送るわけにはいきません。
そこでコーデックが重要になります。
すでにあらゆる音声・映像の処理デバイスにはコーデックが使われており、そのままでは膨大な容量になるデータをエンコード(圧縮)して保存し、デコード(伸長)して再生します。
画素数やフレームレートから計算したビットレートは、あくまでのコーデック前の元データであり、「無圧縮出力」として区別されて、通常は存在しません。
計算結果の膨大なデータ量はコーデック未使用の無圧縮出力状態であり、そのまま使われるわけではないので注意してください。
コーデックの種類によって圧縮率や品質が異なりますが、大抵は20%以下の容量に抑えることができます。
なおコーデックについて詳しくは下記の記事をご覧ください。
6.ビットレートとフレームレートの関係とは
ビットレートを左右する大きな条件がフレームレートです。1秒間にどれだけの静止画を連続しているか決定づけているため、高フレームレートになると一気にデータ量が増えます。
フレームレートが高ければ高いほど滑らかな映像がやり取りできるのです。
ニュース報道などでよく見かけるように、監視カメラの映像がカクカクしているのは3~5fps程度にフレームレートを落としているからです。
7.ビットレートとYouTube動画配信の関係
YouTubeではリアルタイムに動画配信をするYouTube Liveという機能があります。この際、重要なのがエンコーダの解像度・フレームレート、ビットレートです。
何を使って撮影して、どのような条件でYouTubeライブに配信するかという諸条件が重要です。
例えばスマホからでもYouTubeライブは可能ですが、数年前のモデルであるiPhone SEと最新のiPhoneでは動画の画質・音質には大きな違いがあります。具体的にはiPhone SEは120万画素ですがiPhone 11 Pro Maxは1200万画素もあり、ビットレート計算の例に当てはめれば1画面の構成に必要なデータ容量が10倍も違います。
YouTube側はライブの際に自動的に撮影機器を検出して、最適な設定に合わせてくれますが、YouTubeライブの管理画面から手動でビットレートを変更して解像度を調整することができます。
これはデバイスの相性問題もあり、事前の計算ではなかなか調整しづらいので実際にライブ配信をして視聴者から「カクカク」していないか、「遅延」や「音飛び」していないかなど、配信状況を確認しながら調整する必要があります。
問題は撮影デバイス(今回の例ではiPhone)とYouTubeだけでなく、YouTubeから動画を配信されている視聴者の回線やデバイス(パソコン、スマホ、タブレット)がすべて関係してくるので、どうしても配信を見ている人全員に同じクオリティの動画を提供するのは難しいのです。
8.テレビ会議の品質とビットレートとの関係
テレビ会議はYouTubeのようなインターネット回線を使ったサービスとは全く違うシステムで運用されています。
テレビ会議は専用の機器を設置し、ISDNや専用回線を使って特定の相手と直接接続するからです。YouTubeのようなWeb系サービスとは違い、サービス参加者は同じシステムの上で同じ機器を使うので環境による不安定要因がありません。
また提供企業によってメンテナンスされており、多くの場合保守担当者もいるので個別に問題解決しなくても問題が発生したら対応を依頼することができます。
テレビ会議のシステムについて詳細は下記の記事にて解説していますが、機能面では同じに見える二つのサービスは全く違うシステムに基づいて運営されているのです。
ただしシステムが違うからといってデータ送信の問題まで別というわけではありません。
テレビ会議の音声や映像の品質もビットレートに大きく依存します。低ビットレートのテレビ会議システムだと処理速度の問題で声が途切れ途切れになったり、声と映像がずれたり、映像がカクカクしたりします。
これは動画ビットレートや音声ビットレート、フレームレートを下げて送信することでデータ通信量を減らしビットレートを抑えているからです。
インターネット回線だけでなく専用回線を用意したとしても基本的なデータ送信のルールからは逃れられません。
快適に臨場感のあるテレビ会議を行うのなら高ビットレートかつ処理速度の速いシステムを選びましょう。
※1 記載の商品名、サービス名は各社の登録商標または商標です。
この記事の執筆監修者情報
監修者:エヌ・ティ・ティ・ビズリンク株式会社
NTTビズリンクは、企業向けデータセンターサービスを提供する会社として2001年7月にスタートしました。
その後テレビ会議多地点接続サービス事業などの統合により、お客さまのクラウド・アウトソーシングニーズに応える為に、統合的なICTアウトソーシングビジネスを展開してまいりました。 現在、設立以来培ってきたデータセンターサービスとテレビ会議サービスの運用力を強みとして、Communication&Collaboration SolutionsとData Center Integrated Solutionsという新たな事業領域のビジネスを展開しています。
所在地:〒112-0002
東京都文京区小石川1丁目4番1号 住友不動産後楽園ビル
会社概要:https://www.nttbiz.com/company/outline/