情報メディア
目次
応用情報技術者試験(レベル3)シラバス-情報処理技術者試験における知識・技能の細目- Ver. 7.0 に基づき,「情報メディア」の対策ノートを作成した。
マルチメディア技術
- コンピュータにおける文字,音声,画像などの仕組み,特徴,それらを統合して取り扱うマルチメディアの考え方,必要な資源,機能を修得し,応用する。
- 情報の圧縮,伸張の目的,特徴,仕組みを修得し,応用する。
(1) マルチメディア
ハイパメディア
米国の学者テッド・ネルソン(Theodor Holm Nelson)氏が著書「Computer Lib」において 1974 年に提言した情報表現方法で、文字情報主体のハイパーテキストを画像や音声などを含めたマルチメディアに拡張した概念。
ハイパーテキストは互いに関連する情報を含んだ文書同士を相互に関連付ける(リンクする)ことで、読者が関連する情報を次々に辿っていけるようにしたシステムだが、ハイパーメディアでは、文字情報に加えて画像、音声、動画などを含む様々な種類の情報を扱う機能を追加し、これらを相互に対応付けた情報の集合体を表現するシステムである。
ストリーミング(streaming)
ストリーミングとは、通信ネットワークを介して動画や音声などを受信して再生する際に、データを受信しながら同時に再生を行う方式。
オーサリング(authoring)
オーサリングとは、文字や画像、音声、動画などの要素を組み合わせて一つのソフトウェアやメディア作品を製作すること。特に、それをプログラムなどのコード記述を伴わずに行うこと。
PDF (Portable Document Format)
PDF とは、米アドビ(Adobe)社が開発した、どのような環境でも同じように表示・印刷できる電子文書のファイル形式。1993 年に登場し、2008 年には ISO(国際標準化機構)によって標準化された。
PDF は、テキストや画像だけでなく、レイアウトやフォントの情報などもファイルに納めることができる文書表示用のフォーマットで,異なる環境でも正確にオリジナルと同じ表示ができるので、電子文書の配布や長期保存に適したファイル形式である。
演習問題
PDF の特徴として,適切なものはどれか。
- インターネットでの電子文書の配布に適しており,CSS によって表示や印刷のレイアウト制御が行える。
- 使用するフォントを文書ファイルに埋め込むことができ,閲覧や印刷時に使用するコンピュータ環境が異なっても,作成時と同じ字形で表示できる。
- 一つのファイルの中に複数のページが格納でき,各ページは印刷再現性を重視した高解像度のビットマップ画像である。
- ファイル構造は XML の記述形式を用いてレイアウトなどの表示情報をもっており,特定の閲覧ソフトを必要としない。
正解は,2. である。なお,1. は HTML,3. は TIFF 形式の説明である。
DTP (DeskTop Publishing)
DTP とは、出版物や印刷物の原稿作成や編集、デザイン、レイアウト、組版などの作業をコンピュータで行い、最終的に印刷可能な原稿(版下)の作成まで行うこと。
4K 解像度
4K 解像度とは、画面や画像、動画などの表示・構成画素数の通称の一つで、横 4000 ピクセル前後の画素数のこと。
8K 解像度
8K 解像度とは、画面や画像、動画などの表示・構成画素数の通称の一つで、横 8000 ピクセル前後の画素数のこと。
(2) 音声処理
PCM(Pulse Code Modultation : パルス符号変調)
PCM とは、音声などのアナログ信号をデジタルデータに変換する方式の一つ。信号の強度を一定周期で標本化(サンプリング)したもの。そのまま保存すれば無圧縮データとなる。
MIDI (Musical Instrument Digital Interface)
MIDI とは、楽曲データの記述、保存、伝送などの方式を定めた標準規格の一つ。シンセサイザーなどの電子楽器やコンピュータを接続し、楽曲データを送信して自動演奏させるのに使われる。
WAV (Waveform Audio Format)
WAV とは、音声データを記録するためのファイル形式の一つ。Windows が標準で対応している形式として有名で、ファイル名の標準の拡張子は「.wav」。
AIFF (Audio Interchange File Format)
AIFF とは、音声データを非圧縮状態で格納することができるファイル形式の一つ。米アップル(Apple)社が開発したもので、同社の macOS(Mac OS X/旧Mac OSを含む)、iOS などで標準的に利用される。
MP3 (MPEG Audio Layer-3)
MP3 とは、音声データを圧縮する方式およびファイル形式の一つで、動画圧縮方式の MPEG-1 で音声を記録するために策定されたもの。標準のファイル拡張子は「.mp3」。最も普及している音声圧縮形式の一つである。
演習問題
音声などのアナログデータをディジタル化するために用いられる PCM で,音の信号を一定の周期でアナログ値のまま切り出す処理はどれか。
- 逆量子化
- 標本化
- 符号化
- 量子化
正解は,2. である。
アナログ音声をディジタル化する過程では「標本化」「量子化」「符号化」という 3 つの処理が行われる。
- 標本化
- 連続的なアナログ値(振幅、周波数、その他の測定可能な性質)を一定の時間間隔(サンプリング周波数と呼ぶ)で測定して、時系列的に連続でない値(離散値と呼ぶ)にすること。
- 量子化
- 標本化で得られたアナログデータを、離散的なディジタルデータとして近似的に表すこと。例として量子化ビット数が 16 ビットであれば、(1.4 や 9.8 のように)連続的なアナログデータを 65 536 通り(216 通り)のいずれかの整数で近似することになる。
- 符号化
- 量子化で得られたデータを数値化して表現する。
(3) 静止画処理
JPEG (Joint Photographic Experts Group)
JPEG とは、静止画像のデータ圧縮形式の一つ。フルカラーの画像を多少の劣化を伴いながら高い圧縮率で符号化できるのが特徴で、写真など自然画像の記録に向いている。ファイル名の標準の拡張子は「.jpg」あるいは「.jpeg」。
GIF (Graphics Interchange Format)
GIF とは、画像データを圧縮して記録するファイル形式の一つ。256 色までの画像を無劣化(lossless)で圧縮することができ、図やイラストなどの画像に向いている。ファイル名の標準の拡張子は「.gif」。
PNG(Portable Network Graphics)
圧縮による画質の劣化のない可逆圧縮の画像ファイルフォーマットで,GIF よりも圧縮率が高く,現在ではほぼすべてのブラウザでサポートされているため Web ページの画像フォーマットとして使用される。
BMP (Bit MaP)
BMP とは、Windows が標準で対応している画像データのファイル形式の一つ。システムが使用するアイコンなどの画像でよく利用される。
演習問題
ビットマップフォントよりも,アウトラインフォントの利用が適している場合はどれか。
- 英数字だけでなく,漢字も表示する。
- 各文字の幅を一定にして表示する。
- 画面上にできるだけ高速に表示する。
- 文字を任意の倍率に拡大して表示する。
正解は,エ. である。
TIFF(Tagged Image File Format)
画像データを解像度・色数・カラーモデルなどが異なる複数の形式で 1 つのファイルに格納できるファイル形式である。
一つのファイルの中に複数のページが格納でき,各ページは印刷再現性を重視した高解像度のビットマップ画像である。
HEIF (High Efficiency Image File Format)
HEIF とは、静止画像データの圧縮方式および画像ファイル形式の一つ。JPEG の 2 倍程度の高い圧縮効率で画像データを圧縮でき、連続撮影写真や派生画像の保存などにも対応する。標準のファイル拡張子は「.heif」または「.heic」。
Exif (Exchangeable image file format)
Exif とは、デジタルカメラで撮影した画像データに、撮影時の状況や設定などを表す様々な情報(メタデータ)を添付して一緒に保存するためのデータ形式を定めた規格。ファイル形式としては JPEG(JFIF/.jpgファイル)あるいは TIFF(.tifファイル)と共に用いられることが多い。
SVG(Scalable Vector Graphics)
SVG は,ベクター形式の画像やイメージ,テキストなどの 2 次元 CG を XML で表現するための規格である。SVG の記述例を以下に示す。
<svg xmlns="http://www.w3.org/2000/svg" width="150" height="100" viewBox="0 0 3 2">
<rect width="1" height="2" x="0" fill="#008d46" />
<rect width="1" height="2" x="1" fill="#ffffff" />
<rect width="1" height="2" x="2" fill="#d2232c" />
</svg>
上記の記述例を描画すると,以下の図のようになる。
演習問題
W3C で仕様が定義され,矩形や円,直線,文字列などの図形オブジェクトを XML 形式で記述し,Web ページでの図形描画にも使うことができる画像フォーマットはどれか。
- OpenGL
- PNG
- SVG
- TIFF
正解は,3. である。
ディザリング
ディザリング(Dithering)は、描画に使える色数が限られた状態で、より多くの階調を表現するための技法である。ドットパターンを用いて中間色を表現することで、見かけ上の色数を増加させる。
演習問題
表示装置には色彩や濃淡などの表示能力に限界がある。一つ一つの画素では表現可能な色数が少ない環境でも,幾つかの画素を使って見掛け上表示できる色数を増やし,滑らかで豊かな階調を表現する手法はどれか。
- インデックスカラー
- オーバーレイ
- カーニング
- ディザリング
正解は,4. である。
インデックスカラーは、ピクセルごとの色を RGB 値で直接指定するのではなく、あらかじめ用意したカラーテーブルの「何番目の色を使用するか」という参照番号で表示色を指定する方式である。GIF や PNG-8 などで使用されている。
オーバレイは、画像や動画の上に別の画像を重ね合わせて表示させる技法である。
カーニングは、文字間隔が等しく見えるように半角英字同士の間隔を調整する機能である。
(4) 動画処理
MPEG
MPEG とは、動画・音声データの圧縮方式の標準規格を検討するため、ISO(国際標準化機構)と IEC(国際電気標準会議)が 1988 年に合同で設置した専門家委員会。また、同委員会の勧告した規格群の総称。動画・音声データの圧縮方式の標準として広く普及している。
H.264/MPEG-4 AVC
ワンセグ放送などの低速・低画質のものからディジタルハイビジョン TV クラスの高ビットレート用途に至るまで、幅広く利用されることを想定した動画の圧縮符号化に関する規格である。
1 回ごとの差分情報の量を小さくするなどの改良を行うことで、従来から使用されてきた MPEG-2 と比較して 2 倍以上の圧縮効率を実現しており、ワンセグ、テレビ会議システム、インターネット放送、Blu-Ray Disc、YouTube 等の動画共有サービスなど様々な場面で使用されている。
演習問題
H.264/MPEG-4 AVC に関する記述はどれか。
- インターネットで動画や音声データのストリーミング配信を制御するための通信方式
- テレビ会議やテレビ電話で双方向のビデオ配信を制御するための通信方式
- テレビの電子番組案内で使用される番組内容のメタデータを記述する方式
- ワンセグやインターネットで用いられる動画データの圧縮符号化方式
正解は,4. である。なお,1. は RTSP (Real Time Streaming Protocol),2. は SIP (Session Initiation Protocol),3. は電子番組表(Electronic Program Guide : EPG)や電子コンテンツガイド(Electronic Content Guide : ECG)の説明である。
演習問題
ディジタルハイビジョン対応のビデオカメラやワンセグの映像圧縮符号化方式として採用されているものはどれか。
- AC-3
- G.729
- H.264/AVC
- MPEG-1
正解は,3. である。
AC-3 は Audio Code number 3 の略。ドルビーデジタルとも呼ばれ、DVD ビデオなどに記録するのに用いられる音声のディジタル符号化方式である。
G.729 は,人の声を対象とした音声圧縮アルゴリズムで VoIP (Voice over Internet Protocol) 環境で利用されている。
MPEG-1 は,主にビデオCDに1時間程度の動画を記録することを目的に設計された方式である。
H.265 (HEVC : High Efficiency Video Coding)
H.265 とは、動画データの圧縮符号化方式の標準の一つで、広く普及した H.264/MPEG-4 AVC の後継となる規格。2013年1月に ITU(国際電気通信連合)によって勧告された。
QuickTime
QuickTime とは、米アップル(Apple)社による、動画や音声、画像などのデータを統合的に扱うマルチメディア技術のブランド名称。
AVI (Audio Video Interleave)
AVI とは、Microsoft 社が開発した、動画を保存するためのファイル形式の一つ。動画と付随する音声を記録・再生するためのもので、同社の Windows をはじめ様々なソフトウェアが対応している。ファイル名の末尾に付ける標準の拡張子は「.avi」。
Motion JPEG
Motion JPEG とは、静止画像データの圧縮方式である JPEG を応用した動画データの圧縮・記録形式。各フレーム(コマ)ごとの画像を JPEG 形式で圧縮し、連続的に記録していく。
インターレース方式
インターレースとは、画像や映像の記録、伝送、描画の方式の一つで、画素や走査線を上や左などの端から順番に取り扱うのではなく、一定間隔で飛び飛びに取り扱うこと。
プログレッシブ方式
表示装置や読み取り装置などの走査方式の一種で、すべての走査線を順番に表示あるいは読み取って、一度で全面を処理する方式を「プログレッシブ方式」あるいは「ノンインターレース方式」(non-interlace)という。
演習問題
動画やマルチメディアコンテンツのレイアウトや再生のタイミングを XML フォーマットで記述するための W3C 勧告はどれか。
- Ajax
- CSS
- SMIL
- SVG
正解は,3. である。
SMIL (Synchronized Multimedia Integration Language) は、WWW 上でマルチメディアを表現するための XML ベースのマークアップ言語である。通常の HTML と異なり、時間やレイアウトをコントロールすることができる点が特徴で、「○秒経過後に、▲の位置にコンテンツを表示する」といった制御が可能である。
(5) 情報の圧縮・伸張
ZIP
Zip とは、複数のファイルやフォルダ(ディレクトリ)を一つのファイルにまとめて格納するアーカイブファイルの標準的な形式の一つ。ファイル名の標準の拡張子は「.zip」だが、ソフトウェアによって独自の拡張子が与えられていることも多い。ほとんどの場合、格納するファイルをデータ圧縮するため、一般にはファイル圧縮形式の一つとみなされているが、本来は圧縮機能はオプションである。
圧縮率(data compression ratio)
データ圧縮率とは、データを圧縮した際に、圧縮後のデータが元のデータのどのくらいの情報量に減ったかを表す割合。圧縮後の量の元の量に対する割合を 100 倍したパーセンテージで表すことが多いが、削減された量の元の量に対する割合とすることもある。
可逆圧縮(lossless compression)
可逆圧縮とは、データ圧縮方式のうち、圧縮符号化の過程で元のデータを一切毀損せず、完全に元通りに復元できるように圧縮する手法のこと。主にファイル圧縮や通信プロトコルなど、データの種類を特定しない汎用の保存形式や伝送方式で用いられる。
非可逆圧縮(lossy compression)
非可逆圧縮とは、データ圧縮方式のうち、圧縮符号化の過程でデータの一部の欠落や改変を許容することで極めて効率よく圧縮する手法のこと。非可逆圧縮されたデータを展開(解凍)しても元のデータには完全には一致しない。
ランレングス
ランレングス圧縮とは、最も基本的な圧縮アルゴリズムの一つで、連続して現れる符号を、繰り返しの回数を表す値に置き換える方式。圧縮によって内容を損なわない可逆圧縮を行う。
マルチメディア応用
- マルチメディアシステムの特徴,マルチメディア応用の例を修得し,応用する。
(1) グラフィックス処理
① 色の表現
② 画像の品質
① グラフィックスソフトウェア
(2) マルチメディア応用
コンピュータグラフィックス(CG)
コンピュータによって動画像の政策や画像合成などを行うコンピュータグラフィックス(CG : Computer Graphics)は,映画やテレビのアニメーションのほか,科学分野におけるシミュレーション動画など実写が不可能な画像制作に利用される。
演習問題
コンピュータグラフィックスにおける,レンダリングに関する記述として,適切なものはどれか。
- 異なる色のピクセルを混ぜて配置することによって,中間色を表現すること
- 複数の静止画を1枚ずつ連続表示することによって,動画を作ること
- 物体の表面に陰影を付けたり,光を反射させたりして,画像を作ること
- 物体をワイヤフレーム,ポリゴンなどを用いて,モデル化すること
正解は,3. である。なお,1. はハーフトーン処理,2. はデジタルアニメーションまたはスライドショー,4. はモデリングの説明である。
演習問題
コンピュータグラフィックスの要素技術に関する記述のうち,適切なものはどれか。
- アンチエイリアシングは,周囲の画素との平均値演算などを施すことによって,斜め線や曲線のギザギザを目立たなくする。
- メタボールは,光の相互反射を利用して物体表面の光エネルギーを算出することによって,表面の明るさを決定する。
- ラジオシティは,光源からの光線の経路を計算することによって,光の反射や透過などを表現し,物体の形状を描画する。
- レイトレーシングは,物体を球や楕円体の集合として擬似的にモデル化する。
正解は,1. である。なお,2. はラジオシティ,3. はレイトレーシング,4. はメタボールの説明である。
CAD (Computer-Aided Design)
CAD とは、工業製品や建築物などの設計や製図をコンピュータを用いて行うこと。また、そのためのソフトウェアや情報システム。
AR (Augmented Reality : 拡張現実感)
AR とは、現実の環境から視覚や聴覚、触覚などの知覚に与えられる情報を、コンピュータによる処理で追加あるいは削減、変化させる技術の総称。
仮想現実(VR : Virtual Reality)が CG などで構築された現実感と現実を差し替えるのに対し、AR は現実の一部を改変することが異なる。
例として、スマートフォンのカメラなどを通して現実の映像を表示し、GPS などによって得られた位置情報とマップとして保存されている飲食店やランドマークなどの情報を付加する、というものがある。これを使うと、ユーザはスマートフォンを通して現実世界を眺めると、それだけでどこに何があるかを知ることができるようになる。
VR/AR/MR
VR(Virtual Reality)は仮想現実のことで,これから派生した拡張現実(Augmented Reality : AR)や複合現実(Mixed Reality : MR)に関連した技術は,分野を問わずその活用が進められている。
VR は閉じられた仮想空間内における認識技術であるが,AR は現実空間に置かれている物体やマーカをカメラが認識し,対応する関連情報を表示する。MR は AR (Augmented Reality)と AV(Augmented Virtuality)を組み合わせた技術で,仮想空間と現実空間を複合するものである。これらはそれぞれが独立で存在するものではなく,下図に示すようにスペクトル的に連続性のあるものと理解されている(トロント大学 Paul Milgram 教授提唱(1994 年)の MR スペクトルを基に作成)。
演習問題
バーチャルリアリティ(VR:Virtual Reality)におけるモデリングに関する記述のうち,レンダリングの説明はどれか。
- ウェアラブルカメラ,慣性センサなどを用いて非言語情報を認識する処理
- 仮想世界の情報をディスプレイに描画可能な形式の画像に変換する処理
- 視覚的に現実世界と仮想世界を融合させるために,それぞれの世界の中に定義された3次元座標を一致させる処理
- 時間経過とともに生じる物の移動などの変化について,モデル化したものを物理法則などに当てはめて変化させる処理
正解は,2. である。なお,1. はトラッキング,3. は幾何学レジストレーション,4. はモデリング変換の説明である。
演習問題
拡張現実(AR:Augmented Reality)の例として,最も適切なものはどれか。
- SF 映画で都市空間を乗り物が走り回るアニメーションを,3 次元空間上に設定した経路に沿って視点を動かして得られる視覚情報を基に作成する。
- アバタの操作によって,インターネット上で現実世界を模した空間を動きまわったり,会話したりする。
- 実際には存在しない衣料品を仮想的に試着したり,過去の建築物を3次元CGで実際の画像上に再現したりする。
- 臨場感を高めるために大画面を用いて,振動装置が備わった乗り物に見立てた機器に人間が搭乗し,インタラクティブ性が高いアトラクションを体感できる。
正解は,3. である。
ビデオオンデマンド(Video On Demand)
VOD とは、放送・通信関連サービスの一つで、視聴者が好きなときに好きな動画作品を見ることができるもの。サービス事業者が提供作品のリストを提示し、視聴者はその中から見たいものを選択すると即座に再生が始まる。
DSP (Digital Signal Processor)
DSP とは、マイクロプロセッサの一種で、デジタル信号処理に特化した機能を持つもの。
2D コンピュータグラフィックス
コンピュータで 2 次元平面に対して画像を描くことを指す。2DCG の作成に使用するソフトウェアはペイント系とドロー系の 2 つに分類される。
分類 | 特徴 |
---|---|
ペイント系 | 画像をビットマップで表現するラスタ形式。フリーハンドによる描画や画像の修正を適している |
ドロー系 | 画像を図形の組合せで表現するベクタ形式。製図や地図の描画に適している |
コンピュータグラフィックスにおける,レンダリングは,物体の表面に陰影を付けたり,光を反射させたりして,画像を作ることである。
3D コンピュータグラフィックス
ポリゴンにより形状化した物体,視点や光源などの位置・方向の情報を基にコンピュータ自身が画像を生成する。3DCG で利用される技術要素を下表に示す。
形状 | 特徴 |
---|---|
アンチエイリアシング(anti-aliasing) | 図形の境界に中間色を用いることで,画像に生じるギザギザ(ジャギー)を,なめらかに見せるために周囲(背景)の画素値と平均化処理をして描画する CG 技法 |
クリッピング | 画像の一部だけを表示を処理 |
シェーディング | 陰影の変化によって物体に立体感を与える技法 |
テクスチャマッピング | モデリングした物体の表面に模様などを貼り付けて質感を出す技法 |
レンダリング | CG 作成の最終工程で,物体のデータをディスプレイに描画できるように映像化する処理 |
モーフィング | ある形状から別の形状へ,徐々に変化していく様子を表現する技法 |
ラジオシティ | 光の相互反射を利用して物体表面の光エネルギーを算出することによって,表面の明るさを決定する。 |
レイトレーシング | 光源からの光線の経路を計算することによって,光の反射や透過などを表現し,物体の形状を描画する。 |
3D 映像の立体視を可能とする仕組みの一つに,アクティブシャッタ方式がある。アクティブシャッタ方式は,ディスプレイに右目用,左目用の映像を交互に映し出し,眼鏡がそのタイミングに合わせて左右それぞれ交互に透過,遮断することによって,立体視を可能とする。
パララックスバリア方式は,専用の特殊なディスプレイに右目用,左目用の映像を同時に描画し,網目状のフィルタを用いてそれぞれの映像が右目と左目に入るようにして,裸眼立体視を可能とする。
3 次元の物体の表すコンピュータグラフィックスの手法は,以下のようなものがある。
- ワイヤフレームモデル
- 3 次元の物体の頂点同士を線で結ぶことでその物体の形状を表現する手法
- ソリッドモデル
- 物体を,中身の詰まった固形物として表現する。
- サーフェスモデル
- 物体を,ポリゴンや曲面パッチを用いて表現する。
- メタボール
- 物体を,メタボールと呼ぶ構造を使い、球体を変形させることで得られる滑らかな曲線で表現する。
演習問題
3 次元の物体を表すコンピュータグラフィックスの手法に関する記述のうち,サーフェスモデルの説明として,適切なものはどれか。
- 物体を,頂点と頂点をつなぐ線で結び、針金で構成されているように表現する。
- 物体を,中身の詰まった固形物として表現する。
- 物体を,ポリゴンや曲面パッチを用いて表現する。
- 物体を,メタボールと呼ぶ構造を使い、球体を変形させることで得られる滑らかな曲線で表現する。
正解は,3. である。なお,1. はワイヤフレームモデル,2. はソリッドモデル,4. はメタボールの説明である。
モーションキャプチャ(motion capture)
モーションキャプチャとは、人体の動きをセンサーなどで記録し、動作を解析したり CG モデルなどで同じ動きを再現したりする技術。
OpenGL
Open Graphics Library の略。Linux、FreeBSD などの PC UNIX に加え、Windows、Mac OS X 等クロスプラットフォームで使用できる 2D,3DCG を扱うための API である。
本稿の参考文献
- Paul Milgram, Fumio Kishino : “A Taxonomy of Mixed Reality Virtual Displays.”, IEICE Trans. Information Systems, E 77-D (12) (1994)