教科書プロジェクト目次に 戻る /情報A入口に 戻る


第3章 電子情報ネットワークの成り立ち

3.1 情報の単位

3.1.1 ビット --- 情報の最小単位

世の中にはさまざまな情報が満ちあふれていますが、その最小単位は何でしょう。たとえば「今、雨が降っていますか?」という質問に対する答は、できるだけ単純にした場合「はい」「いいえ」のどちらかになるはずです。「はい」「いいえ」に限りませんが、このような「2つのうちどちらか」という情報は、これ以上簡単にできない 情報の最小単位だと考えることができます。この最小単位をビット(bit) と呼びます。

用語
ビット(bit)とは、「2つのうちどちらか」をあらわす、情報の最小単位のことです。
演習
世の中の情報で、「2つのうちどちらか」という形で表せるようなものをもっとたくさん考えてみよう。

3.1.2 ビット列と2進数

ビットを簡潔に書き表すために、1つのビットを2進法のひとつの桁に対応させて0または1で表すことにします。こうしておけば、複数のビットの組合せも見やすく表せます。

メモ
実はビット(bit)ということばは、「2進法のひと桁」 (binary digit)から来ています。

たとえば、雨の降りかたをもう少し細かく表したいとします。そのため、たとえば2ビットを使って

のように表せます。ビット数が増えたことと、雨の降りかたに関する情報が増えたことが対応しているのが分かりますね。一般に、ビットが N個あれば、2N通りの場合のうちのどれであるかを表すこ とができます。実は2進数も、Nビットで「0〜2N - 1のど れであるか」を表現しているものだと考えられます。

演習
世の中にある情報のうち、「N通りの場合のうちどれか」という形で表せるようなものをもっとたくさん考えてみよう。

3.1.3 ディジタルとアナログ

ここまでに挙げてきたような、ビットのならび(ビット列)で表せる情報をディジタル情報といいます。ディジタル情報は「 2N 通りのうちどれか」という形で表されますから、「どちらでもない中間的な状態」というものがありません。これを離散的である、といいます。 これに対し、ものの重さや長さなどの連続的な情報のことを アナログ情報といいます。実用的には、ある決まった小さな値を単位としてそれがいくつあるか、という形に読みかえることで、アナログ情報をディジタル情報に変換して表すことができます。これを量子化 と呼びます。

用語
ディジタル情報とは、「N通りのうちどれか」という形で表される離散的な情報をいいます。これに対し、アナログ情報とは、長さや重さなどのように連続的な情報をいいます。アナログ情報を最少の細かさを定めてディジタル情報に変換することを量子化といいます。

たとえば、皆さんの身長を表すのであれば、1mmを単位として表すので十分だと言えるでしょう。身長であれば4mという人はいませんから、 212 = 4096 であることを考えると、この方法なら12ビットのディジタル情報として表せることになります。ただし、1mmより小さい部分の情報を捨てていることを忘れてはいけません。これを量子化誤差といいます。もっと細かい値が必要なら、より多くのビット数を用いることになります。

演習
世の中の情報のうち、おもにアナログ情報として扱われているものはどれか。おもにディジタル情報として扱われているのはどれか。またアナログでもディジタルでも扱われているものはどれか。3つずつ考えてみよ。

3.2 さまざまな情報の表現

3.2.1 情報の表現と符号化

さまざまな情報をビット列に対応させて表すことを符号化といい、その対応づけの規則を符号化規則といいます。たとえば「雨が降っていない」を0、「雨が降っている」を1であらわす、というのも符号化規則です。

用語
情報をビット列に対応させて表すことを符号化という。

ディジタル情報を受け渡すとき、情報の送り手と受け手で同じ符号化規則を使っていないと、情報が正しく伝わりません。このため、情報の種類ごとに標準の符号化規則をさだめて、共通に使うようにするのが一般的です。以下で、代表的な情報の種類ごとにその表現方法(符号化)について見てみましょう。

3.2.2 整数の表現

0以上の整数(非負の整数)をビット列で表すばあいには、2進数によって表すのが一般的です。たとえば3ビットの2進数について見てみます。

23 = 8ですから、0〜7までの整数が表せることになります。 では、負の数まで表したい場合はどうでしょう。現在コンピュータで多く使われている2の補数表現では、「すべてのビットが1」を-1 に対応させ、3ビットの場合次のように対応させます。

同じビット数で負の数まで表すため、正の数については表せる範囲が半分になっています。2の補数表現では、ある数が負であるかどうかを調べるには最上位(一番左)のビットが1かどうかを調べれば分かります。

メモ
コンピュータで整数を扱うときには、32ビットや64ビットの2の補数表示が多く使われます。32ビットの場合、10進数で10桁程度の大きさまで扱えることになります。
メモ
コンピュータで扱う情報表現のビット数は8の倍数が使われることが多いのに気がつきましたか。これは、現在のコンピュータは8ビット単位でデータを扱うのに都合がよくできていることに関係しています。なお、 8ビットのことを1バイト(byte)と呼ぶことがあります。たとえば 32ビットは4バイト、64ビットは8バイトですね。
メモ
なお、コンピュータでは整数だけでなく実数(少数点つきの数)もよく扱います。その表現については話が長くなるので説明しませんが、決まったビット数で表すため、整数と同じく「表せる最大の数」「表せる最少の数」があります。さらに実数では「表せる最少のきざみ幅」も問題になります。そういう意味では、コンピュータで扱う実数は数学で言う実数とは違って、「実数の近似値」とでも言うべきものです。

3.2.3 実数の表現

少数点以下の値も含んだ数値を表す場合には、先に出て来たように「小さい値を単位として」表すこともできますが、それだと(絶対値が)非常に大きい数や小さい数を表すのが不便なので、指数方式または 浮動少数点と呼ばれる表現を使うのが普通です。電卓にも、指数部と仮数部(有効数字の部分)を分けて表示/計算できるものがありますが、それと同じだと考えればよいでしょう。 注意すべきなのは、指数部も仮数部も表せる桁数が決まっている、ということです。たとえば、(10進数で)指数2桁+符号、仮数5桁+符号とすると、

10000000000 = 1.0000 × 10+10
0.0000000001 = 1.0000 × 10-10

などの値は表せますが、これらを足そうとすると

10000000000.0000000001 〜 1.0000 × 10+10

のように近似値に丸められてしまい、「0でないものを足したのに値が増えない」という不思議なことが起こります。そもそも123456という数値でさえ

123456 〜 1.2346 × 10+05

のように概数でしか表せません。 実際のコンピュータでは指数部も仮数部ももう少し余裕がありますが、まったく同様のことが起こります。これは、有限のビット数のディジタル表現では原理的に避けられない制約なのです。

演習
上記の「仮数5桁+符号、指数2桁+符号」表現で次の計算を実行すると結果はどうなりますか。またその違いはなぜ生じるのでしょう。
3.1416 - 3.1234 + 0.0000001
3.1416 + 0.0000001 - 3.1234

3.2.4 画像の表現

画像(image)を符号化する場合には、まず画像全体を細かく縦横のます目に分割します。ここで1インチ(約2.5cm)あたりいくつのます目に分割するかを解像度(resolution)と呼びます。表示画面では75dpi (dot per inch --- インチあたりのます目数)、プリンタ出力では 300dpi〜600dpiくらいの解像度が標準的です。 1つのます目のことをピクセルと呼びます。白黒で階調のない画像の場合は、1つのピクセルは「白」「黒」のいずれかですから、1ビットで表すことができます。カラー画像の場合には、図3.1のように、1つのピクセルの色や明るさを、「赤」「緑」「青」3原色の強さをそれぞれ0〜255の段階で(つまり8ビットで)表し、1ピクセルについて24ビットを使うやり方が標準的です。しかしもっとビット数を節約する流儀もいろいろあります。

図3.1 画像のディジタル表現

画像全体の情報は、すべてのピクセルの情報を合わせたものになります。画像のサイズとは横方向と縦方向にいくつずつます目があるかを意味し、たとえば「200×150ピクセル」のように書きあらわします。画像を直接扱うようなお絵描きソフトを(次節で述べるドロー系と対比して) ペイント系のお絵描きソフト、と呼びます。

図3.2 ペイント系のソフト

実際の画像では、ある小さい範囲のピクセルはどれも同じ色を持つことが多いので、これを利用して符号化のビット数を節約できます。これを画像の圧縮(compression)と呼びます。圧縮方法まで含めた画像の表現方式にもいくつかの規格があり、それぞれ名前がついています。 GIF、JPEG、TIFFなどは代表的な画像の表現形式です。

演習
ペイント系のお絵描きソフトで絵を描いてみよう。拡大機能を使って、実はその絵が多数の点から成っていることを確認しよう。(画像)イメージを読み込んだり、それを少し修正してみて、同じように確認しよう。

3.2.5 図形の表現

コンピュータで幾何学的な図形などから成る図を表現する場合、上で述べた画像による表現も可能ですが、それよりも「どこから、どこまで、どのような太さの、どのような色の、どのような線を引く」という情報を符号化して表す方が次の点で優っています。

図形の一種として文字や(小さな)画像を含めて配置することもできます。このような考え方に基づくお絵描きソフトをドロー系のお絵描きソフト、と呼びます(図3.3)

図3.3 ドロー系のソフト

演習
ドロー系のお絵描きソフトで絵を描いてみよう。一度配置した図形等を移動したり、変形できることを確認してみよう。

3.2.6 音声の表現

音をアナログ信号の形で送る場合には、空気の振動をマイクで電圧の変化に変換し、時間とともに電圧が変化するようすをそのまま伝送して、受け取った側でそれをそのままの形でスピーカに送ることで元の音が再生されます。 これに対し、音をディジタル情報にする場合には、非常に細かい時間間隔ごとに電圧を調べ(サンプリング)、電圧の大小も先に説明したような形でディジタル化して伝送します。典型的には、1秒間に44,000 回(44kHz)のサンプリングを行い、各サンプルの値を16ビットで表現します(音楽CDもこのような形で音をディジタル記録しています)。 音声の情報に対しても圧縮を行うことができます。音声の表現方式にもいくつかの規格があり、それぞれ名前がついています。μ-law、AIFF、 WAVなどは代表的な音声の表現形式です。

3.2.7 動画の表現

動画(ムービー)の場合は、音と同様にサンプリングを行いますが、ただし各サンプルは画像情報ということになります(これをフレームと呼びます)。フレーム数は毎秒10〜20程度が普通です。動画の情報はそのままでは非常に大きくなる(ビット数が多くなる)ので、圧縮はほとんど必須だと言えます。動画の表現形式としては、MPEG、Indeo、Cinepak、 QuickTimeなどが代表的です。

3.3 文字とテキスト形式

3.3.1 文字の表現

文字で表された情報はコンピュータで多く扱うので、この節でやや詳しく見て行きましょう。文字を表すのも、これまでやってきたのと同様に、それぞれの文字をビット列に対応づけることで符号化します。この対応のことをコード系と呼びます。また、それぞれの文字を表すビット列、またはそれを2進数とみなしたときの数値を、その文字の 文字コードと呼びます。 コード系には、1つの文字を8ビット単位で表すものと16ビット単位で表すものとがあります。8ビット単位では最大 28 = 256 の文字しか表せませんから、漢字が扱えるのは16ビット単位のコード系だけです。 コンピュータどうしが通信を行なう際に、それらの間でコード系が一致していないと、ある文字を送ったはずが、受け取った側では全然違う文字だと思われてしまい、めちゃくちゃになります。このため、標準のコード系が規格として定められています。 コード系の規格としては、アメリカ通商産業省の定めた文字規格である ASCII、日本の通産省の定めるJIS X0208があります。 ASCIIは8ビット単位、JIS X0208は16ビット単位のコード系です。さらに、国際標準化機構が定めたISO-2022という、「世界中の文字コードを混在させる規格」が知られています。これを使えば、ASCIIの文字と日本語の漢字とを1つのファイルで混ぜて使うことができるのです。 異なるコード系を使っているコンピュータ同士では、ネットワークを用いた情報交換は出来ません。どうしても情報交換を行なう必要がある場合には、通信の際に文字コードの変換を必要とします。

演習
日本語の五十音のそれぞれに適当な番号を振って、対応表を書いてみましょう。さらに、句読点や他の記号にも番号を振ってみましょう。また、自分の対応表を、他の人が書いたものと比較してみましょう。

3.3.2 ASCIIコード

英語のアルファベットで使用されている「ローマ文字」のコード系は、ほぼ世界中のコンピュータがASCII規格にしたがっています。ほぼ世界中のコンピュータがこの規格を採用しているため、これらの文字コードの違いを意識する必要はほとんどありません。ASCIIコードは、アルファベット・数字・いくつかの記号に32〜126の文字コードを割り振っています。コンピュータの内部では、その番号を2進数で表記したのと同じビット列がそれぞれの文字を表します。

図3.4 ASCII文字コード表

演習
次の文字列を、ASCII文字コード表にしたがって、数の列に置き換えてみましょう。
ima no kion wa, 20 do desuka?

3.3.3 日本語の漢字コード

コンピュータはアメリカで生まれ、したがって、情報処理技術も初期の段階ではアメリカのみで開発・発展してきました。そのため、コンピュータ普及の初期の頃は、コンピュータ上で日本語の漢字を用いるために特殊な方法を必要としました。現在では、日本の通産省が定めたJIS(日本工業規格)という規格に日本語の漢字を取り扱うための規格があり、ほとんどすべてのコンピュータメーカーの、ほとんどすべてのコンピュータがこのJIS規格にしたがって、日本語の漢字を取り扱っています。 しかし、「JIS規格による日本語の漢字コード」とASCIIコードを混在させて通信を行なう際には、コンピュータそのものの内部構造の違いやネットワークへの対応方法の違いが原因となって、

の 3 通りの規格が定められており、どの方法も広く使われています。また、ISOは書類番号 10646番で新しい文字コードを定義していて、 Unicodeとよばれています。 異なる日本語の漢字コードを用いているコンピュータ同士が通信をする場合や、そのコンピュータが標準的に提供している日本語の漢字コードとは異なる日本語の漢字コードを用いているファイルを読む場合には、変換を行なう必要があります。

演習
JISコード表に載っていない漢字を漢和辞典などからさがしてみましょう。それらの漢字をインターネットを使って通信するにはどのようにするべきでしょうか?
演習
世界中の言語にはどんな言葉があるかを調べてみましょう。また、それらの言語で使われている文字を画面に表示したり、電子メールでやりとりしたりするための工夫を考えてみましょう。

3.3.4 テキストデータとバイナリーデータ

数字・記号・アルファベットなどの文字コードのみから成るデータを テキストデータといいます。それに対して、テキストデータ以外のデータをバイナリーデータといいます。バイナリーデータは、画像データなどのようなデータを表すために用います。 ところで、電子メールはテキストデータしか送信・受信出来ないように設計されています。したがって、電子メールなどを通して画像データなどのバイナリーデータを送ろうとするには、適当な規則に基づいて変換を施してから送る必要があり、さらに、受信した人は、変換規則に基づいて元のデータに戻す必要があります。

演習
画像ファイルを電子メールに添付して他の人に送ってみましょう。また、そのとき送られた電子メールの大きさを調べてみましょう。さらに、送ったメールを受け取ってもらったら、どんな画像ファイルだったかを電子メールで返信してもらいましょう。

3.3.5 使ってはいけない文字

インターネットで日本語・英語の通信を行なう際に使用可能な文字は、 RFCやその他の規格によって定められています。これらの規格に合わない文字番号を通信に使うと、通信相手に正確に内容が伝わらないばかりか、場合によっては、送られたメッセージの中継の途中で動作中のサーバーを止めてしまうこともあるかもしれません。 この節では、インターネットでは使ってはいけない文字番号を持つ文字の中で代表的なものについて説明します。これら以外の文字を使う際も、読む人が正常に文字を表示できるかどうかに注意をして、使う文字を選ぶべきでしょう。

外字

JISで定められた日本語の漢字コードは、6355文字分です。しかし、日本人の人名・日本の地名に用いられている文字の総数は、この数を遥かに越えます。さらに、コンピュータを国語の研究などに用いようとすれば、古い字体や既に用いられなくなった字、中国語の文字で日本語に影響を与えた文字などを取り扱う必要があります。 これらの文字にはJISの定めた文字コードがないので、「外字」と呼ばれるOSの機能を使って、結果として、そのコンピュータを使う人が自分で管理することになります。たとえば、あるJIS漢字コード に定義されていない日本語の漢字を、「外字コード 0001番」などとして決めるということです。 このようにしてしまうと、使っているコンピュータや使っている人同士が異なれば、同じ文字番号が異なる文字に対応し、その結果として、正常な通信が出来ないという結果をもたらします。 外字は、必要上用いるものですから、利用すべきではないとはいえません。したがって、外字で表している文字をどうしても通信内容に含める必要がある時には、その文字の形を別途の方法で伝えたり、その文字の形の画像ファイルを同時に送信したりする必要があるでしょう。 これらの問題点を解決すべく、JIS漢字コードの拡張が検討されています。この拡張によって、外字の問題のほとんどが解決することが期待されています。

半角カタカナ

用いてはいけない文字の中で、誤って用いられることの多い文字が、8 ビット単位のカタカナ、俗に「半角カタカナ」といわれている文字です。これは、むかしコンピュータで漢字を扱うのが難しかったころ、8ビット単位の文字コードでカタカナと必要最小限の記号を扱っていたことに由来しています。 多くのコンピュータでは、8ビットカタカナ文字は通常の漢字より狭い幅で表示されます。ですからその文字がカタカナの場合には、字の幅に注意をすればすぐに判別できますが、句読点を表す「、。」や、促音をあらわす「ー」、中グロを表す「・」の8ビットカタカナ文字は、画面上でもなかなか判別がつきませんので注意が必要です。

図3.5 半角カタカナの表示が正常な例

図3.6 8ビットカタカナの表示が正しくない例

例に上がっているのは、8ビットカタカナを正常に表示可能なソフトウェアと、8ビットカタカナを正常に表示不可能なソフトウェアに無理矢理に8ビットカタカナを含む文書を表示させた例です。「ココモカ!」の部分の文字がおかしくなっています。 これらの文字に用いられる文字コードは、ASCIIで規定している文字コードに使用可能な部分を逸脱しているので、RFCでは8ビットカタカナ用の文字コードをを用いることは出来ないように規定されています。そのため、多くの電子メールクライアントやネットニュースクライアントでは、半角カタカナを表示できないものが多く存在しています。さらに、インターネットにある中継ホストの中には、8ビットカタカナをうまく中継できないものがあります。しかし、もともとインターネットでは、8ビットカタカナを表示できるようにする必要はありませんので、受けとった側がこのような状況で困ってしまう場合には、送り手に問題があることになります。したがって、インターネットメッセージでは8ビットカタカナを用いてはいけません。

文字コードに関するまとめ

ここまでで取り扱った項目をまとめると、「書き手の環境・読み手の環境に気をつけよう」ということです。 世界中にはさまざまなコンピュータがあり、さまざまなOSで動作しています。同じ文字番号を使っているからといって、同じ文字が表示されるとは限りません。文字の表示という基本的な問題だけを取り上げても、このようにさまざまな問題を抱えているのが現在のインターネットなのです。 コード系は、8ビット(1バイト)単位で符号化するものと16ビット(2バイト)単位で符号化するものがおもで、それぞれにさらにいく通りものコード系が存在しています。

演習
インターネットで使ってはいけない文字についてまとめてみましょう。

3.4 コンピュータの構成

3.4.1 コンピュータとは

ここまで、コンピュータが扱うさまざまな情報について見てきましたが、それではコンピュータとは何でしょう? コンピュータ(computer、計算機)とは元はその名の通り「数の計算を高速に/大量に行なうための機械」でしたが、今ではこれまでに見てきたさまざまなディジタル情報(ビット列)を取り扱う(蓄積・加工する)ための機械であると考えるほうが実情に合っています。

用語
コンピュータ(計算機)とは、ディジタル情報を蓄積したり加工するための装置を言います。

図3.7 コンピュータの概念

3.4.2 コンピュータの働き

「ディジタル情報を処理する」とは具体的にはどういうことでしょう? これはつまり、コンピュータにどのような機能が備わっているかということにほかなりません。コンピュータには具体的には次のような3つの機能が備わっています。

これらの機能について順番に見てみましょう。

図3.8 コンピュータの働き

3.4.3 入出力

外部からコンピュータにディジタル情報を取り込むことを入力 (input)といいます。逆に、コンピュータから外部にディジタル情報を取り出すことを出力(output)といいます。入力と出力をあわせて入出力といいます。コンピュータの機器のうちで、入出力を行なうための機器を入出力装置といいます。 代表的な入力装置としては、キーボード、マウス、音声入力装置、画像入力装置などがあります。代表的な出力装置としては、ディスプレイ (表示装置)、プリンタ、音声出力装置などがあります。 そのほか、コンピュータに備わっている各種のインタフェース(やりとりのための接続口)は入力と出力の両方を兼ねています。たとえばあるコンピュータからネットワークインタフェースを経由して情報を出力し、それを他のコンピュータのネットワークインタフェースを経由して入力することで、ディジタル情報を伝送できます。

3.4.4 記憶

コンピュータにはディジタル情報を記憶しておく機能も必要です。たとえば、入力した情報は演算を行なうまで記憶しておく必要がありますし、演算の結果も記憶しておき、利用者から指示があった時はじめて出力するのがふつうです。 コンピュータの機器のうちで、記憶を行なう部分を記憶装置 (storage)といいます。記憶装置はさらに、高速に出し入れが可能だが容量が限られている主記憶装置 (main storage)と、低速だが大量に記憶でき、コンピュータの電源を切っても内容が失われない 補助記憶装置ないし二次記憶装置(secondary storage)に分類できます。 主記憶装置は、メモリチップと呼ばれる数ミリ角の半導体素子の集まりで構成されています。1つのメモリチップに、約64,000,000〜 256,000,000ビットの情報が格納できます。 補助記憶装置は、入出力装置の一種と考えることができます。つまり、計算機から出力された情報を格納しておき、そこから取り出した情報は計算機への入力になるのです。 補助記憶装置にはさまざまな種類のものがあります。代表的なものには、ハードディスク、フロッピーディスク、MOディスク(光磁気ディスク)、磁気テープなどがあります。

図3.9 コンピュータの構成

3.4.5 演算と制御

コンピュータの内部でディジタル情報を加工することを演算といいます(数値以外の情報に対してもこういいます)。コンピュータの機器のうちで、演算を行なう部分を処理装置またはCPU(central processing unit)などといいます。CPUも小さな半導体素子で構成されています。 コンピュータがいつどのようにディジタル情報を入出力し、記憶し、加工するかは、すべて処理装置によって制御されています。つまり、処理装置には演算機能に加えて、制御機能も内蔵されているわけです。 コンピュータが具体的にどのような制御を行なうか(つまりコンピュータが全体としてどのように動作するか)は、すべてプログラムによって定められます。プログラムもディジタル情報(ビット列)の形で表され、主記憶装置の中に格納されています。CPUの中の制御機能は、主記憶装置に格納されているプログラムを参照しながら、その指示に従ってコンピュータ全体を制御します。

3.4.6 ハードウェアとソフトウェア

ハードウェアとは、コンピュータの機器全般をいいます。これに対しソフトウェアとは、プログラムやデータ(プログラムが扱う情報)など、コンピュータで有用な作業をするために必要なディジタル情報全般をいいます。 コンピュータは、ハードウェアに加えて、ソフトウェアがなければ動作できません。ハードウェアとソフトウェアはコンピュータを動かす車の両輪だといえるでしょう。

演習
現在使っているコンピュータのハードウェアとソフトウェアを購入するのにそれぞれどれくらいの金額が必要か調べてみなさい。

3.4.7 さまざまなソフトウェア

電子メール、WWW、文書作成、ゲームなど、特定の作業をおこなうのに必要なソフトウェアを応用ソフトウェアまたは アプリケーションソフトウェアと呼びます。コンピュータショップなどに行くと、さまざまな応用ソフトウェアが販売されているのを見かけます。 これに対し、コンピュータを動かす上で必要となる機能全般を提供するソフトウェアを基本ソフトウェアと呼びます。基本ソフトウェアの代表的なものにオペレーティングシステム(OS)があります。 OSは、コンピュータ上で常時動作していて、応用ソフトウェアを起動させてくれたり、応用ソフトウェアが動作するときの下支えとなる機能を内部的に提供してくれるソフトウェアです。

3.5 マルチメディア文書

3.5.1 マルチメディアとは

コンピュータで扱う情報のうちでテキストが占める割合が高いことは説明しましたが、もちろんその他の種類の情報も扱えます。コンピュータで扱うテキスト以外の情報種別のことを総称してマルチメディア と呼びます。まずテキストが基本で、それに他のものを加えるから複数種類の(マルチ)媒体(メディア)、というわけです。しかし技術の進歩とともに、最近ではテキスト情報を全く含まないようなマルチメディアのコンテンツ(内容)も一般的になっています。

演習
では、情報を伝えるのにテキスト以外にどのような媒体(メディア)の種別があり得るかできるだけ多く挙げよ。続いてそれらを、(1)既にコンピュータで扱うことが実用化されているもの、(2)コンピュータで扱うことが研究されているもの、(3)まだコンピュータで扱えるかどうか分からないもの、に分類してみよ。

3.5.2 さまざまなマルチメディア素材

ではもう少し具体的に、WWWなどで使われているマルチメディアの素材 (コンテンツを作る材料)について見てみましょう。それぞれの素材は通常、ファイルの形で保存しておき、必要に応じて取り出して利用します。ある特定種類のメディアの素材でも、ファイルに格納する方法(や、そのメディアの情報を0、1に対応づける方法)はひと通りとは限りません。これをファイルフォーマットと呼んでいます。さらに、ファイルの内容が分からなくならないように、ファイルには格納されている情報のフォーマットに対応した名前(具体的には拡張子)をつけるのが通例です。以下では代表的なファイルフォーマットについても簡単に触れます。

演習
用意された素材集を見てみよう。また、ファイルの大きさと素材の内容にはどのような関係があると思うか、考えてみよ。

3.5.3 マルチメディア文書の設計

テキスト以外の情報も含んだ文書のことを、マルチメディア文書 と言います。また、使用するソフトウェアにもよりますが、マルチメディア文書ではテキストの部分も、見出し、本文、引用、強調箇所など内容に応じて字体や文字の大きさや色を変えるなど、表現の工夫が可能である場合が多いです。 マルチメディア文書では、テキストだけで表せないことを読み手に伝えられるという点では優れていますが、読み手、書き手の双方において、各種のメディアや表現などに目を奪われてしまい、肝心の伝えたい内容がおろそかになってしまうというおそれもあります。 そのような罠に陥らないためには、文書が伝えたい内容が何であるかを明確にして、文書の構成を決め(ここまでは普通の文書の設計法と同じです!)、それに沿って各種のメディアや表現の使い方を決めて行くべきです。

メモ
各種メディアや表現の使い方については、次の点に気をつけましょう。
演習
先の演習で見た素材を使って、マルチメディア文書を企画しなさい。テーマは先生からもらうこと。

3.5.4 マルチメディア文書の作成

マルチメディア文書を作成する手助けをしてくれるようなソフトウェアを一般にオーサリングソフトと言います。最近ではワープロソフトにも画像などが入れられるものがありますから、両者の区別はあいまいになりつつありますが、おもにテキスト情報を使うのがワープロソフト、マルチメディアをおもに考えているのがオーサリングソフトだと言えます。 オーサリングソフトでは、画面からテキストを打ち込むのに加えて、範囲指定やメニューを使って「ここは見出しである」「ここは箇条書きである」「ここにN行M列の表を入れる」「ここにこれこれの素材(画像や音)を入れる」といった指示を行うことによって、マルチメディア文書を組み立てて行くことができるようになっています。

演習
オーサリングソフトを使って、先の演習で企画したマルチメディア文書を実際に作ってみよ。

3.5.5 マルチメディア文書とバインディング

オーサリングソフトで作成し保存したファイルの中はどうなっているのでしょう? WWW用のオーサリングソフトでは、作成したドキュメントを HTMLと呼ばれる形式で保存してくれ、HTMLは普通のテキストエディタで見たり編集したりできます。実際に眺めてみてください。 そうすると、打ち込んだテキストそのものがそのまま現われている部分と、テキストにない何だかよく分からないものとが混ざりあっているのが分かるはずです。ここでテキストにない部分は、「この範囲は見出し」「ここはこういう色」「ここはこういう表」といった情報を表しています(図3.10)。

図3.10 バインディングの概念

このように、もともとの内容(コンテンツ)に別の情報を付加して、全体としてより豊富な表現や機能を提供することをバインディングと呼びます。ここではHTML形式を見ましたが、ワープロソフトはそれぞれ固有の形式のバインディングを付加していますし、コンピュータで扱う多くのファイル形式にも同様の考え方が見られます。

演習
先の演習で作った文書を眺めて、内容(コンテンツ)とバインディングの間の関係がどうなっているか考えてみよ。



教科書プロジェクト目次に 戻る /情報A入口に 戻る