• 沒有找到結果。

大学计算机基础 - 万水书苑-出版资源网

N/A
N/A
Protected

Academic year: 2021

Share "大学计算机基础 - 万水书苑-出版资源网"

Copied!
16
0
0

加載中.... (立即查看全文)

全文

(1)第 5 章 多媒体技术基础及应用 多媒体技术是综合计算机技术、电子技术、通信技术等各种技术而产生的,是信息发展 的一个必然阶段。多媒体技术与 Internet 一起成为推动信息化社会发展的重要动力。多媒体技 术虽然发展历史不长,但它对人们的生产方式、生活方式和交互环境的改变所起的作用是不容 忽视的。当前,多媒体技术已成为计算机科学的一个重要研究方向。多媒体的开发与应用,使 得计算机一改过去那种单一的人机界面,它集声音、文字、图形于一体,使用户置于多种媒体 协同工作的环境中,让不同层次的用户感受到计算机世界的丰富多彩。本章主要介绍多媒体技 术的使用。. 5.1. 多媒体技术概述. 5.1.1 媒体与多媒体 1.媒体 媒体(Media)是指传播信息的介质,信息的载体。具有 2 种含义,一是指存储信息的实 体,如磁盘、光盘和磁带等,二是指传递信息的载体,如数字、文字、声音和图像等。 国际电话电报咨询委员会 CCITT(Consultative Committee on International Telephone and Telegraph,国际电信联盟 ITU 的一个分会)把媒体分成 5 类,它们是: (1)感觉媒体(Perception Medium)。指能直接作用于人的感官,使人能直接产生感觉的 一类媒体。如声音、图像、文字、气味以及物体的质地、形状、温度等。 (2)表示媒体(Representation Medium) 。它是为了能更有效地加工、处理和传输感觉媒体而 人为研究和构造出来的一种媒体。如对声音、文字、数据、图形、图像等信息的数字化编码表示。 (3)显示媒体(Presentation Medium)。是指感觉媒体和用于通信的电信号之间转换用的 一类媒体。显示媒体可分为输入显示媒体(如键盘、扫描仪等)和输出显示媒体(如显示器、 打印机等)。 (4)存储媒体(Storage Medium)。指用于存放以数字化形式表示的媒体的存储介质。如 磁盘、光盘、半导体存储器等。 (5)传输媒体(Transmission Medium)。用来将表示媒体从一处传递到另一处的物理传 输介质。如同轴电缆、双绞线、光纤及其他通信信道。 2.多媒体 多媒体(Multimedia)是融合两种以上媒体的组合,人们将文字、图像、图形、动画、声 音或影像的综合体统称为“多媒体”。 5.1.2 多媒体技术的应用与特点 1.多媒体技术的应用 多媒体技术集声音、文字、图片、图像于一体,其应用范围很广,几乎涉及社会生产、.

(2) 第 5 章 多媒体技术基础及应用. 生活的各个领域,包括信息管理、教育教学、广告出版、家庭娱乐等方面,并且还在不断地发 展和开拓新的应用领域。 (1)多媒体教学。在多媒体教学中,计算机辅助教学(Computer Aided Instruction)是多 媒体应用的一个重要领域。由于多媒体具有图、文、声并茂以及活动影像等特点,能提供最理 想的教学环境,所以必然会对教育、教学过程产生深远的影响。远程视屏教学结合了计算机技 术和网络技术,借助远程多媒体视频教学,可以使现代教学摆脱时间和空间的束缚,有利于提 高教学的效率。多媒体教学资源库,将包括多媒体的教学素材库、优秀课件库和多媒体题库三 大部分,它将是教育系统广泛采用多媒体技术,彻底改革旧的教学内容和教学方法的重要基础。 有了内容丰富的多媒体教学资源库,就可以让大部分教师都能结合自己的课程,方便地利用多 媒体来进行教学,有效地提高教学质量和教学效率,使学生学得更轻松,学得更好,更具有创 造力。 (2)娱乐与家庭使用领域。娱乐与家庭使用所涉及的信息家电和信息消费,始终是极大 的国际市场。它不但提高了现代家庭的生活品质,也大大促进了多媒体信息家电和消费信息业 的发展。 在多媒体游戏方面,逼真的动态三维图像和音响效果的多媒体游戏非常受欢迎。好的游 戏软件,能在娱乐中给人们以灵敏的眼手配合操作的训练,以及开发智力、提高创造能力与管 理能力。 网络视频点播又称 VOD(Video On Demand),包括音乐点播,都是能按照用户的意愿, 从数字化的影像和音乐资料库里任意点播自己所希望播放的视频和音乐节目。这避免了每个用 户都必须准备大量音像资料的麻烦,因为大型的音像资料服务器,可以将资料收集得很全,又 可同时为许多人服务。 网上购物成为一种现代消费形式。在网络上能快速地找到自己所要的物品,经过对该物 品用多媒体方式表现的信息详细研究后,就输入信用卡号码进行网上购物。到市场购物,往往 要花费人们大量时间,网上购物就是在多媒体计算机上用信用卡号码把物品买下,送货人员就 很快把它送到你的手中。 (3)电子商务。电子商务是多媒体应用的一个很大的市场。目前在全世界已经起步,同 时显现了飞速发展的趋势。多媒体应用于电子商务,主要应用于公司产品信息的多媒体方式发 布和搜索,视像商务洽谈等许多电子商务的主要环节之中。多媒体技术的应用,使得客户不仅 能通过多媒体的光盘,还可以通过网络连机的方式对公司的产品和服务信息、产品开发速度、 产品演示及实时更新的多媒体目录进行交互式访问。 同时它还特别适合于公司通过联机方式销 售自己的产品,因为对于顾客来说,它是在一个可视的网上购物商店。多媒体还比较适合于提 供可视的网上售后服务,增加顾客的满意程度。 (4)设计与创作。多媒体技术的出现,给各类艺术家提供了极大的创作空间和极好的创 作手段。计算机绘画功能已经大大促进了广告画设计行业的发展;影视业中使用数码编辑、图 像变形等技术,使得影视效果得到了极大的加强。同时也使电视台的片头和各类广告更加丰富 多彩,更加吸引人们的“眼球”。3D 图像设计,则使得建筑师有了更好地表现自己设计作品的 手段,使设计作品更加完美。同样,数码音响编辑设计手段和 MIDI 乐器的创作能力,使音乐 家也能创造出许多震撼人心的音乐佳作。. 141.

(3) 大学计算机基础. 2.多媒体技术的特点 多媒体所涉及的技术极广,其主要特点如下: (1)集成性。多媒体技术是多种媒体的有机集成。它集文字、文本、图形、图像、视频、 语音等多种媒体信息于一体。它像人的感官系统一样,从眼、耳、口、鼻、脸部表情、手势等 多种信息渠道接收信息,并送入大脑,然后通过大脑综合分析、判断,去伪存真,从而获得全 面准确的信息。目前,多种媒体还在进一步深入研究,如触觉、味觉、嗅觉。多种媒体的集成 是多媒体技术的一个重要特点,但要想完全像人一样从多种渠道获取信息,还有相当的距离。 (2)协同性。每一种媒体都有其自身规律,各种媒体之间必须有机地配合才能协调一致。 多种媒体之间的协调以及时间、空间的协调是多媒体的关键技术之一。 (3)交互性。所谓交互就是通过各种媒体信息,使参与的各方不论是发送方还是接收方, 都可以进行编辑、控制和传递。 (4)实时性。所谓实时就是在人的感官系统允许的情况下,进行多媒体交互,就好像面 对面(Face-To-Face)一样,图像和声音都是连续的。实时多媒体分布系统是把计算机的交互 性、通信的分布性和电视的真实性有机地结合在一起。 5.1.3 多媒体计算机系统组成 多媒体计算机简称 MPC(Multimedia Personal Computer),指能进行输入、输出和处理文 字、声音、图形图像和动画等多种媒体信息的计算机。多媒体计算机系统由复杂的硬件、软件 有机结合,它把音频、视频等媒体与计算机系统融合起来,并利用计算机系统对各种媒体进行 数字化处理。 与计算机系统类似,多媒体计算机系统由多媒体硬件系统和多媒体软件系统组成。 其层次结构结构如下: 多媒体应用软件 多媒体创作编辑工具 多媒体制作工具. 软件系统. 多媒体操作系统 驱动程序 多媒体计算机硬件系统. 硬件系统. 多媒体外围设备. 1.多媒体硬件系统 构成多媒体计算机硬件系统除了需要较高配置的计算机主机硬件外,通常还需要音频、 视频处理设备,光盘驱动器和各种媒体输入/输出设备等。 (1)CD-ROM。CD-ROM 是 MPC 的一个关键部件,其最大特点是存储容量大,一般一 张 CD-ROM 光盘有 650M 的容量。光盘驱动器的工作原理并不复杂,主轴马达驱动光盘高速 旋转,激光读出头则靠近光盘(并不接触),从发射出去的激光被反射回来的强弱的变化来判 断“0”和“1”。光盘上的数据(凹坑)通常是用机械方法模压出来的。光盘驱动器性能指标 主要是指数据传输率,即每秒能输出的字节数。早期单速的为 150Kb/s,后来有 2 倍速、4 倍. 142.

(4) 第 5 章 多媒体技术基础及应用. 速等,现在已达 52 倍速以上,其数据传输率已达 7.5Mb/s 以上,已与硬盘的数据传输速度相 当。至于光盘的存储容量,现在一般的 CD 均在 650MB~750MB 之间,DVD 光盘则达到 4.7GB。 光盘驱动器的接口,早期的使用 IDE 接口,现在较高速度的用 SCSI 接口。 (2)声卡。声卡(Sound Card)也叫音频卡,声卡是多媒体技术中最基本的组成部分, 是实现声波/数字信号相互转换的一种硬件。声卡的基本功能是把来自话筒、磁带、光盘的原 始声音信号加以转换,输出到耳机、扬声器、扩音机、录音机等声响设备,或通过音乐设备数 字接口(MIDI)使乐器发出美妙的声音。 声卡是计算机进行声音处理的适配器。它有三个基本功能:一是音乐合成发音功能;二 是混音器(Mixer)功能和数字声音效果处理器(DSP)功能;三是模拟声音信号的输入和输 出功能。声卡处理的声音信息在计算机中以文件的形式存储。声卡工作应有相应的软件支持, 包括驱动程序、混频程序(Mixer)和 CD 播放程序等。 (3)显卡。显卡也称图形加速卡,它工作在 CPU 和显示器之间,基本作用是控制图形输 出。通常显卡是以附加卡的形式安装在微机的扩展槽上,现在部分品牌机将显卡集成在主板上。 显卡的主要功能是对图形函数进行加速。早期的 CPU 和标准 EGA、VGA 显卡以及帧缓 存(用以存储图像),可以对大多数图像进行处理,但它们只起传递作用,用户所看到的内容 是 CPU 所提供的。这样的处理方式对于像 DOS 这样的操作系统和文本文件的显示是足够的, 但对于复杂的图形和高质量的图像进行处理就显得不足了。特别是 Windows 环境,CPU 已经 无法对众多的图形函数进行处理,所以使用显卡成为必然。显卡有自己的图形函数加速器和显 存,专门用于执行图形加速任务,因此,可以大大减少 CPU 所必须处理的图形函数。这样, CPU 就可以执行其他任务,使整机的性能提高,多媒体的功能也更容易实现。 (4)视频卡。视频卡也叫视频采集卡。PC 上通过视频卡可以接收来自视频输入端的模拟 视频信号,对该信号进行采集、量化成数字信号,然后压缩编码成数字视频序列。大多数视频 卡都具备硬件压缩的功能,在采集视频信号时首先在卡上对视频信号进行压缩,然后才通过 PCI 接口把压缩的视频数据传送到主机上。一般的 PC 视频采集卡采用帧内压缩的算法把数字 化的视频存储成 AVI 文件,高档一些的视频采集卡还能直接把采集到的数字视频数据实时压 缩成 MPEG 格式的文件。 由于模拟视频输入端可以提供不间断的信息源,视频采集卡要采集模拟视频序列中的每 帧图像,并在采集下一帧图像之前把这些数据传入 PC 系统。因此,实现实时采集的关键是每 一帧所需的处理时间。如果每帧视频图像的处理时间超过相邻两帧之间的相隔时间,则出现数 据的丢失,即丢帧现象。采集卡都是把获取的视频序列先进行压缩处理,然后再存入硬盘,也 就是说视频序列的获取和压缩是在一起完成的,免除了再次进行压缩处理的不便。不同档次的 采集卡具有不同质量的采集压缩性能。 视频卡的主要作用如下: 1)视频输入信号 视频信号来源于摄像机、录像机及视频光盘等。由于它们大多数是标准的彩色全电视信 号,因此视频信号的获取主要是指标准的彩色全电视信号。目前常用的电视标准主要有 NTSC 制式、PAL 制式和 SECAM 制式。 ① NTSC(National Television Systems Committee)制式是美国在 1953 年研制成功的一种 兼容彩色电视机的制式,NTSC 也称为正交平衡调幅制。彩色全电视信号可以分解成红(R)、 143.

(5) 大学计算机基础. 绿(G) 、蓝(B)三种成分,也可以分解成亮度信号(Y)和色度信号(C)。NTSC 制式传送 的是 Y 和 C。为了能用单一频率的副载波传送色度信号,NTSC 将色度信号分解成两个垂直的 色差信号。 ② PAL(Phase Alternating Line)制式是前联邦德国研制的一种制式,也称其为逐行倒相 正交平衡调幅制。为了克服 NTSC 中相位敏感性,通过色彩相序的倒换,使两种误差可以通 过平衡相互抵消。 ③ SECAM(Sequential Couleur Avec Memorie)制式是顺序传送彩色存储制式,1959 年 由法国研制的。SECAM 的基本原理是逐行依次传送色差信号 R-Y 和 B-Y。在同一时间内只有 一个色差信号存在,因而避免了两个色差信号的互相干扰。对亮度信号仍然采用每行传送的方 式。SECAM 的色差信号对副载波的调制采用调频方式。 2)抓帧功能 将摄像机对准所要获取的图像,使用视频采集卡的硬件和软件可以抓帧,并将它保存到 硬盘上。轻微地颤动都会造成画面的失真,因此,需要用软件或硬件的补偿方法改善视频采集 卡设计,以实现实时、清晰和连续的抓帧功能。抓帧得到的图片一般都支持 BMP、TIFF、GIF、 MMP、PCX、JEPG 等文件格式。 3)视频叠加功能 视频叠加功能使输入的视频信号在 VGA 屏幕上显示。这样能在捕捉之前调整画面、对比 色和色差、捕捉速度,以确定捕捉时的画面。同时也可以将 VGA 图像、视频图像、音频信号 通过 TV 转换卡混合转录到录像带等存储体上。 4)动态视频捕捉特性 捕捉一系列完整的视频画面,使之成为活动序列,以 AVI 文件格式把捕获的视频动态图 像信息存储到硬盘上。捕捉效果越好,对硬件的要求越高。 5)图像处理功能 实时图像缩放功能;定格、载入和存储视频图像;剪裁及重置图像大小,特殊效果(如 翻转、慢动作、放大、图像源)的切换;控制色彩、饱和度、亮度和对比度。 2.多媒体软件系统 多媒体软件系统是由系统软件和应用软件组成。 (1)系统软件。系统软件是多媒体系统的核心,各种多媒体软件要运行于多媒体操作系 统平台上,故操作系统平台是软件的基础。多媒体计算机系统的主要系统软件有: 1)多媒体驱动软件和接口程序 是最底层硬件的支撑环境,它直接与计算机硬件相关,完成设备初始化、设备的打开和 关闭、设备操作、基于硬件的压缩/解压缩、图像快速变换及功能调用等。通常驱动软件有视 频子系统、音频子系统、及视频/音频信号获取子系统。接口程序是高层软件与驱动程序之间 的接口软件,为高层软件建立虚拟设备。 2)多媒体操作系统 实现多媒体环境下的多任务调度,保证音频、视频同步控制及信息处理的实时性,提供 多媒体信息的各种基本操作和管理。操作系统还具有独立于硬件设备和较强的可扩展性。 3)多媒体素材制作工具及多媒体库函数 为多媒体应用程序进行数据准备的软件,主要是多媒体数据采集软件,作为开发环境的 144.

(6) 第 5 章 多媒体技术基础及应用. 工具库,供开发者调用。多媒体素材制作工具按功能分为文本素材编辑工具、图形素材编辑工 具、图像素材编辑工具、声音素材及 MIDI 音乐的编辑工具、动画素材编辑工具和视频影像素 材编辑工具等。 4)多媒体创作工具 是在多媒体操作系统上进行开发的软件工具,用于编辑生成多媒体应用软件。多媒体创 作工具提供将媒体对象集成到多媒体产品中的功能,并支持各种媒体对象之间的超链接以及 媒体对象呈现时的过渡效果。多媒体创作工具大都提供文本及图形的编辑功能,但对复杂的 媒体对象的创建和编辑,例如声音、动画以及视频影像等,还需借助多媒体素材编辑类工具 软件。 (2)应用软件。在多媒体制作过程中,用户可以借助多种软件来实现,常见的应用软 件有: 1)Photoshop Photoshop 简称 PS,是美国 Adobe 公司最为出名的图像处理软件之一,广泛应用于平面 设计、图片修复、广告设计、艺术文字、网页制作、建筑效果图等领域,能够实现图像编辑、 图像合成、校色调色及特效制作等功能。 2)CorelDRAW CorelDRAW 是加拿大的 Corel 公司开发的图形图像软件,是非常出色的矢量平面设计软 件,具有全面、强大的矢量图形制作和处理功能,可以创建从简单的图案到需求很高绘画技法 的美术作品,它具有很好的图文混排功能,同时具有强大的导入和导出功能,有极强的兼容性。 可以进行影视广告、产品造型、海报招贴、宣传手册、图文报表等制作。 3)FreeHand FreeHand 是 Adobe 公司软件中的一员,简称 FH,是一个功能强大的平面矢量图形设计软 件,可应用于广告创意、做机械制图、绘制建筑蓝图等领域,且与相关程序的兼容性好,能轻 易地在程序中转换格式,可输入及输出适用于 Photoshop、Illustrator、CorelDRAW、Flash、 Director 等使用的文件格式。 4)Illustrator Illustrator 是美国 Adobe 公司推出的专业矢量绘图工具。Adobe Illustrator 是出版、多媒体 和在线图像的工业标准矢量插画软件。 5)FireWorks FireWorks 是 Adobe 公司出品的软件,是一款创建与优化 Web 图像和快速构建网站与 Web 界面原型的理想工具,同时具备编辑矢量图形与位图图像的功能。 6)3ds max 3ds max 是 Autodesk 公司开发的基于 PC 系统的三维动画渲染和制作软件,广泛应用于广 告、影视、工业设计、建筑设计、多媒体制作、游戏、辅助教学以及工程可视化等领域,还被 广泛地应用于电视及娱乐业中,比如片头动画和视频游戏的制作等。 7)MAYA MAYA 是美国 Autodesk 公司出品的三维动画软件,应用于专业的影视广告、角色动画、 电影特技等。MAYA 功能完善,工作灵活,易学易用,制作效率极高,渲染真实感极强,是 电影级别的高端制作软件,掌握了 MAYA,会极大地提高制作效率和品质,调节出仿真的角 145.

(7) 大学计算机基础. 色动画,渲染出电影一般的真实效果。 8)Flash Flash 是由 Adobe 公司出品的一种动画创作工具,设计人员和开发人员可使用它来创建演 示文稿、应用程序和其他允许用户交互的内容。Flash 可以包含简单的动画、视频内容、复杂 演示文稿和应用程序以及介于它们之间的任何内容。通常,使用 Flash 创作的各个内容单元 称为应用程序,即使它们可能只是很简单的动画。你可以通过添加图片、声音、视频和特殊效 果,构建包含丰富媒体的 Flash 应用程序。 9)Premiere Premiere 由 Adobe 公司出品,是一种基于非线性编辑设备的视音频编辑软件,可以在各 种平台下和硬件配合使用,被广泛地应用于电视台、广告制作、电影剪辑等领域,成为 PC 和 MAC 平台上应用最为广泛的视频编辑软件。它是一款相当专业的 DV(Desktop Video)编辑 软件,专业人员结合专业的系统的配合可以制作出广播级的视频作品。在普通的微机上,配以 比较廉价的压缩卡或输出卡也可制作出专业级的视频作品和 MPEG 压缩影视作品。 10)ImageReady Image Ready 是由 Adobe 公司开发的,以处理网络图形为主的图像编辑软件。可以用来制 作 GIF 动画,编辑图片,并能实现图片超链接。 5.1.4 多媒体关键技术 1.媒体数据压缩/解压缩技术 数字化的图像、声音等媒体数据量非常大。一张彩色相片的数据量可达近 100MB;未经 压缩的视频图像处理时的数据量约为 28Mb/s;播放一分钟立体声音乐需要 100MB 的存储空间。 这对计算机的存储和网络的传输都造成了极大的负担。因此,必须进行数据压缩,压缩后再存 储和传输,到应用时再解压还原。数据压缩是通过数据编码实现的。编码理论的研究已有 40 多年的历史,其技术日趋成熟。 2.多媒体专用芯片技术 基于超大规模集成电路(VLSI)技术的多媒体专用芯片是多媒体硬件体系结构的关键技术 之一。这是因为要实现音频、视频信号的快速压缩、解压和播放处理,需要大量的快速计算; 要实现图像的特殊效果,如改变比例尺、淡入淡出、图像的生成与绘制、音频信号的处理等都 需要采用专用芯片进行处理,才能取得满意效果。目前,多媒体专用芯片可以分为以下三类: (1)多媒体信号的采集和播放芯片。通常采用模拟电路和数字电路集成在一个芯片中的 混合电路方法制作而成。这类芯片的主要功能有:A/D 转换、D/A 转换及一些简单的处理功能。 (2)固定功能的高速信息处理芯片。它的内部固化了某种算法,能对语音和视频数据进 行压缩和存储,如 C-Cube 公司用于 MPEG 视频压缩的芯片 CLM4100。 (3)可编程的信息处理芯片。它采用所谓的“微码引擎”(Microcode Engine),通过编程 实现不同的处理功能(如各种压缩、解压缩算法),如 IIT 公司的视频控制器和视频处理器芯 片,可编程实现 JEPG、MPEG-1 等图像与声音处理标准。目前,高速信息处理芯片成本较高, 只有当 VLSI 芯片技术有较大发展时,才有可能得到较大的普及。 3.大容量存储技术 数字化的多媒体信息经过压缩处理,数据量仍然非常大。因此,承载多媒体信息和多媒 146.

(8) 第 5 章 多媒体技术基础及应用. 体软件的载体形式一直是人们研究的课题。 光盘存储器(Compact Disk,CD)已有十多年的发展历史,目前已有许多标准。常用的 CD-ROM 光盘的存储量达 650MB(相当于 500 片软磁盘的容量) ,VCD 光盘可存储 70 分钟 的 MPEG-1(一种影视节目中的动态图像压缩和声音压缩的工业标准)影视节目。但要存储时 间更长的 MPEG-2(比 MPEG-1 更高的一种标准)节目,VCD 就无能为力了。MPEG-2 是适 合于数字电视/多用途光盘(DVD)的标准。DVD 具有更密的数据轨道,更大的存储容量,单 面单层可达 4.7GB(存 133 分钟 MPEG-2 视频),单面双层可达 8.5GB,双面双层可达 17GB (相当于 25 片 CD 盘) 。目前,DVD 技术仍在发展中。 以上介绍的只是只读式光盘。为了方便用户制作多媒体节目或软件,人们又研制了可写 光盘和一次可写光盘。另外从最早的 150KB/s 发展到现在的 40 倍速即 6MB/s。它已从原来的 与软盘相当的读出速度,发展到与硬盘接近的读出速度。 4.媒体输入/输出技术 媒体输入/输出技术包括以下几个方面: (1)媒体变换技术。是指改变媒体的表现形式,如当前广泛使用的视频卡、音频卡(声 卡)都属于媒体变换设备。 (2)媒体识别技术。是对信息进行一对一的映像过程。例如语音识别是将语音映像为一 串字、词或句子;触摸屏是根据触摸屏上的位置识别其操作要求。 (3)媒体理解技术。是对信息进行更进一步地分析处理和理解,如自然语言理解、图像 理解、模式识别等。 (4)媒体综合技术。是把低维信息表示映像成高维模式空间的过程,例如语音合成器就 可以把语音的内部综合表示为声音输出。前两种技术相对比较成熟,应用较广泛。而媒体理解 和综合技术目前还不成熟,只用于某些特定场合。但这些课题的研究正在受到普遍重视。 输入/输出技术的进一步发展趋势是: 1)人工智能的输入/输出技术:主要包括语音识别与合成、语言翻译及语言和文本间的转 换;图像识别和处理,图文、表分离技术;输入技术和智能推理技术等。 2)外围设备控制技术:主要包括多媒体文件存储、数据格式转换、控制界面、外围设备 驱动程序、调色板控制、高分辨率全彩色显示、三维彩色、声音效果处理和通信效果处理、多 媒体窗口程序等。 3)多媒体网络传输技术:主要包括网络管理技术、高速网络协议、开放式文件结构、视 频会议、不同网络间的传输技术、ISDN 通信技术和电子邮件传送等。多媒体信息传输对网络 的基本要求是同步的、不间断的。 5.多媒体数据库 目前,多媒体数据应用需求迅速扩大,促使人们加快了研究多媒体数据库的步伐,多媒 体数据库的研究内容有以下几个方面: (1)数据模型。建立数据模型是实现多媒体数据库的关键。目前,人们提出了以下 4 种 模型: 1)扩充的关系模型:在传统关系数据库的基础上加以扩充,使之支持多媒体数据类型。 2)基于面向对象的模型:在面向对象的语言中嵌入数据库功能,形成多媒体数据库。这 147.

(9) 大学计算机基础. 种方法的关键是如何在面向对象语言中增加对持久性对象的存储管理。 3)基于超文本(Hypertext)的模型或超媒体方法。 4)开发全新的数据模型,从底层实现多媒体数据库系统。 该方法首先建立一个包含面向对象数据库核心概念的数据模型,设计相应的语言和相 应的面向对象数据库管理系统的核心。该方法的优点是系统结构清晰、效率高;缺点是难 度大,因为缺乏统一的数据模式及形式化理论,在查询、优化视图及数据库工具方面仍存 在不足。 (2)数据压缩和还原。在计算机中,结构化数据(文字、数值)都是在编码后进行存放 的,而非结构化数据(图形、图像、声音)也必须转换成可识别和处理的编码。非结构化数据 占用的存储空间很大,因此,在存储时必须进行数据压缩,重放时进行数据还原。采用压缩技 术时要考虑算法复杂度,实现速度和压缩质量等问题。 (3)存取管理和存取方法。对动态声音和图像形成的文件即使进行了压缩,其存储量也 十分惊人。文件一般是采用分页管理。目前,常用的存取方法是 B+树和 Hash 方法。 (4)用户界面。用户界面除提供多媒体功能调用外,还应提供对各种媒体的编辑功能和 变换功能。 (5)分布式技术。传统的分布式系统在管理多媒体数据时已不能满足要求。因此,需要 考虑以下问题:局部管理中的数据模型和数据压缩等问题;全局管理中多媒体数据集成、查询、 调度和共享问题;多媒体数据在网上传输所要求的带宽问题。 (6)智能多媒体数据库。它将人工智能技术与多媒体数据库技术结合在一起,使数据库 产生新的飞跃,这将是重要的发展方向。 6.多媒体网络通信技术 现有的计算机网络有一些是早期建立的,当时主要是为了在网络和用户之间传送文字数 据。而今天,人们要求传输的内容是图、文、声、像集于一体的多媒体数据。显然,传统的计 算机网络已力不从心了,多媒体通信网络应运而生。 多媒体通信网络要解决两个主要问题。 (1)网络带宽(即“信息公路”的宽度)问题。由于多媒体数据量十分庞大,它要求网 络有极高的传输速率,才能胜任多媒体数据的传输。比如,一个 MPEG-1 的视频流所占带宽 (即传输速率)为 1.5Mb/s,若使用 10Mb/s 的低速网络,在不发生碰撞的情况下,也传不了 几路;使用 100Mb/s 的中速网络情况会好一些,但对于质量稍高的 MPEG-2 视频流,也同样 传不了几路。因此,研究并建立高速的网络就成为多媒体网络应用的关键。从这个意义上说, “信息高速公路”实际上就是能顺利地传输多媒体信息的宽带的计算机网络。 (2)多媒体数据的同步问题。多媒体信息中,声像同步、实时播放是很基本的应用要求, 人们难以忍受声音和画面反复停顿、声音与画面不同步的情况发生。但在计算机网络中,多媒 体数据的同步却需要花费较大的力气来解决。现在已经有一些网络比较适合传输多媒体数据, 比如环形网络 FDI(光纤分布式数据接口),基于 ATM(异步传输模式)技术的 B-ISDN(宽 带综合业务数据网),以及千兆以太网(Gigabit Ethernet)。美国正在研究速率比千兆高出 100 倍的超高速网络,名为 Internet-2 和 NGI 计划。. 148.

(10) 第 5 章 多媒体技术基础及应用. 5.2. 常见多媒体技术规格. 多媒体有图形图像、音频、视频和流媒体等多种媒体形式。 5.2.1 图形图像 1.图形(Graphics) 图形是指由外部轮廓线条构成的矢量图,即由计算机绘制的直线、圆、矩形、曲线、图 表等内容。矢量图使用直线和曲线来描述图形,这些图形的元素是一些点、线、矩形、多边形、 圆和弧线等。矢量图形文件体积一般较小,矢量图形最大的优点是无论放大、缩小或旋转等都 不会失真。Adobe 公司的 FreeHand、Illustrator,Corel 公司的 CorelDRAW 都是用来制作矢量 图的软件,Flash MX 制作的动画也是矢量图形动画。 2.图像 图像则是指由输入设备捕捉的实际场景画面或以数字化形式存储的任意画面。图像是由 一些排列的像素组成的,在计算机中的存储格式有 BMP、PCX、TIF、GIFD 等,一般数据量 比较大。它除了可以表达真实的照片外,也可以表现复杂绘画的某些细节,并具有灵活和富有 创造力等特点。在 PC 中,最常用的图像文件有如下几种。 (1)BMP。BMP 是 BitMap 的缩写,即位图文件。它是图像文件的最原始格式也是最通 用的,但其存储量极大。Windows 的“墙纸”图像,就是用的这种格式。 (2)JPG。JPG 全名是 JPEG,是一种图像压缩标准。这个标准的压缩算法用来处理静态 的图像,去掉冗余信息,比较适合用来存储自然景物的图像。它具备两大优点:文件数据量小 以及保存 24 位真彩色的能力。而且可用参数调整压缩倍数,以便在保持图像质量和争取文件 尽可能小两个方面进行权衡。新的适合互相交换的 JPEG 文件格式则使用.JIF 作扩展名。 (3)GIF。GIF(Graphics Interchange Format)的原义是“图像互换格式”,是 CompuServe 公司在 1987 年开发的图像文件格式,使用非常普遍,适合在网上传输交换。 GIF 分为静态 GIF 和动画 GIF 两种,扩展名为.gif,是一种压缩位图格式,支持透明背景 图像,适用于多种操作系统, “体型”很小,网上很多小动画都是 GIF 格式。其实 GIF 是将多 幅图像保存为一个图像文件,从而形成动画,所以归根到底 GIF 仍然是图片文件格式。但 GIF 只能显示 256 色。和 jpg 格式一样,这是一种在网络上非常流行的图形文件格式。 (4)TIF。TIFF 是一种比较灵活的图像格式,它的全称是 Tagged Image File Format,文 件扩展名为 TIF 或 TIFF。该格式支持 256 色、24 位真彩色、32 位色、48 位色等多种色彩位, 同时支持 RGB、CMYK 以及 YCbCr 等多种色彩模式,支持多平台。TIFF 格式可以制作质量 非常高的图像,因而经常用于出版印刷。 它可以显示上百万的颜色(尽管灰度图像仅局限于 256 色或底纹),通常用于比 GIF 或 JPEG 格式更大的图像文件。 (5)WMF。WMF 是 Windows MetaFile 的缩写,简称图元文件,它是微软公司定义的一 种 Windows 平台下的图形文件格式,Microsoft Office 的剪贴画使用的就是这个格式,是常见 的矢量图格式。. 149.

(11) 大学计算机基础. 5.2.2 音频 在计算机内,所有的信息均以数字形式表示。各种命令是不同的数字;各种幅度的物理量是 不同的数字;声音信号也用一系列数字表示,称为数字音频,其特点是保真度好,动态范围大。 常用音频文件格式有: 1.WAV 文件 是微软公司开发的一种声音文件格式,它符合 PIFF 文件规范,用于保存 Windows 平台 的音频信息资源,被 Windows 平台及其应用程序所支持。*.wav 格式支持多种压缩算法,支持 多种音频位数、采样频率和声道,标准格式的 WAV 文件和 CD 格式一样,是 44.1kHz 的采样 频率,速率 88k/s,16 位量化位数,WAV格式的声音文件质量和 CD 相差无几,也是目前 PC 上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV 格式。 但缺点是体型 过于“巨大” 。 2.CD 格式文件 CD 是当今世界上音质最好的音频格式。大多数播放软件的“打开文件类型”中,都可以 看到*.cda 格式,这就是 CD 音轨了。标准 CD 格式也就是 44.1kHz 的采样频率,速率 88k/s, 16 位量化位数,因为 CD 音轨可以说是近似无损的,因此它的声音基本上是忠于原声的。CD 光盘可以在 CD 唱机中播放,也能用电脑里的各种播放软件来重放。一个 CD 音频文件是一个 *.cda 文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论 CD 音乐的长短, 在电脑上看到的*.cda 文件都是 44 字节长。所以不能直接地复制 CD 格式的*.cda 文件到硬盘 上播放,需要使用像 eac 这样的抓音轨软件把 CD 格式的文件转换成 WAV 格式后才能放到磁 盘中播放。 3.MIDI 文件 乐器数字接口(Musical Instruments Digital Interface,MIDI)是世界上主要电子乐器器制 造厂商建立起来的一个通信标准,规定了计算机音乐程序、电子合成器和其他电子设备之间交 换音乐信息与控制信号的方法。MIDI 文件中包含音符、定时和 16 个声道的乐器定义,每个 音符包括键、声道号、持续时间、音量和力度等信息。所以 MIDI 文件记录的不是乐曲本身, 而是一些描述乐曲演奏过程的指令。 由于 MIDI 文件记录的是一系列指令而不是数字化后的波形数据,因此它占用的存储空间 比 WAV 文件小得多,所以预先装入 MIDI 文件比装入 WAV 文件要容易得多。这为设计多媒 体应用系统和指定何时播放音乐带来很大的灵活性。但是 MIDI 文件的录制比较复杂,要学习 一些 MIDI 的专业知识,并且还必须有专门工具,如键盘合成器。 MIDI 格式的最大用处是在电脑作曲领域。MIDI 文件可以用作曲软件写出,也可以通过 声卡的 MIDI 口把外接音序器演奏的乐曲输入电脑里,制成 MIDI 文件。 4.MP3 MP3格式诞生于 20 世纪 80 年代的德国,所谓的 MP3 也就是指的是 MPEG 标准中的音频部 分,也就是 MPEG 音频层。根据压缩质量和编码处理的不同分为 3 层,分别对应*.mp1、*.mp2、 *.mp3 这 3 种声音文件。MPEG 音频文件的压缩是一种有损压缩,MPEG3音频编码具有 10:1~ 12:1 的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中 12kHz 到 16kHz 高. 150.

(12) 第 5 章 多媒体技术基础及应用. 音频这部分的质量来换取文件的尺寸。相同长度的音乐文件,用*.mp3 格式来储存,一般只有 *.wav 文件的 1/10,而音质要次于 CD 格式或 WAV 格式的声音文件。由于其文件尺寸小、音质 好,所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为*.mp3 格式的发展提供了 良好的条件。直到现在,这种格式还是风靡全球,作为主流音频格式的地位难以被撼动。MP3 音乐的版权问题也一直是找不到办法解决,因为 MP3 没有版权保护技术,就是谁都可以用。 MP3 格式压缩音乐的采样频率有很多种,可以用 64Kb/s 或更低的采样频率节省空间,也 可以用 320Kb/s 的标准达到极高的音质。 用装有 Fraunhofer IIS Mpeg Lyaer3 的 MP3 编码器(现 在效果最好的编码器)MusicMatch Jukebox 6.0 在 128Kb/s 的频率下编码一首 3 分钟的歌曲, 得到 2.82MB 的 MP3 文件。采用缺省的 CBR(固定采样频率)技术可以以固定的频率采样一 首歌曲,而 VBR(可变采样频率)则可以在音乐“忙”的时候加大采样的频率获取更高的音 质,不过产生的 MP3 文件可能在某些播放器上无法播放。我们把 VBR 的级别设定成为与前 面的 CBR 文件的音质基本一样,生成的 VBR MP3 文件为 2.9MB。 5.WMA WMA(Windows Media Audio)格式是来自于微软,音质要强于 MP3 格式,更远胜于 RA 格式,它和日本 YAMAHA 公司开发的 VQF 格式一样,是以减少数据流量但保持音质的方法 来达到比 MP3 压缩率更高的目的,WMA 的压缩率一般都可以达到 1:18 左右,WMA 的另一 个优点是内容提供商可以通过 DRM(Digital Rights Management)方案,如 Windows Media Rights Manager 7 加入防复制保护。这种内置的版权保护技术可以限制播放时间和播放次数甚 至于播放的机器等,另外 WMA 还支持音频流(Stream)技术,适合在网络上在线播放,作为 微软抢占网络音乐的开路先锋可以说是技术领先、风头强劲,更方便的是不用像 MP3 那样需 要安装额外的播放器,而 Windows 操作系统和 Windows Media Player 的无缝捆绑让你只要安 装了 Windows 操作系统就可以直接播放 WMA 音乐,新版本的 Windows Media Player 更是增 加了直接把 CD 光盘转换为 WMA声音格式的功能,在 Windows XP 中,WMA 是默认的编码 格式。 WMA 格式在录制时可以对音质进行调节。同一格式,音质好的可与 CD 媲美,压缩率较 高的可用于网络广播。虽然现在网络上还不是很流行,但是在微软的大规模推广下已经是得到 了越来越多站点的承认和大力支持,在网络音乐领域中直逼*.mp3,在网络广播方面,也正在 瓜分 Real 打下的天下。因此,几乎所有的音频格式都感受到了来自WMA 格式的压力。 5.2.3 视频 视频图像是一种活动影像,它与电影(Movie)和电视原理是一样的,都是利用人眼的视 觉暂留现象,将足够多的画面(Frame-帧)连续播放,只要能够达到每秒 20 帧以上,人的 眼睛就觉察不出画面之间的不连续性。常用视频格式文件如下: 1.MPEG/MPG/DAT MPEG 是 Motion Picture Experts Group 的缩写。这类格式包括了 MPEG-1、MPEG-2 和 MPEG-4 在内的多种视频格式。MPEG-1 被广泛地应用在 VCD 的制作和一些视频片段下载的 网络应用上面,大部分的 VCD 都是用 MPEG 1 格式压缩的(刻录软件自动将 MPEG 1 转 151.

(13) 大学计算机基础. 为.dat 格式),使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右 大小。MPEG-2 则是应用在 DVD 的制作,同时在一些 HDTV(高清晰电视广播)和一些高 要求视频编辑、处理上面也有相当多的应用。使用 MPEG-2 的压缩算法压缩一部 120 分钟 长的电影可以压缩到 5~8 GB 的大小(MPEG-2 的图像质量是 MPEG-1 无法比拟的)。 2.AVI AVI(Audio Video Interleaved,音频视频交错)的英文缩写。AVI 这个由微软公司发表的 视频格式在视频领域已经存在好多个年头了。AVI 格式调用方便、图像质量好,但缺点就是文 件体积过于庞大,压缩标准不统一。 3.ASF ASF(Advanced Streaming Format,高级流格式)是微软公司为了和现在的 Real Player 竞 争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF 使用了 MPEG-4 的 压缩算法,压缩率和图像的质量都很不错。因为 ASF 是以一个可以在网上即时观赏的视频“流” 格式存在的,所以它的图像质量比 VCD 差一点点并不出奇,但比同是视频“流”格式的 RAM 格式要好。 4.WMV 一种独立于编码方式的在 Internet 上实时传播多媒体的技术标准,Microsoft 公司希望用其取 代 QuickTime 之类的技术标准以及 WAV、AVI 之类的文件扩展名。WMV 的主要优点在于:可扩 充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。 5.3GP 3GP 是一种 3G 流媒体的视频编码格式, 主要是为了配合 3G 网络的高传输速度而开发的, 也是目前手机中最为常见的一种视频格式。简单地说,该格式是“第三代合作伙伴项目” (3GPP)制定的一种多媒体标准,使用户能使用手机享受高质量的视频、音频等多媒体内容。 其核心由包括高级音频编码(AAC)、自适应多速率(AMR)和 MPEG-4 和 H.263 视频编码 解码器等组成,目前大部分支持视频拍摄的手机都支持 3GPP 格式的视频播放。 5.2.4 流媒体 1.流媒体技术 流媒体是从英语 Streaming Media 中翻译过来,它是一种可以使音频、视频和其他多媒体 能够在 Internet 及 Intranet 上以实时的、无需下载等待的方式进行播放的技术。流媒体文件格 式是支持采用流式传输及播放的媒体格式。流式传输方式是将动画、音视频等多媒体文件经过 特殊的压缩方式分成一个个压缩包,由视频服务器向用户计算机连续、实时传送。在采用流式 传输方式的系统中,用户不必像非流式播放那样等到整个文件全部下载完毕后才能看到当中的 内容,而是只需经过几秒或几十秒的启动延时即可在用户的计算机上利用相应的播放器或其他 的硬件、软件对压缩的动画、视音频等流式多媒体文件解压后进行播放和观看,多媒体文件的 剩余部分将在后台的服务器内继续下载。 2.流媒体系统的组成 流媒体系统包括以下 5 个方面的内容。 152.

(14) 第 5 章 多媒体技术基础及应用. (1)编码工具。用于创建、捕捉和编辑多媒体数据,形成流媒体格式。 (2)流媒体数据。流媒体传输的内容。 (3)服务器。存放和控制流媒体的数据实体。 (4)网络。适合多媒体传输协议甚至是实时传输协议的网络。 (5)播放器。供客户端浏览流媒体文件。 这 5 个部分有些是网站需要的,有些是客户端需要的,而且不同的流媒体标准和不同公 司的解决方案会在某些方面有所不同。 5.2.5 常用多媒体处理软件 1.Windows Media Player Windows Media Player 是微软公司出品的一款免费的播放器,是 Microsoft Windows 的一 个组件,通常简称 WMP。支持通过插件增强功能。 2.Real Player Real Player 是一个在 Internet 上通过流技术实现音频和视频的实时传输的在线收听工具软 件,使用它不必下载音频/视频内容,只要线路允许,就能完全实现网络在线播放,极为方便 地在网上查找和收听、收看自己感兴趣的广播、电视节目。 3.Winamp Winamp 是一个非常著名的高保真的音乐播放软件,支持 MP3、MP2、MOD、S3M、MTM、 ULT、XM、IT、669、CD-Audio、Line-In、WAV、VOC、AVI、OGG、WMV、MPG 等多种 音频和视频格式。可以定制界面 Skins,支持增强音频视觉和音频效果的 Plug-ins,通过一些 非常实用的扩展插件来增强其功能。 4.会声会影 会声会影是 Ulead(友立)公司出品的一套操作简单的DV、HDV影片剪辑软件。具有成 批转换功能与捕获格式完整的特点。不仅完全符合家庭或个人所需的影片剪辑功能,甚至可以 挑战专业级的影片剪辑软件。 会声会影的影片制作向导模式,只要三个步骤就可快速做出 DV 影片,即使是入门新手也 可以在短时间内体验影片剪辑乐趣;同时操作简单、功能强大的会声会影编辑模式,从捕获、 剪接、转场、特效、覆叠、字幕、配乐,到刻录,让用户全方位剪辑出好的家庭电影。 5.Authorware Authorware 是常见的多媒体开发工具,由美国 Macromedia 公司开发的一种多媒体制作软 件,Authorware 是一个功能强大的图标导向式的多媒体制作工具,非专业人员也可以快速开 发多媒体软件,它无需传统的计算机语言编程,只通过对图标的调用来编辑一些控制程序走向 的活动流程图,将文字、图形、声音、动画,视频等各种多媒体项目数据汇在一起,就可达到 多媒体软件制作的目的。Authorware 这种通过图标的调用来编辑流程图用以替代传统的计算 机语言编程的设计思想,是它的主要特点。 利用 Authorware 编制的软件具有强大的交互功能,可任意控制程序流程;在人机对话中, 它提供了按键、按鼠标、限时等多种应答方式;它还提供了许多系统变量和函数以根据用户响 应的情况,执行特定功能;编制的软件除了能在其集成环境下运行外,还可以编译成扩展名. 153.

(15) 大学计算机基础. 为.exe 的文件,在 Windows 系统下脱离 Authorware 制作环境运行。. 习题五 一、选择题 1.下面格式中,( )是音频文件格式。 A.WAV 格式 B.JPG 格式 C.DAT 格式 D.MIC 格式 2.在 Windows 系统中,不属于多媒体播放软件的是( )。 A.超级解霸 B.Real Player C.Flash D.Windows Media Player 3.多媒体应用必须解决大容量存储器问题,采用( )是一个较好的解决方案。 A.大容量硬盘 B.大容量软盘 C.CD 光盘 D.大容量磁带 4.使用 CorelDRAW 绘制出来的是( )。 A.矢量图像 B.矢量图形 C.光栅图像 D.光栅图形 5.网络音乐的主要格式是( )。 A.MP3 B.JPG C.AVI D.ZIP 6.下列说法中,不正确的说法是( )。 A.多媒体信息不包括文字、图形 B.多媒体技术标准包括 JPEG、MPEG 等 C.多媒体计算机中的视频卡处理的是静止或运动的图像信号 D.多媒体计算机系统是由多媒体计算机硬件系统和多媒体计算机软件系统组成 7.在下面的图形图像文件格式中,( )可实现动画。 A.WMF B.BMP C.JPG D.GIF 8.位图图像是由( )来描述图像的。 A.像素 B.点和线 C.像素、点和线 D.直线和曲线 9.在下面的软件中, ( )是三维动画制作工具。 A.Flash B.Premiere C.Director D.MAYA 10.在下面的软件中, ( )是常用的多媒体制作工具。 A.Premiere B.超级解霸 C.Flash D.Authorware 11.在下面的图形图像文件格式中,( )为矢量图形。 154.

(16) 第 5 章 多媒体技术基础及应用. A.BMP B.JPG C.WMF D.GIF 12.在下面的图形图像文件格式中,( )为矢量图形。 A.BMP B.JPG C.WMF D.GIF 13.只要将麦克风正确连接到计算机的声卡接口,就可以利用 Windows 自带的( 进行录音处理,并能形成一个声音文件。 A.音量控制 B.Windows Media Player C.CD 播放器 D.录音机 14.所谓媒体,是指( )。 A.表示和传播信息的载体 B.各种信息的编码 C.计算机的输入与输出信息 D.计算机屏幕显示的信息 15.使用扫描仪扫描得到的是( )。 A.光栅图像 B.矢量图像 C.矢量图形 D.光栅图形. ). 二、简答题 1.简述什么是媒体和多媒体。 2.多媒体技术主要包含哪些方面? 3.常见多媒体格式有哪些?. 155.

(17)

參考文獻

相關文件

項次 資格 應檢具證明文件. 設有社會工作或幼兒保育相 關學院、系、所、學位

敦煌患文雖然是禮懺法門的應用文書,有點格式化與過分老套的語言形式,但是卻保存

各块报告模板包括所谓的模板对象, 或对象, 每个被分配到某一 SpecManager 项目(光谱, 表格, 化学结构...) 或其它项目(文本标签)

清初道光年間出土了一件一級文物——大盂(粵音余)鼎。這個鼎在周康王二十 三年鑄造,腹內側鑄有 19 行銘文,分 2 段,共

Segmented Bushy Path 分為兩個步驟,第一個步驟是文件結構的切割 (Text Segmentation),也就是分析文件內容並將文件內容切割成幾個具有代 表的結構。Text Segmentation

学校现有教学仪器设备超过1亿元,学校图书馆纸质藏书125万册,电子图书

• S4- 閱讀時眼睛看著文 字,細聲讀出來。學生 對文字的排列及一字一 音有鞏固的認識,能以 手指指著文字閱讀。識 字量一般,能認讀關鍵 詞語而大致理文字意思。.

Motion 動畫的頭尾影格中只能有一個 Symbol 或是群組物件、文字物件;換 言之,任一動畫須獨佔一個圖層。.. Motion