艺术世界 2012年3月261 期

以无声的杂志来讨论声音并不是一件容易的事。我们尝试着提供给大家一些形态各异的“屋子”,让声音变得更清楚。只有走进那些“屋子”,声音才变得相对真实。

从遇见声音开始(节选)

殷漪|文

作为个体的人,我们是在什么时候开始遇见声音的呢?

答案是在我们还没有出生的时候。那时还在母亲子宫里的我们与外界的接触最初是从声音开始的。在其他感观系统——视觉、嗅觉、触觉、味觉,都还没有发育成型之时,我们已经用完美的听觉系统开始接收母亲身体之外的信息了。

这是否意味着我们更需要声音呢?这是否意味着在某个阶段,声音对我们来说远较其他重要呢?

 

声音是如何诞生的?

音叉振动,声波通过空气传至耳朵。发声体由于外力发生振动,力被传递给周围的空气分子,促使空气分子发生振动,以此类推,空气分子使鼓膜发生振动。在这个过程中力被传递了出去。

 

从物理学的角度看,声音的本质是“振动”——发声体在外力的作用下围绕其初始位置做往返运动。我们可以把它看作是一个系统状态出现了变化,这个系统在两种能量形式间——动能和势能——进行着能量转换。我们需要传播媒介才能接收这种能量转换,通常情况下这传播媒介是空气。所以简单地说,我们听到的声音是耳朵接收到的大气压力变化。

也许你会好奇,产生声音的过程中不可缺少的条件有哪些?除了空气,还有哪些媒介可以传播声音?事实上,如果外力不持续,这种振动并不会永久地保持下去(想想永动机的不存在),而是最终会趋向于静止。所以声音会消失,因为大气压力不变化了。因为大气压力变化有开始有结束,所以声音又和时间联系在了一起。

科学家们用两个最为基本的物理称量去描述“振动”:频率和振幅。其中,频率是指单位时间内物体振动的次数,在这里单位时间为一秒钟。振幅是指物体振动的幅度,也就是振动物体离开初始位置的距离。这两个称量也是声音最为重要的称量。频率的国际单位是赫兹,记作 Hz。振幅的国际单位是分贝,记作 dB。而物体与偏离平衡位置的位移大小成正比,方向总是指向平衡位置且处于回复力作用下的振动叫简谐振动,同时它也是最简单、最基本的振动。

因为简谐振动的物体位移是按正弦函数(或余弦函数)的规律随时间变化的,所以它的运动轨迹是一个正弦波形。我们把简谐振动发出的声音叫做“正弦波声”。由于这种振动过于规律且具有严格的周期性,所以它在自然界中几乎是不存在的,我们在日常生活中也很少听到。事实上,在影院开始播放电影之前伴随着倒计时画面的“滴”声便是一个频率为 1KHz(一秒钟振动一千次)的“正弦波声”。同时因为这个声音只包含一个频率,所以我们也称它为“纯音”。正如名字一样,它在听感上是纯净圆润的。

在现实世界里(包括自然界和人类世界),绝大多数声音都不是纯音,绝大多数的声音都包含很多个频率。这些不同的频率随着时间的变化进行着非周期性的变化,其中最为复杂的就属人类的语言,我们把这类声音称为“瞬态复合声”。那么,我们究竟如何分析这种复合在一起的声音呢?1822 年,法国物理学家、数学家傅立叶(Jean Baptiste Joseph Fourier)曾发表著名的“傅立叶变换理论”(Fourier Transform)。他发现,任何声音都可以被分解成具有不同频率、振幅和相位的“正弦波声”的叠加。反过来,我们可以把不同频率、振幅和相位的“正弦波声”叠加,进而得到任何我们想要的声音。这一理论的提出,无疑为后辈的学者在声音分析和音频合成领域里的研究,以及数字信号处理技术的发展提供了一个重要的起点。

声音在空气中的传播是以波的形式出现的。它与同样以波形式传播的“光”有着几乎相同的传播方式:直线传播——直射;遇到界面会反射(遵循镜面反射原理);穿过不同密度的介质时会出现折射;不过,声波有一种光没有的传播方式:衍射。当声波遇到阻碍物时,它有绕过阻碍物的能力,又称绕射。

 

人耳如何听见声音?

我们总是说“耳朵听到声音”。事实上,这里所说的耳朵只是指外耳。人耳拥有一套设计精良、分工精确的听觉系统,主要包括外耳、中耳和内耳。

我们的听觉系统通过一系列器官的工作把声音从声学能量转换成机械能量、流体能量,直至大脑可以接收的微电脉冲——脑电波。一切如此神奇而精确。令人不可思议的还有,我们能够分辨两个声音时差的最小值是 20 毫秒(千分之二十秒);外界声音突然变响时,与听小骨相连的听小肌会收紧,阻止听小骨运动,保护我们的听觉系统不受损伤;我们需要200毫秒的时间做多次分析,在确保分析结果无误的情况下再把信息传向大脑,所以说我们听到的声音永远比实际出现的声音晚 200 毫秒。

但是,我们的听觉系统还是具有明显的局限性。比如,我们感知到所有频率的振动。我们能听到的声音频率在 20 赫兹至 20000 赫兹之间。低于 20 赫兹、高于 20000 赫兹的振动我们都无法感知。低于 20 赫兹的振动,我们称为“次声波”,高于 20000 赫兹的振动我们称为“超声波”。再比如,随着年龄的增长,我们对于高频的声音感知灵敏度会不断下降,我们称为“老年性耳聋”,这就是老人耳背的原因。

 

世界真是如我们所听到的那样吗?

世界真是如我们所听到的那样吗?这看起来像是一个哲学问题,不应该有标准答案。但是在听觉研究中,特别是声学心理学领域中的答案是唯一的:不是。我们听觉生理系统和听觉心理机制是一个非线性的系统。简单地说,声音在物理上的变化量(振幅变化)与我们实际感知到的变化量(响度变化)不是一一对应的。其中最为明显和关键的是:相对于低频,我们对于高频来的更加敏感。尝试一下在你的播放设备上播放一首流行歌曲,慢慢降低音量,直至几乎听不见。你会发现,消失最快的是低频,然后是中频,最后能听到的可能只有节奏乐器里金属擦片的敲击声和人声了,因为它们都富含高频。这也是为什么我们都使用频率高的声音作为警报声。

此外,现实中我们往往在短时间内听到很多的声音。同时这些声音会相互干扰,我们把这种现象称为“掩蔽效益”。当两个声音同时出现,相比较它们单独出现,我们会感觉两个声音都无法听清楚,或者说一个声音被另一个声音部分地或者完全地掩蔽。想一想,我们在吃晚饭。饭桌上爸爸妈妈一直在讨论今天的一则新闻,以至于你无法听清楚电视机里电视连续剧的旁白,当然你也无法听清你爸妈的对话。这如同“掩蔽效应”定义的前半段。后半段是,你用电脑看影片,你能够听清桌面音箱里传来的音乐,但你听不到电脑机箱里风扇的声音。从这两个例子中你可以知道,“掩蔽效益”很大程度和“掩蔽声”和“被掩蔽声”之间的响度有关系。

如果两个声音不是同时发生呢?同样会出现“掩蔽效益”。先出现的较响的声音能够掩蔽在其声音结束后出现的较轻的声音,这叫“前掩蔽”。“前掩蔽”产生的前提条件是:前一声音结束到后一声音开始之间的时差最大不能超过 30 毫秒,即千分之三十秒。有趣的是还有“后掩蔽”。一个声音能够被在其声音结束后出现的声音所掩蔽,其有效间隔时间为 10 毫秒。当然,要注意的是,这里所说的时间数据是因人而异的。 如果同时出现很多声音呢?我们的听觉系统没有能力同时处理大于三条的声音信息。所以当多个声音同时出现时,我们会把它们听成一个整体——“声音流”。我们得到一种模糊的整体声音印象,而不是各个声音的简单叠加。比如,让我们来听一段预先录好的自己的说话声。即使使用世界上最好的录音设备和最好的播放设备,当我们听到自己的说话时仍然会觉得很奇怪。这个面对我们的声音,听起来像是一个熟悉的别人。究其原因,首先,通常情况下我们说话的发声器——声带和口腔位于耳朵的后方。而播放时,发声器——声音播放设备和我们面对面,位于耳朵的前方。其次,我们说话时是有一部分声音通过头骨的振动传到我们的鼓膜(骨传导),同时伴随着头颅和胸腔的共鸣。这些都是我们听播放设备工作时所没有的。这也就是为什么听播放设备里自己的声音,总觉得没有自己说话来得浑厚,听起来很单薄。在这里第一个原因与物理空间有关,第二个原因与我们的生理结构有关。

现在让我们再展开一些。在声音研究领域里有一个“鸡尾酒效益”,指的是在酒会上虽然环境嘈杂,但你仍然可以和同伴对话聊天。因为当我们面对面的时候,彼此的视觉落在了对方的身上,这就帮助我们把听觉焦点也落在对方身上。我们的听觉通过视觉的“帮助”把对方的声音从整个“声音流”里分离出来。当实在无法听清时,我们会下意识地去看对方的嘴,通过对方的嘴型来帮助我们听清。由此可见,视觉对听觉所进行的分析判断起着重要的作用。因此,当我们研究讨论周围的声音现象及人类的听觉感知时,会发现其他感知系统也参与其中。

也许我们可以存在于一个没有光的空间里,理论上完全可以做到,但我们无法存在于一个没有声音的空间中,因为吊诡的是我们自身就是一个发声体。

声音无时不在,无地不在。

它以最为隐秘的方式与我们相伴。

 

(以上为节选,全文请见《艺术世界》2012年3月刊 261期)

» 返回文章列表
我来说些什么
  昵称*
  邮件*
  主页
  验证码*

首页 | 关于我们 | 读图 | 订阅 | 广告及活动合作 | 活动 | 零食 | 联系我们

This site uses JTBC.