N几年前,我坐在大学的数学物理课上,我的教授给我讲了一个让我大吃一惊的想法。我认为,毫不夸张地说,这是应用最广泛的数学发现之一,其应用范围从光学到量子物理、射电天文学、MP3和JPEG压缩、x射线晶体学、语音识别,以及PET或MRI扫描。这个数学工具被命名为傅里叶变换它甚至被詹姆斯·沃森和弗朗西斯·克里克利用罗莎琳德·富兰克林产生的x射线图来解码DNA的双螺旋结构。(克里克是傅里叶变换方面的专家,他开玩笑说要写一篇题为《观鸟者的傅里叶变换》的论文,向狂热的观鸟者沃森解释数学原理。)
你可能每天都在使用傅里叶思想的后代,无论是播放MP3、浏览网页、问Siri问题,还是收听广播电台。(顺便说一句,傅里叶不是懒虫。除了在理论物理和数学方面的工作,他还第一个发现温室效应的人[PDF]。)
那么傅里叶的发现是什么,为什么有用呢?想象一下在钢琴上弹奏一个音符。当你按下钢琴键时,锤子会敲击一根弦,弦以一定的固定频率(a音每秒440次)来回振动。当琴弦振动时,它周围的空气分子来回弹跳,产生一种我们称之为声音的振动空气分子波。如果你能观察空气进行这种周期性的舞蹈,你会发现一条平滑的,起伏的,不断重复的曲线,这叫做正弦波,或正弦波。(澄清:在钢琴键的例子中,确实会产生不止一个正弦波。一个真正的钢琴音符的丰富性来自于许多柔和的泛音,除了主要的正弦波产生。一个钢琴音符可以近似作为正弦波,但音叉是一个更合适的例子,是一种声音好吧-近似为一个正弦信号)
现在,不是单键,而是三个键一起演奏和弦。由此产生的声波并不漂亮——看起来就像一团复杂的混乱。但在这混乱的声波中隐藏着一个简单的图案。毕竟,和弦只是三个键敲在一起,所以产生的杂乱声波实际上只是三个音符(或正弦波)的总和。
傅立叶的见解是,这不仅仅是和弦的一个特殊性质,更普遍地适用于任何类型的重复波,无论是方形、圆形、弯曲、三角形,等等。傅里叶变换就像一个数学棱镜,你输入一个波,它会吐出该波的成分——音符(或正弦波),当这些音符加在一起时,将重建该波。
如果这听起来有点抽象,这里有一些不同的方式来可视化傅立叶的技巧。第一个是从卢卡斯·巴博索萨他自愿抽出时间来制作维基百科的令人难以置信的数学和科学动画在那里,他被称为“卢卡斯vb”。
让我们取一个正方形的波,让它穿过傅里叶棱镜,看看另一边出来的是什么。
在这些图像中(点击维基百科,看看它的动画),红色方波被蒸馏成一组纯音符(蓝色正弦波)。把这些蓝色波浪想象成红色波浪的数学成分列表。按此类推,,傅里叶变换是一个秘诀——它精确地告诉你需要将多少音符混合在一起来重建原始的波.动画中的垂直蓝线基本上是一个图表,代表每个音符的量。
这是另一种思考方式, 由...提供马修亨德森他是剑桥大学的博士生创造充满数学好奇心的动画GIF. Matthen用圆代替正弦波解释了Fourier的技巧。这涉及一组不同尺寸的圆圈,每个圆圈以更大的圆圈的边缘为中心。然后圆圈开始旋转,大圆圈摆动较小的圆圈,而较小的圆圈比大的旋转更快。如果在最小的圆圈上追踪一个点的运动,则可以重建任何形状的波浪,如动画所示还有下面的蒸馏器。再一次,傅里叶变换告诉你如何构建波:哪个圆圈,以什么速度运动。
如果你是够了玩了呼吸描记器,您可能对使用轮中轮来跟踪复杂模式的想法很熟悉。这是同一动画的交互式版本由lucasvb创建的,您可以在那里乱画并改变圆圈的大小。
总而言之,傅里叶变换告诉你每个成分(正弦波或圆)对整个波的贡献有多大。这就是为什么傅里叶的技巧是有用的。想象一下你在和朋友通电话你想让他们画一个方波。要做到这一点,最繁琐的方法就是读出一长串数字,这些数字代表了波在每个时刻的高度。有了这些数字,你的朋友就可以耐心地把原来的波浪缝在一起。这基本上就是像WAV文件这样的旧音频格式的工作原理。但是如果你的朋友知道傅里叶的技巧,你可以做一些非常巧妙的事情:你可以告诉他们一些数字——上图中不同圆圈的大小。然后,他们可以利用这张圆图来重建原始的波。
这不是什么晦涩的数学把戏。傅里叶变换几乎出现在波的任何地方。无处不在的MP3格式使用了一种变体的傅立叶技巧来实现对之前的WAV(发音为“wave”)文件的巨大压缩。MP3把一首歌分成几段。对于每一个音频片段,傅里叶的技巧将音频降到它的成分音符,然后存储在原始波的位置。傅里叶变换还能告诉你每个音符对歌曲的贡献有多大,这样你就能知道哪些是最重要的。真正的高音并不是那么重要(我们的耳朵几乎听不到它们),所以mp3把它们扔掉,导致额外的数据压缩。音响发烧友不喜欢mp3就是因为这个原因——它不是无损音频格式,他们声称自己能听出区别。
这也是智能手机应用Shazam如何识别歌曲.它将音乐分成块,然后使用傅里叶的技巧来弄清楚构成每个块的成分指示。然后,它搜索数据库以查看Notes的“指纹”是否与他们在文件上的歌曲中匹配。语音识别使用相同的傅立叶指纹想法,将语音中的音符与已知的单词列表中的音符进行比较。
你甚至可以对图像使用傅里叶技巧。这是一个很棒的视频这说明了如何用圆圈画荷马·辛普森的脸。在线百科全书Wolfram Alpha使用了类似的想法画着名人的脸.这似乎似乎是您为一个非常讨厌的鸡尾酒会保留的诀窍,但它也用于将图像压缩为JPEG文件。在Microsoft Paint的旧天内,图像保存在位图(BMP)文件中,该文件是编码每个单个像素的颜色的长度列表。JPEG是图像的MP3。要构建JPEG,请先将图像块成8个像素的微小正方形。对于每个块,您使用相同的圆思想来重建Homer Simpson的脸部以重建图像的这一部分。就像MP3一样扔掉真正的高音,JPEG扔掉了真正的圆圈。结果是文件大小的巨大减少,质量较小,这是一个导致视觉在线世界的洞察力,我们都爱(并且最终给了我们猫GIF)。
傅里叶的技巧如何在科学中使用?我拨打了Twitter的呼吁,为科学家描述他们如何在他们的工作中使用傅里叶的想法。反应令我震惊。回应的科学家正在使用傅里叶变换来研究与流体相互作用的潜水结构的振动,试图预测即将到来的地震,识别非常遥远的星系的成分,以寻找大爆炸的热遗留的新物理学,要从X射线衍射图案中揭示蛋白质的结构,分析NASA的数字信号,研究乐器的声学,改进水循环的模型,寻找脉冲星(旋转中子恒星),并了解使用核磁共振的分子结构。傅里叶变换甚至被用于通过解密涂料中的化学物质来识别假冒杰克逊波洛克涂料。
唷!对于一个小小的数学技巧来说,这是一笔不小的遗产。
Aatish Bhatia是最近在普林斯顿大学把科学和工程带给更广泛的观众。他是获奖的科学博客的作者经验主义的热情在Twitter上的账号是@aatishb.








