R还记得一切都是“2.0”的时候吗?米歇尔·奥巴马是杰奎琳·肯尼迪·奥纳西斯的2.0版?Facebook被认为是Web 2.0的一个例子?我们都明白它的意思,它在空中或“网络空间”——另一个流行词——中徘徊了五年,直到它被“3.0”和“网络”从日常词汇的使用中取代。
语言和人一样,都有15分钟的成名时间。但有些词值得我们全神贯注,因为它们不受时尚风潮的影响。这些词是语言的组成部分,在早期人类祖先和今天之间提供了联系。寻找那些众所周知的“极度保守”的单词是许多语言学家的使命。
在语言的起源,斯坦福大学语言学家梅里特·鲁伦提出,在3万多年前的最后一次冰河时代融化之前,即1.5万年前,有一种人类使用的语言将人类分散到世界各地。
这种原始语言与今天语言的语法和句法几乎没有共同之处。这听起来不像今天说的话。鲁伦试图通过识别世界上大约6000种语言中的相关词汇,并展示它们是如何作为所有语言的支柱来重建它。
鲁伦在该领域的大多数同事彻底否定了他的理论。这种方法没有遵循传统语言学的规则。他们还反对有一个地理上统一的人类祖先群体的建议。辩论变得激烈起来。一位不愿透露姓名的学者说,在一次会议上有人“拳打脚踢”。
为什么红色在几乎所有语言中都是红色的意思
1959年,时任哈佛大学人类学研究生的保罗·凯(Paul Kay)来到塔希提岛学习岛屿生活,他预计学习当地的颜色词会很困难。他的领域长期支持一种理论。。。阅读更多
但鲁伦有他的支持者,而这场争论在15年的时间里一直处于僵局。直到一个学者不太可能从另一个领域进入。
鲁伦在该领域的大多数同事彻底否定了他的理论。
对于撞毁绝缘学术领域并完全重新定义的人来说,Mark Pagel非常突出。在英格兰南部阅读大学的进化生物学家,Pagel通过遗传测序研究人类演化和古生物学。
正如佩格尔在最近的一次采访中坚持的那样,他很偶然地卷入了原语的争论中;他只是转向语言学来更好地理解基因是如何进入和退出基因库的,他很好奇单词是否遵循相同的传播和替换模式。
乍一看,基因和单词之间似乎没有明显的联系。DNA,或者说基因复制子,是一代代传下去的,而新词总是以似乎不可预测的频率进入一种语言。你上一次的谈话中有多少是关于你的智能手机,“烤一些金发女郎”,或是一些流行歌星“叽叽喳喳”的伟大功能?我们日常的口语交流似乎不是了解我们进化历史的一扇窗户。
然而,这正是帕茨寻求展示的。他猜想了一个词的寿命可以与遗传标记类似地量化。如果高水平的黑色素1.;对于生活在炎热气候中的人群来说,黑色素的基因是必不可少的。同样,佩格尔推断,如果一个词是不可或缺的,比如“手”,它将在不同的语言中持续存在,而其原始词根几乎没有变化。
“语言是会说话的基因,能得到他们想要的东西,”他在2011年的一次TED演讲中说。
所以佩吉决定让文字自己说话。
他首先对四种现代语言——俄语、西班牙语、英语和希腊语——的当代文学语料库进行了统计分析,这些语言代表了印欧语系的四个分支,印欧语系包含87种语言。内容包括口语、历史书籍、文学、新闻媒体和音乐录音。(值得注意的是,Pagel所依赖的是传统语言学家使用的资料库。不过,他的方法很新颖。)
我们的日常口语交流可能成为了解我们进化历史的窗口,这似乎不是直觉。
佩奇没有像鲁伦所做的那样,逐字比较单词,并在该语言的句法上下文中分析它们的根结构,而是使用了一种被称为计算系统发生的统计算法来处理大量数据。
他使用了一个包含200个词汇意义的数据集,称为Swadesh基本词汇表,其中包含了最基本的意义,如数字、代词和重要的动词和名词。在所有200种意义中,经常使用的词的同源词数量最少,被替换的速度比不经常使用的词慢,因此,佩格尔推测,变化速度最慢。自大约8700年前原始印欧语起源以来,“手”一词不会有太大变化,尽管它可能在到波斯语或斯拉夫语的过程中丢失了一个元音或交换了一个辅音。
相比之下,经常被替换的单词有多个同义词。以“帽子”一词为例。在19世纪,一个流行的同义词应该是“bonnet”。在“帽子”和“bonnet”之间没有词源上的联系,因此我们说这些词被取代了。同样,佩格尔发现,像“脏”这样的概念在同一时期有九个替代品。在一段时间内,人们可能会说“肮脏”,然后认为“凌乱”最能表达他们对周围环境的不满。
Pagel在发布的文件中连接了一个单词的稳定性自然界2007年。去年四月,他在《华尔街日报》上发表了一篇文章美国国家科学院院刊(PNAS)在Word的使用频率和年龄之间显示了直接关系。Pagel和他的团队提出了一个暂定的法律,计算了现代语言每1000个单词超过一次的单词是“七到十倍,更有可能显示深深的血统。”
其中一些词有这么长的生活,他们迄今为止迄今为止近九千年的起源。Pagel开始想知道一些单词是否会达到印度欧洲语言本身的开始。
自大约8700年前原始印欧语起源以来,“手”一词不会有太大变化,尽管它可能在到波斯语或斯拉夫语的过程中丢失了一个元音或交换了一个辅音。
与Ruhlen不同,他试图通过剥离根源并通过声音和词源比较世界语言小组的复合词来证明原始语言的存在,Pagel专注于识别单词含义并开始追溯它们。
“我们的逻辑是我们实际上预测了这些词,然后发现它们的同源,”[通过统计分析] Pagel解释说。
研究小组提取了200个单词的意思,并用七种不同的欧亚原始语言构建了它们的形式表,这些原始语言总共跨越了近4000种当代语言。
他发现的是生物学和语言的惊人汇合。
鲁伦的书出版13年后语言的起源,Pagel用计算算法的工具表明,有23个单词可以追溯到15000年前,在最后一个冰河时代解冻时,第一次大规模的人类迁徙横跨欧亚大陆。
“超级超法”的词语提供了对人类祖先口头沟通的第一个概念的洞察力:
代词:你(熟悉和正式的);我;我们;这一切;那
问题:什么;谁
动词:给;听到;拉;吐痰;流动
形容词/副词:不;古老的黑色
名词:男/男;母亲手火树皮灰烬;蠕虫2.
这是一个巧合3.这个数字与人类细胞中携带遗传物质的染色体对相同。但这个类比很能说明问题——佩格尔解释说,找到一种纯粹的语言就像找到一条独特的DNA线,通过生物学将我们与我们的祖先联系起来。
这就是文字传播对人类进化如此重要的原因。佩格尔说:“从这个意义上说,单词可以模仿基因,这一事实绝对令人惊讶。”
Simon Kirby是爱丁堡大学语言进化教授,他进一步说“看语言可以看作是一个进化系统,”我们可以看到,就像基因一样,言语自私地行动。当一个词特别有用时,它就会插入对话中。它的效用使得它不太可能发生变异。
如果说目的的效用是词汇继承的组织原则,佩格尔说他和他的团队对23个极端保守的词汇中的一些感到惊讶。诸如“灰烬”、“树皮”和“蠕虫”之类的词都在这组词中。
佩格尔说:“这对我们来说真的很有趣,也很有趣。”。“我们开始与人类学家交谈,他们提醒我们,你必须意识到的一件事是,西方人不患蠕虫,但几乎所有其他人都会患。”
进化专家还指出,这可能是围坐在篝火旁关心自己健康问题的狩猎采集者的热门话题。其他出现的原始词汇“ash”和“bark”也同样如此,人类学家认为它们不仅用于生火,还被用作药物。
佩格尔指出,这项工作是最好的假设,而不是证据。通过进化生物学的经验方法进一步理解语言迁移、词源和交流,对于研究和重建古代语言及其文化具有巨大的希望。
寻找纯粹的语言,很像找到一个独特的DNA线,通过生物学将我们与我们的祖先联系起来。
“我想每个人都同意这些语言应该有亲缘关系,”约瑟夫·萨尔蒙斯说,他是威斯康星大学日耳曼语言教授,也是一名原始语言怀疑论者。“世界各地的语言之间存在着我们尚未掌握的基因关系。这些语言不太可能独立产生。”
计算和数量科学进入语言学研究,为人类进化起源的研究打开了新的大门。
还有一些学术机构正在兴起,通过语言来研究进化。爱丁堡大学的语言进化和计算中心开始将语言视为理解生物变化的新门户。
通过研究单词是如何在神经上产生的,研究人员可以将重点放在原始人类和灵长类之间最后一个共同的祖先上,据估计它们生活在大约600万年前。它们共同的声音和行为可以揭示物种之间的联系。
“我们使用比较方法试图与黑猩猩的共同祖先得出结论,”爱丁堡的基林·默里解释道。
这将导致下一步有趣的进化研究,如了解我们与灵长类动物的共同祖先。
她说:“这甚至有助于我们得出关于我们何时成为独一无二的人类的结论。”。
着名的话语表明,就像DNA就是DNA是建筑物的生物学块,有概念对于任何永远不会消失的口头沟通系统至关重要。甚至没有在Web 4.0上。








