Emoji,能成为一种语言吗?

😀🤔➡️🗣️❓

Emoji,能成为一种语言吗?
Photo by Domingo Alvarez E / Unsplash

原文:The Emoji Tongue|Keith Houston|Longreads|2025.07.01


2015年,牛津英语词典的编辑们,对表情符号这一新兴现象作出了前所未有的肯定。那一年,这部历史悠久的权威词典,将“喜极而泣”表情(😂)——至今仍是全球最受欢迎的 emoji——评为年度词汇,力压“广告屏蔽器”、“脱欧”、“伐木潮男”、“潮爆(on fleek)”和“分享经济”等热门新词。OED 以如此方式为 emoji 抬轿,足够令人惊讶,更激发了一个问题:如果😂算作一个词,那 emoji 是否可以称为一种语言?

😜 😜 😜

在此引用辞典条目似乎太过陈词滥调,但在本例却恰如其分。作为全球最大最古老的英语词典,OED 的核心关切是书面语言,而它又敢于把一个 emoji 评为“年度词汇”。对于“语言”一词,OED 给出的定义是:

“人类交流的方法,可以口头或书面表现,由词汇以有结构、有约定俗成的方式组合而成。”

那么,语言是人类交流,口头或书面,包含词汇,这些词汇需以规则、共识的方式结合起来。 emoji 显然满足第一条。自 emoji 诞生二十余年后,如今我们用它们进行沟通已毫不夸张。同样,如果 emoji 属于口头或书面语言,那它必然是书面语言。emoji 生而为图形符号,除了笨拙的 Unicode 名称外,并没有直接的口头对应。最后,emoji 能否成为“以结构化和常规方式使用的词语”?这点就没那么明朗了。书面语言的规则与规范,通常体现在正字法(orthography)和语法。前者关乎文字的书写与拼写,后者规范词语如何组合成可理解的短语和句子。而 emoji,二者皆无。

😜 😜 😜

如果我们试图想象 emoji 的正字法,可以说,每个 emoji 都是一个独立的“词”,其意义由名字定义,“拼写”则由外观决定。但这种简化终究有限。比如,PISTOL(🔫)到底表示“水枪”、“手枪”,还是由于没有其他枪械 emoji,只能泛指“枪”?旧版 PISTOL emoji 画得像真枪,和常见的水枪(🔫)外观相同吗?BILLIARDS,通常画作 🎱,究竟指的是台球运动(实际上并不用 8 球),还是单纯的 8 号球,或泛指所有台球、桌球、斯诺克用球?

这个问题在 Unicode 创立之初就被有意无意地回避了。在《Unicode 88》中,Joe Becker 曾宣称,每个字符不应对应具体字形或符号,而只应代表其统一的底层概念。换句话说,与其为各种“A”——罗马体(A)、斜体(A)、哥特体(𝕬)、草书体(𝒜)——分别编码,不如只收录一个“资本 A”。A 的具体外观应由所用字体决定。斜体的 A,因为处在斜体字体中才是斜体;哥特体亦然。

对于 emoji,这意味着不同厂商无需就 emoji 的外观达成共识。从技术角度讲,Unicode 的 emoji 只是一组名称和推荐但非强制的视觉表现。厂商可以随意“拼写”这个符号。我们已经见过苹果的🔫、三星的🎌、谷歌的💛 在不同设备上表现迥异,这些并非孤例。更进一步,正字法还涉及词与词之间的排列顺序。比如,我想表达“我 😡,用🔫喷你 😨”,是应该从左到右(😡🔫😨),如同拉丁字母语言的习惯,还是应该顺着水枪方向从右到左(😨🔫😡)?同样,我们该如何区分 emoji 句子的结尾与下一句的起始?用空格、用 🔚、还是换行?到现在,这些都没有统一规范。

😜 😜 😜

更令人困惑的是 emoji 的“语法”。多个 emoji 如何组合出特定意义?在“😨🔫😡”里,🔫 一定是动词而非名词吗?如果是动词,是现在时、将来时还是过去完成时?德语使用者表达同样含义时,会不会因为德语的“动词-宾语”语序而排列成😨🔫😡?和正字法类似,这些问题仍无定论。但不同的是,关于 emoji 的语法,我们已看到一些萌芽。

以 PISTOL emoji 为例,Emojipedia 资深 emoji 词典编纂 Jane Solomon 发现,🔫 更常朝向其它 emoji(尤其是面部表情),而非背对。这意味着 PISTOL 不仅有“方向性”,且更像动词而非名词。它更像是在主动“射击”别的 emoji,而不仅是个静态的枪图。

(有意思的是,写作本文时最新的 emoji 更新,允许部分 emoji 可以“翻转”方向,但 PISTOL 不在其中,也许是 Unicode 不愿让“指向谁被射击”变得更容易。)

除此之外,研究者 Susan C. Herring 和 Jing Ge 发现,在新浪微博上,emoji 的组合似乎遵循某些基本语法规则。在 2020 年的论文《Emoji 序列有偏好的词序吗?》中,Herring 和 Ge 把三百组 emoji 序列翻译成文字,发现大多数都能对应到主语(“我”)、动词(“爱”)、宾语(“你”)。更有趣的是,尽管汉语和英语一样采用主谓宾顺序(“我爱你”),但微博用户偏爱“宾动主”(“你爱我”)的 emoji 排列。这个简单而脆弱的 emoji 语法,与它所处的语言环境并不一致。

其它研究也有类似发现。但无论是 Solomon、Herring、Ge 还是同行,大家都谨慎地认为 emoji 还谈不上是一种语言。即便存在某些语法规则,它们也是隐含的、有限的、多变的,而非普遍适用。可即便如此,还是有不少人执着地试图让 emoji 成为一种“真正的语言”,哪怕学界并不买账。

😜 😜 😜

其中最著名的尝试,要追溯到 2009 年 9 月。哲学与计算机科学毕业生 Fred Benenson 发起 Kickstarter 众筹,要把赫尔曼·梅尔维尔的经典小说《白鲸》翻译成 emoji 版。他的目标是 3,500 美元,最终获得 3,676 美元和 83 位支持者,emoji 版《白鲸》(Emoji Dick; or, 🐳)正式出版。Benenson 解释:

“书中约一万句原文,每句都由亚马逊机械土耳其工(Amazon Mechanical Turk)译者翻译三遍,再由另一组译者投票,选出最受欢迎的一版收录。”

因此,Emoji Dick 的与众不同,既在于 emoji 本身,也在于其众包生产方式。Amazon Mechanical Turk 是将小型任务分发给全球网民,由人工返工的极致模式。Benenson 用机械土耳其工,让《白鲸》著名的开头句——“Call me Ishmael”——变成了“☎︎👱‍♂️👌⛵️🐳”。出于对这种“意会式”翻译的自嘲,每句 emoji 后面都附有原文。例如:

☎︎👱‍♂️👌⛵️🐳.
Call me Ishmael.

🎰🈁🚤
若干年前——具体多少年无关紧要——我身无分文,心无牵挂,便想出海漂泊,看看这水域的世界。

5️⃣❌👃💹💪🏼🌻
这就是我用来驱散郁气、调节气血的方式。

几年后发表的一篇论文对 Emoji Dick 提出一个尖锐的问题:“这些 emoji 能反向翻译回英文吗?” 答案是:“除非你把《白鲸》倒背如流,否则很难还原原文。”

尽管译文质量参差且基本只能“单向解码”,Emoji Dick 仍然成为美国国会图书馆首部将 Amazon Mechanical Turk 署为作者的书。Benenson 的成功,哪怕翻译方法饱受质疑,也激发了更多 emoji 版名著的诞生。2015 年,设计师 Joe Hale 还将《爱丽丝梦游仙境》和《彼得潘》翻译成 emoji。

Emoji Dick 让艺术网站 Hyperallergic 的 Becca Rothfeld 不禁发问:“emoji 是一种语言吗?”然而,这种问题总逃不过 Betteridge 标题法则:“标题里问的问题,答案大多是否定的。”即便 Benenson 和 Hale 努力“创造” emoji 语言,后者还声称可以“逆向翻译”回原文,emoji 依然缺乏作为真正语言所需的普遍共识与规则。我们还未实现“结构化和常规使用” emoji,但或许终有一天会实现。

😜 😜 😜

在宣布 😂 为年度词汇的新闻稿中,牛津词典社长 Casper Grathwohl 评论道:

“你可以看到,传统字母体系已难以满足 21 世纪快节奏、以视觉为主的交流需求。象形文字般的 emoji 介入填补了这个空白——它灵活、即时,能传达丰富的语气。”

Grathwohl 用了一个有趣的角度:如果 emoji 还算不上独立的语言,它是否可以看作一种“书写体系”(script)?emoji 是否是口语语言的书写形式?

乍一看,emoji 似乎可以归入楔形文字、象形文字或汉字这样的书写体系。毕竟,它们都发端于对物体的图画化表达。但仅仅是图像的集合,还不足以称为书写体系,因为这些体系都是已有口语的可视表达(分别对应阿卡德语、古埃及语和上古汉语),而 emoji 目前并没有任何口语对应。你可以把收到的信息里的 emoji 读出来(“我爱你,亲吻表情,爱心表情,拥抱表情”),但实际上你只是在描述一串图片,这些并不构成句子的语法结构。就像你不会把埃菲尔铁塔的照片当作书面语法的一部分一样。

当然,有些书写体系后来超越了原有语言。比如拉丁字母,如今用于全球数百种语言。有些直接由拉丁口语衍生而来,比如罗曼语族;有些则是后期强行嫁接,比如土耳其语。类似地,汉字也被应用到日本和韩国,虽不无争议。因此,可以想象,emoji 也许有一天能像这些书写体系一样,被“嫁接”到英语、日语等多种语言中,成为其书写工具。😊 可以代表“微笑”,🚗 就是“汽车”。

emoji 还有一点和拉丁字母相似:同一串符号在不同语言中有不同含义,一些 emoji 在不同文化中也有不同解释。例如在日本,🙏 代表“感谢”而非“祈祷”或“击掌”;“便便”(💩)与“幸运”在日语中谐音,💩 也就带有好运的意思;♨️ 并非热菜标志,而是地图上的温泉符号。不只是日本,不同国家里,💅 有更露骨的性暗示;大拇指(👍)和“OK”手势(👌)在某些地方都是粗鲁的动作,而👌 甚至还曾被极右翼当作白人至上符号,有时则单纯代表“零”或“洞”。

即便在各地含义大致一致时,细微的外观差异也会带来巨大影响。比如在中国,许多常见笑脸(🙂)因双眼无神,显得讽刺或冷漠,而 😁 和 😄 的灵动眼神则更为友善。

在这些方面,emoji 和其他书写体系一样变幻莫测。然而,许多体系——尤其是字母表——还具备 emoji 所不具备的关键属性:符号性(symbolic)。

历史上,书写体系往往会进化。楔形文字逐步脱离表意,成为音节文字;埃及象形文字最终诞生了真正的字母表,包括拉丁字母。在这个过程中,符号与原物体的联系逐渐消失,图形仅仅成为抽象符号,不再描摹具体事物。

这正是 emoji 作为书写体系的根本障碍。单个 emoji 虽有多种解释,但基本都紧贴所描绘事物本身。🐕 就是狗,最多延伸为“狗”的声音。而 emoji 更像是图像化的符号(iconic),不是抽象符号(symbolic),它们只能表达图片所指之物、动作或其本地语音。你没法用 emoji 字母表造出任意词句,就像用交通标志或几何图形拼写英语或日语一样——这样的“emoji 拼音表”现在并不存在,也没有现实可能。

😜 😜 😜

第一击:emoji 不是语言。第二击:emoji 不是书写体系。但 emoji 缺乏连贯性、结构性、甚至明确定义的“用处”,却丝毫不妨碍它渗透进网络世界的每个角落。也许,没必要等到第三击。

1964 年东京奥运会率先启用指引性图标。十年后,美国平面艺术学会为交通部制作了一组类似图标,用于机场等交通枢纽。45 年过去,这些 DOT 图标依然沿用,并被写进 ISO 标准。事实证明,无论它是否“成体系”,一幅简单的人、动作或物品的图像,都是高效的沟通方式。

在这一脉络下,emoji 其实和这些图标是一脉相承。但 emoji 和它们之间,仍有关键区别——emoji 能和普通文本无缝混用。DOT 机场图标和东京奥运会的路标,原本就生活在“无字世界”,靠直观图像跨越语言隔阂。而 emoji 往往被嵌入文字,对书面语言进行意料之外的补充与创造。

举个例子,流行天后 Cher。语言学家、数据科学家 Tyler Schnoebelen 发现,Cher 不仅 emoji 用得比一般推特用户多,且极善于将其“拟制”为正式语法角色。她 2017 年 4 月的一条推文,表达了对刚上任美国总统特朗普的鄙视:

🚽S SUCH A🔥IDIOT‼️HES MEANT 2
GIVE US STRENGTH,HOPE,OPTIMISM.

HES MEANT 2🐝CALM,STRONG,
HONEST,LEADER,INSTEAD OF
SELF‑AGGRANDIZING,LYING,DOLT🤡

这条推文的 emoji 层出不穷。

最妙的是 🐝。Cher 用它不是为了“蜜蜂”、“昆虫”、“叮咬”等含义,而仅仅是为了英文 bee 的发音。这是一种“画谜”(rebus):用图形代表词语的部分或全部音节。语言学讲师 Philip Sergeant 早在同年就在 Strong Language 博客上解释过 emoji 画谜,比如:

👐⚓️ 是 rebus:双手代表 W,加在 anchor 前,凑成单词 wanker(蠢货)。

他还分析了“cockwomble”(奇葩、二货):*

🐓🐹 就是“词对译”(calque):用 emoji 直接拼凑成英语单词(尽管 hamster 代替 womble,属于诗意创造)。

于是 emoji 既可忠于图像本义,也能跳脱为“拼音部件”:👐 除了“爵士手”或“拥抱”,还能被解读为字母 W;🐓 可以是“公鸡”,也可代指“cock”的发音。⚓️ 既指“锚”,又代表“anchor”的音。正是这种双重解码,让楔形文字等象形体系最终演化成音节文字。emoji或许也会走出类似的道路,终成一种新书写体系。

Cher 的推文不仅包含 emoji 画谜(这种用法其实并不多见),还有词对译(🔥 代表“flaming”),有隐喻(🚽 代表特朗普),最后以 🤡 作“情感句号”,表达对总统的轻蔑。Schnoebelen 说:“专家公认 Cher 是 emoji 女王,众望所归。”

推特之外,美国方言学会年度词汇大赛也收录了更多 emoji 双关和隐喻用法。传真机(📠)代表“facts(事实)”;🐐 即“GOAT”,即“Greatest Of All Time”;“im🍑” 代表“impeach(弹劾)”。💀 代表“笑死了”,🫠 不是字面融化,而是极度尴尬;🚩 用来警告“有毒行为”远多于代表实际红旗。2022 年一项调查显示,大多数用户用 emoji 时都“反向解读”其原意。

emoji 双关有时还能跨越多种语言。2018 年,中国#MeToo 运动在微博遭遇封号和标签屏蔽,支持者便巧用“米兔”或 emoji“🍚🐰”作为暗号——普通话“米兔”(mǐ tù)发音恰似“me too”。

😜 😜 😜

emoji 与书面语的关系远不止词语替换。如今 emoji 甚至成为标点符号等语言部件的替代品。Cher 用 🤡 作句号,就是一例——这种 emoji 既替代句点或感叹号,也传达了更丰富的情绪。Emojipedia 词典编纂 Jane Solomon 还注意到,Cher 喜欢用 emoji“标点”,比如❗️、‼️、⁉️、❓,甚至花哨的❣️。此外,用 💋、😘 作结,表示亲吻;用 🤔 表示怀疑或疑问;🙃 可以表达“尴尬的忧伤”、“顽皮”,甚至是反讽。还有 emoji 被用作粗体、斜体、间距,比如“ratchet clap”手势,CLAPPING HANDS SIGN 用来 👏 强调 👏 每 👏 一个 👏 词 👏。这是把中世纪僧侣发明的“单词空格”,带入智能手机时代。还有 ✌️air quotes✌️,甚至 ⚠️警告⚠️、🚨紧急🚨、✨欣赏✨、🌹告白🌹等“语义护栏”用法。

😜 😜 😜

质疑者或许会问:emoji 这么多玩法,真的有意义吗?动情的作家自然能说“我爱你”,何必加上🌹emoji🌹?带🤔的疑问句,比普通问号更有效吗?加了 👏 真的能让观点更有力吗?

语言学家 Gretchen McCulloch 和 Lauren Gawne 提供了答案。在 2019 年的论文《Emoji as Digital Gestures》中,她们论证 emoji 是网络的“肢体语言”。多数 emoji 是为了强化文字的含义,emoji 所有上述用法——隐喻、标点、强调甚至纯图片——都为我们多开一条信息通道,让表达更具情绪、细节和弹性。换言之,emoji 是文字的有力伴侣,为平淡的字母、数字和标点添上了色彩,甚至偶尔“逆袭”主导全局。

emoji 并非一种语言,这一点毋庸置疑。它们是比语言本身更有趣、更具颠覆性的东西——是文字世界里的叛军,是色彩斑斓、共生寄生的病毒,而我们对它的症状,至今仍只略知皮毛。


作者简介:Keith Houston 是一位博学多才的信息技术作家,著有《Face with Tears of Joy: A Natural History of Emoji》(2025)、《Empire of the Sum: The Rise and Reign of the Pocket Calculator》(2023)、《Shady Characters》和《The Book》等作品。他以幽默风趣且细致入微的笔触,深入探讨文字、符号与技术背后的历史与文化动因。他的文字曾刊登于《纽约时报》、《华尔街日报》、《金融时报》,并活跃于 BBC Culture、Literary Hub 等平台。Keith Houston 现居苏格兰林利思戈,与家人共同生活。


本文收录于我每周五更新的《灵感电波》第 83 期。 每期我会精选 5 篇值得一读的深度好文,用中文精编呈现。 如果你喜欢这样的内容,欢迎订阅。