
近几年,AI领域的发展如火火如荼,从图像到语音识别,再到无人⻋, 无人售货 店, 可见其应用范围十分广泛。毕竟AI的目的就是变得和人一样, 最终取代人,那么只要是现在属于人的岗位,通过AI讲故事都是可以讲得通的。资本且很愿意投资相关的项目。不过目前, 受制于硬件的发展,大多数AI项目更多停留在虚拟空间。经过对大量数据加工后,机器作出决定, 最后由人来进行最后的实施。这个AI还无法直接与真实世界交互的时代可以被称为 “近AI时代”。当机器人技术更加成熟后,AI直接通过机器人影响现实世界时, 这才是 ”AI时代“。

即使目前只是 “近AI时代”,寄宿在虚拟空间的 AI 依然为社会带来了了巨大的冲击。如今,以深度神经网络 (Deep Neraul Network) 为代表的 AI 算法已经可以有效地进行行语音识别、图像识别。如果将 AI 比做一个生物, 我们已经造出了它的视觉和听觉。AI 可以代替人类去做听和看。对此常见的应用有手机解锁, 通过监控检索特定人物,语音输入等。

相比单个人类, AI拥有更高的输入输出带宽。即使只能看和听, AI已经将很多虚拟空间中曾经的范式打破了。最令网站头痛的事情就是如何区分流量是属于真人还是机器。最常用的识别方法就是要求用户输入验证码,然而AI的视觉已经可以极为高效地将简单的字符型验证码破解 [1]。也就是说,通过这个技术,任何个人或组织可以轻易得在需要验证码的网站上创建并控制大量的账号,使网站内充斥大量僵尸号。这不但让网站浪费大量的资源在这些机器人上,更会伤害网站社区的生态环境。此外,AI 的听也可以被用于破解验证码。谷歌的ReCaptcha为了给予视力残障人士方便,设法将验证转为音频形式。然而有研究者通过谷歌的语音识别服务反将音频形式的验证码识别出来,这可谓是真正的“以彼之矛攻彼之盾” [2]

以上是 AI 对人类生产信息的分析识别,那么 AI 是否可以像人类一样生产出信息呢?最原始的图灵测试就是让人类与一个机器进行对话,看人类是否能够分辨其身份。可⻅生产信息对 AI 是一个极大的挑战。我们可以将信息分为三大类:文字,声音,图片。 如今的 AI 已经逐渐可以生成这三类信息,并让人类无法分别其由人类还是机器生成。在 OpenAI 最近的报告中,他们通过 GTP-2 model 已经可以回答问题,理解和总结内容,以及翻译内容 [3]。以下是该成果的一个样例:

In a shocking finding, scientist discovered a herd of unicorns living in a remote, previously unexplored valley, in the Andes Mountains. Even more surprising to the researchers was the fact that the unicorns spoke perfect English.
The scientist named the population, after their distinctive horn, Ovid’s Unicorn. These four-horned, silver-white unicorns were previously unknown to science.

Now, after almost two centuries, the mystery of what sparked this odd phenomenon is finally solved.

Dr. Jorge Pérez, an evolutionary biologist from the University of La Paz, and several companions, were exploring the Andes Mountains when they found a small valley, with no other animals or humans. Pérez noticed that the valley had what appeared to be a natural fountain, surrounded by two peaks of rock and silver snow.

Pérez and the others then ventured further into the valley. “By the time we reached the top of one peak, the water looked blue, with some crystals on top,” said Pérez.

Pérez and his friends were astonished to see the unicorn herd. These creatures could be seen from the air without having to move too much to see them – they were so close they could touch their horns.

While examining these bizarre creatures the scientists discovered that the creatures also spoke some fairly regular English. Pérez stated, “We can see, for example, that they have a common ‘language,’ something like a dialect or dialectic.”

Dr. Pérez believes that the unicorns may have originated in Argentina, where the animals were believed to be descendants of a lost race of people who lived there before the arrival of humans in those parts of South America.

While their origins are still unclear, some believe that perhaps the creatures were created when a human and a unicorn met each other in a time before human civilization. According to Pérez, “In South America, such incidents seem to be quite common.”

However, Pérez also pointed out that it is likely that the only way of knowing for sure if unicorns are indeed the descendants of a lost alien race is through DNA. “But they seem to be able to communicate in English quite well, which I believe is a sign of evolution, or at least a change in social organization,” said the scientist.

从这个例子,我们可以看到人类只输入了一段话,而 AI 通过它的“知识”将这段话拓展成了一个完整的故事。当我看到这个报告时,我的第一反应是:”假新闻是不是无敌了?” 再想一想,以后研究员们不就不用写论文了?(笑)只用想出创意做实验,把动机和试验结果剩下由机器来写。虽然目前这个模型还不够成熟,但是这依然讨论了未来 AI 的一种可能性。

最早为人所知的由电脑生成的语音应该是谷歌翻译后生成的语音(谷歌娘)。在 Google I/O 2018 上,Google Duplex 首次亮相。在这次发布会中,谷歌展示了使用 Google Duplex 进行餐厅预约。在演示中,用户只需告诉 Google Duplex 基本的订餐信息,Google Duplex 可以自然地和电话那头的餐厅接话员完成预约服务。同时,接话员并没有听出和他进行谈话的是机器人 [4] [5]。还有很多人尝试着用 AI 进行各种风格的音乐创作,这里就不一一列举了。

使用 AI 生成各种风格的油画或者为黑白照片上色都是非常有趣的应用,但是在这里我想介绍另外两个应用: 1) https://thispersondoesnotexist.com/; 2) Deepfake。第一个是通过对抗算法生成一个不存在的人的照片,第二个是用他人的脸替换一段视频中某个⻆色的脸。另外结合上面的文本生成和音频生成, 我们完全可以炮制任何形式的假新闻。于是这样的情形也可能存在:由不存在的记者使用不存在的音色去报道不存在的事。当这些技术更加成熟后, 我们又怎么能判断我们摄取的信息是真实可靠的呢?

为了提高效率,很多服务可以通过网络来提供。比如曾经为了确保实名,事物需要本人去办理,如今更多的是要求用户手持身份证拍照。根据以上的技术,如果我有某人的身份证信息,我就可以用 AI 生成一份有效照片,从而代替他/她?如果手持身份证的照片都无法在互联网上证明我是我的时候,我们还有什么可以被用来验证的呢?又回到多年前的一个老问题:“你永远不知道网络的那一面是人还是狗”。这一次,在虚拟空间中,我们真的将无法区分虚拟与真实的边界。

当我们模糊了虚拟和真实的边界,我首先想到的是某部科幻小说中的场景。在一个人类和机器人混合的时代,带着人类模样得机器人将人类包围,为人类提供服务,所有机器人都假装是人类。当有一天,最后一个人死了,而所有的机器人依然像人类一样继续生活。在这个”近 AI 时代“,如果我们不能处理好虚拟与现实的关系,随着技术继续进步,科幻小说中的桥段很有可能就是我们最后的结局。当我们实现 了真正的 AI ,相比于人类,拥有更高信息带宽与处理速度的 AI 又凭什么不会取代我们呢?

[1] Yet Another Text Captcha Solver: A Generative Adversarial Network Based Approach

[2] ReBreakCaptcha: Breaking Google’s ReCaptcha v2 using Google

[3] Better Language Models and Their Implications

[4] Google Duplex: A.I. Assistant Calls Local Businesses To Make Appointments

[5] Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone

Recommended Posts